自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

hinomaruc

Python

(MLJAR) Pythonで3つのAutoML環境を用意してみた

AutoMLは機械学習のプロセス(データ加工〜モデル作成〜ハイパーパラメータチューニング)を全て自動実行してくれるツールになります。有名なものだと、DataRobotというツールがありますが有償になります。Pythonで無償で使えるものだと...
PC

Macbook Proの初期設定まとめ (分析環境編)

前回パート1として、Macの初期設定(基本編)をまとめました。パート2の本記事ではローカルで分析する環境を整えたいと思えます。将来的にはローカル環境に依存しない分析や開発環境を整えたいと思います。例えばGoogle Colaboratory...
Python

[Mac] 複数のPython仮想環境をJupyter notebook上で切り替える方法

今回は Pythonの仮想環境をvenvで作成する方法の応用版になります。jupyter notebook内で複数の仮想環境を切り替えて利用できるようにする方法をまとめました。図にすると下記のようになります。図1:メイン環境のmy-venv...
PC

Macbook Proの初期設定まとめ (基本編)

前回の記事でMacbook Pro 13インチ mid 2012を購入しメモリアップグレードとSSD換装したことをまとめました。今回はその後、新しいMacOS環境でセットアップしたことをまとめておこうと思います。1. コンピューター名の変更...
PC

Macbook pro 13インチ mid 2012をメモリ16GB・SSD240GBに換装してみた

どうもヒノマルクです。だいぶ更新がご無沙汰になってしまいました。実はパソコンをMacbook Pro 13インチ mid 2009からMacbook Pro 13インチ mid 2012にアップグレードしました。理由は分析ブログを続ける上で...
Data Analytics

(その4-8) タイタニックの乗客の生存有無をXGBoostで予測してみた

前回はRandom Forestで分類モデルを作成しました。精度はデフォルト設定のままだったのか、0.73205でした。暫定1位はロジスティック回帰CVで作成してモデルで、Kaggleの精度は0.76794です。今回はお待ちかねのXGBoo...
Data Analytics

タイタニックのモデリング用データの作成まとめ

(その3-5) タイタニックのデータセットの変数選択にてモデリング用のデータを作成し、エクスポートするコードを記載していましたが分かりずらかったので簡略しまとめました。上から順に流していけばtitanic_train.csvとtitanic...
Data Analytics

(その4-7) タイタニックの乗客の生存有無をランダムフォーレストで予測してみた

前回はナイーブベイズで分類モデルを作成しました。複数のナイーブベイズのモデルを試しましたが、CategoricalNBが0.76315でナイーブベイズのモデルの中では一番精度がよかったです。暫定1位はロジスティック回帰CVで作成してモデルで...
Data Analytics

(その4-6) タイタニックの乗客の生存有無をナイーブベイズで予測してみた

前回、ロジスティック回帰CVで76.7%の精度でした。今回はナイーブベイズを使って予測してみようと思います。The sklearn.naive_bayes module implements Naive Bayes algorithms. ...
Data Analytics

(その4-5) タイタニックの乗客の生存有無をロジスティック回帰CVで予測してみた。

前回、KNNで76.5%の精度でした。今回はロジスティック回帰CVを使って予測してみようと思います。(その4-2) タイタニックの乗客の生存有無をロジスティック回帰分析で予測してみたと似ていますが今回はロジスティック回帰CVを使ってみます。...