自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

mljar

Data Analytics

(その4-8) エイムズの住宅価格をAutoML(mljar)で予測してみた

今回はAutoMLを試してみたいと思います。AutoMLは今のところ3種類の環境を用意しているのですが本記事ではMLJARというAutoMLライブラリをエイムズのデータセットに試してみたいと思います。MacでAutoMLの環境をする方法は下...
Data Analytics

(その4-12) タイタニックの乗客の生存有無をAutoMLで予測してみたまとめ

タイタニックのデータセットで色々なモデルを作成してきました。精度がよかったモデルは全てAutoMLを使ったものでした。今までは欠損値処理・変数選択・特徴量エンジニアリングをした訓練データの一部を使ってモデリングをしていました。(混合行列で精...
Data Analytics

(その4-9) タイタニックの乗客の生存有無をAutoML(mljar)で予測してみた

前回はXgBoostで分類モデルを作成しました。暫定1位はロジスティック回帰CVで作成してモデルで、Kaggleの精度は0.76794です。今回はAutoMLを試してみようと思います。色々なモデルを作成して一番良い精度のものを探索してくれる...
Python

(MLJAR) Pythonで3つのAutoML環境を用意してみた

AutoMLは機械学習のプロセス(データ加工〜モデル作成〜ハイパーパラメータチューニング)を全て自動実行してくれるツールになります。有名なものだと、DataRobotというツールがありますが有償になります。Pythonで無償で使えるものだと...