自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

Data Analytics

Data Analytics

(その1) アップル引越しの需要予測の分析計画

今回から時系列データの分析に入りたいと思います。データはSIGNATE社のデータ分析コンペでダウンロード出来る、アップル引っ越しセンターの引越し実績を利用したいと思います。アップル引っ越しセンターは下記サイトになります。IT化によってコスト...
Data Analytics

(その4-10) エイムズの住宅価格をAutoML(auto-sklearn)で予測してみた

今回はauto-sklearnを試してみたいと思います。バージョンは0.14.7でまだ22年8月現在は最新版をインストール済みですので、アップグレードはしません。MacでAutoMLの環境をする方法は下記記事にまとめています。pipでインス...
Data Analytics

(その4-9) エイムズの住宅価格をAutoML(AutoGluon)で予測してみた

今回はAutoGluonというAutoMLライブラリをエイムズのデータセットで試してみます。MacでAutoMLの環境をする方法は下記記事にまとめています。pipでインストールしているのがほとんどですので、Linuxでも同じようなコードでイ...
Data Analytics

(その4-8) エイムズの住宅価格をAutoML(mljar)で予測してみた

今回はAutoMLを試してみたいと思います。AutoMLは今のところ3種類の環境を用意しているのですが本記事ではMLJARというAutoMLライブラリをエイムズのデータセットに試してみたいと思います。MacでAutoMLの環境をする方法は下...
Data Analytics

(その4-7) エイムズの住宅価格をXGBoostで予測してみた パート2

前回はデフォルト設定のXGBoostを試しました。今回はランダムサーチという手法でパラメータチューニングをしたいと思います。instead of testing every combination of hyperparameters, r...
Data Analytics

(その4-7) エイムズの住宅価格をXGBoostで予測してみた パート1

今回はXGBoostになります。SVRではグリッドサーチ、ランダムフォーレストではベイズ最適化を試しましたのでXGBoostではランダムサーチという手法でパラメータチューニングをしたいと思います。本記事ではデフォルト設定で試した結果をまとめ...
Data Analytics

(その4-6) エイムズの住宅価格をランダムフォーレストで予測してみた パート2

今回は前回の続きでランダムフォーレスト(random forest)のパラメータチューニングをベイズ最適化(Bayesian Optimization)で行いたいと思います。色々と調べている中、ベイズ最適化はグリッドサーチのように総当たりで...
Data Analytics

(その4-6) エイムズの住宅価格をランダムフォーレストで予測してみた パート1

今回はランダムフォーレスト(random forest)になります。旧ブログでも割とアクセスがあった手法になります。大学の授業や会社での勉強などでとりあえず使ってみたいという方は上から順に実行すれば動くはずですのでぜひお試しください。旧ブロ...
Data Analytics

(その4-5) エイムズの住宅価格をサポートベクター回帰(SVR)で予測してみた

今回はサポートベクター回帰(SVR)になります。サポートベクターマシーン(SVM)はよく聞きますが、SVRはSVMを回帰問題に適用したものであるようです。詳細は「Unlocking the True Power of Support Vec...
Data Analytics

(その4-4) エイムズの住宅価格をニューラルネットワークで予測してみた

今回はニューラルネットワークになります。今だとディープラーニングの方が聞いたことがある方の方が多いでしょうか?ディープラーニングはニューラルネットワークを多層化することにより高精度を出すことを可能にした手法のようです。ディープラーニング(深...