自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

2022-06

Data Analytics

(随時更新) 企業発信のデータ分析ブログを読んでまとめてみた

いつも必要な知識だけ検索して理解しているだけでしたので、今後のためにもデータ分析に関することが書かれているブログをまとめておこうと思います。(そこそこ更新があるブログに限定)企業でどのような分析が行われているか、もしくはどのようなテクノロジ...
Data Analytics

(その1) エイムズの住宅価格のデータセットの分析計画

住宅価格のデータセットは他に有名なものだとボストンの住宅価格のデータセットがあります。旧ブログで取り上げているのでご一緒にご確認ください。今回はエイムズの住宅価格のデータセットを分析していこうと思います。データマイニングプロセスについてこん...
Python

Google Colaboratoryについて調べてみた

今回はウェブ上で分析作業が出来てしまうGoogle社のColaboratoryというサービスを見てみます。Colab(正式名称「Colaboratory」)では、ブラウザ上で Python を記述、実行できます。以下の機能を使用できます。・...
Job

【企業分析】HJホールディングス株式会社のデータアナリストの求人を考察してみた

今回は「HJホールディングス株式会社」という企業の採用情報を見てみます。記載内容はすべて、22年6月時点の情報です。企業のミッションかけがえのない時間を届けHappyな世界をつくる映像作品を顧客に届けることによって家族の団欒であったり、映画...
Job

【企業分析】株式会社タイミーのデータ分析の求人を考察してみた

今回は以前から求人をよく見ていた「株式会社タイミー」という企業の採用情報を見てみます。記載内容はすべて、22年6月時点の情報です。企業のミッション「働く」を通じて人生の可能性を広げるインフラをつくる働くということに焦点を当てたミッションにな...
Job

【企業分析】株式会社サマリーのデータ分析の求人を考察してみた

データ分析の求人を見つけてはもし就職したらどんなことが出来そうか勝手に考えてみるシリーズです。今回はFacebookの広告で見つけた「株式会社サマリー」という企業の採用情報を見てみます。記載内容はすべて、22年6月時点の情報です。企業のミッ...
Data Analytics

(その4-12) タイタニックの乗客の生存有無をAutoMLで予測してみたまとめ

タイタニックのデータセットで色々なモデルを作成してきました。精度がよかったモデルは全てAutoMLを使ったものでした。今までは欠損値処理・変数選択・特徴量エンジニアリングをした訓練データの一部を使ってモデリングをしていました。(混合行列で精...
Data Analytics

(その4-11) タイタニックの乗客の生存有無をAutoML(auto-sklearn)で予測してみた

前回はAutoGluonでモデルを作成した。今回はauto-sklearnでモデルを作成しようと思います。MacでAutoMLの環境をする方法は下記記事にまとめています。pipでインストールしているのがほとんどですので、Linuxでも同じよ...
Data Analytics

(その4-10) タイタニックの乗客の生存有無をAutoML(AutoGluon)で予測してみた

前回はautomlのmljarを使って予測モデルを作成しました。精度は作成したモデルの中で1番という結果になりました。今回は違うautomlのAutoGluonを利用して結果がどうなるか確認してみようと思います。MacでAutoMLの環境を...
Data Analytics

(その4-9) タイタニックの乗客の生存有無をAutoML(mljar)で予測してみた

前回はXgBoostで分類モデルを作成しました。暫定1位はロジスティック回帰CVで作成してモデルで、Kaggleの精度は0.76794です。今回はAutoMLを試してみようと思います。色々なモデルを作成して一番良い精度のものを探索してくれる...