Data Analytics (その2-3) タイタニックのデータ俯瞰 グラフ描画 これまで表形式でタイタニックのデータの中身を俯瞰してきましたが、今回はグラフで可視化をして確認したいと思います。グラフにすることによって色の違いや棒グラフの長さの違いなどが表現できることにより情報量が増え、よりデータ理解がしやすくなると思い... 2022.03.21 Data Analytics
Data Analytics (その2-2) タイタニックのデータ俯瞰 クロス集計 データの理解の後半パートは目的変数と説明変数の関係性を中心にして集計や可視化をしていきたいと思います。今回は生存するかどうかを当てるモデルを作成するつもりなので、目的変数は生存有無フラグ(Survived)にします。分析の目的により対象変数... 2022.03.21 Data Analytics
Data Analytics (その2-1) タイタニックのデータ俯瞰 前回の記事からの続きです。今回はタイタニックのデータの中身を俯瞰しようと思います。単純にクロス集計をして表を眺めるだけでもいいのですが、ヒストグラムや散布図などで可視化してあげるとより理解しやすくなると思います。タイタニックのデータぐらいの... 2022.03.20 Data Analytics
Data Analytics (その1) タイタニックのデータセットの分析計画 ヒノマルクレオナルド・ディカプリオ主演の映画タイタニックをご覧になったことがある方はイメージがつくと思います。テレビでもよく金曜ロードショーで放映されますね。ヒノマルクは好きでもう何回も見ています。Wikipediaのタイタニックの記事を一... 2022.03.06 Data Analytics
Data Analytics データマイニングのフレームワークであるCRISP-DMとは ヒノマルクデータマイニングを教わったときにCRISP-DMが基本概念にありました。ClementineというIBMのSPSS Modelerの前身のデータイニングツールで分析キャリアを始めました。ClementineでCRISP-DMが導入... 2022.03.06 Data Analytics