自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

Pythonでの分析用ライブラリであるpandasとは何か

Python
Python

どうもhinomarucです。

記念すべき新ブログでの分析系記事の1番目です。
仕事をしていてもしばらく使わなかったら忘れがちなpandasの使い方を記事化しようとかなと思います。

スポンサーリンク

pandasとは何か

pandasとはPythonのライブラリです。
データを格納し加工したり中身を俯瞰するのに利用されています。

データ分析をPythonでする上で必要不可欠なツールの一つになるかと思います。

カラムを選択したり絞ったりする処理など
よく利用する処理は自分の知識を整理する意味も込めてまとめておこうと思いこの記事を作成しています。

バージョンによって非推奨になる機能であったり、
逆に追加されて便利になる機能もあるのでどのバージョンのpandasを利用しているかは当ブログではきちんと記載しておこうと思います。

スポンサーリンク

pandasを利用する準備

公式ページにインストール方法が記載されています。個人的にAnacondaは従業員が200人以上の企業が利用する場合、商用ライセンスが必要になった[1]ため、pipを使うようにしています。(教育機関などは当てはまらない)

pandasをインストールするコマンド

pip install pandas
スポンサーリンク

Pythonの分析環境

Pandasを利用するためにはPythonを動かす環境が必要です。
Pythonというプログラミング環境の中でpandasというツールが動いているイメージです。

PythonはMacやLinux環境を使っていればデフォルトでも入っていると思います。
Windowsは別途Pythonをインストールしないといけなかったかもしれません。

環境を準備するのが大変な方は、ウェブベースでPythonが実行可能な
ColaboratoryというGoogleが提供しているサービスをおすすめします。インターネットに繋がりさえすれば上記リンクにアクセスして利用できるので、WindowsなのかMacなのかなど気にする必要はありません。

21年11月20日現在、無料で利用できるので本当にすばらしいサービスです。

しかし、Colaboratoryは外部に接続できるインターネット環境が必要であったり、連続使用時間に制限があったりする(長時間かかる処理を流し続けると処理をストップされる)ので、利用用途が合わない方はお手持ちのパソコンにPython環境を準備した方がよいと思います。

Python3系(Python3.6とかPython3.7など)が利用できる方は、venvという仮想環境作成ライブラリがデフォルトで使用できますので、ぜひ利用してみてください。
(使いたいライブラリによっては、pandasのバージョンが固定になっていることもあるので、利用に合わせた仮想環境を作成した方が使い勝手がよいです。)

仮想環境の作成の仕方はまた別途記事に書こうと思います。

スポンサーリンク

まとめ

今回はpandasとpandasを利用するためのpython環境の準備の仕方について説明しました。次回はpandasの使い方を少しずつ小分けにして記事化していこうと思います。

スポンサーリンク

References

[1] https://www.anaconda.com/blog/anaconda-commercial-edition-faq

タイトルとURLをコピーしました