自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

impyla

Python

hiveのデータをpandasに読み込んでみる

ヒノマルク今回はhiveのデータをpandasのデータフレームに読み込めるようにします。hiveを使うということはかなり大きなデータを扱っていると思います。データクリーニングやサマリデータの作成はなるべくhive側でさせてからpythonに...
Python

Pythonからimpylaでhiveを操作してみる

ヒノマルクどうもヒノマルクです。今日はhiveへのアクセスになります。最近だとBigQueryに移行している企業もいるかと思いますが、まだまだ現役でゾウさんとハチさんに頑張ってもらっている企業も多いのではないでしょうか?ヒノマルクは業務上、...