Python hiveのデータをpandasに読み込んでみる ヒノマルク今回はhiveのデータをpandasのデータフレームに読み込めるようにします。hiveを使うということはかなり大きなデータを扱っていると思います。データクリーニングやサマリデータの作成はなるべくhive側でさせてからpythonに... 2022.01.28 Python
Python Pythonからimpylaでhiveを操作してみる ヒノマルクどうもヒノマルクです。今日はhiveへのアクセスになります。最近だとBigQueryに移行している企業もいるかと思いますが、まだまだ現役でゾウさんとハチさんに頑張ってもらっている企業も多いのではないでしょうか?ヒノマルクは業務上、... 2022.01.20 Python
Database [docker] cloudera quickstartを使ってhive環境を準備する方法 ヒノマルクです。BigQueryやHiveなどのデータをPythonで読み込んでいる方も多いと思います。今回はHadoop環境をお手軽に試せるclouderaのquick startイメージを使ってhiveを実行できる環境を準備しようと思い... 2021.12.19 Database