入門 PySpark ―PythonとJupyterで活用するSpark 2エコシステム

Sparkはちょくちょく触る機会があるのですが、PySparkは使ったことがなかったので読んでみました。最近のSparkの流れを見ていてもPythonのサポートが強化されてきているので軽く押さえておきたいなと…。

入門 PySpark ―PythonとJupyterで活用するSpark 2エコシステム

入門 PySpark ―PythonとJupyterで活用するSpark 2エコシステム

Amazonのレビューではかなりの低評価ですが、レビュアーの方々の期待値とズレがあったという話で、タイトル通りPySparkの入門書としては分量も手頃かつ機械学習やグラフ処理など幅広い範囲をカバーし、Sparkの基礎も押さえた良い書籍だと思います。訳書な上に出てから1年近く経ってしまっているのでちょっと情報が古くなってしまっていたり、物足りない部分があるのは事実ですが、Spark + PySparkの概要をさらっと押さえるに良いのではないでしょうか。

PySparkの入門のつもりで購入したのですが、このくらいの浅く広くな感じでいいので、Scalaで書かれたSparkの入門書で新しいSparkのバージョンに対応した本が出るといいなぁと思ってしまいました。