Sparkはちょくちょく触る機会があるのですが、PySparkは使ったことがなかったので読んでみました。最近のSparkの流れを見ていてもPythonのサポートが強化されてきているので軽く押さえておきたいなと…。
入門 PySpark ―PythonとJupyterで活用するSpark 2エコシステム
- 作者: Tomasz Drabas,Denny Lee,Sky株式会社玉川竜司
- 出版社/メーカー: オライリージャパン
- 発売日: 2017/11/22
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (3件) を見る
Amazonのレビューではかなりの低評価ですが、レビュアーの方々の期待値とズレがあったという話で、タイトル通りPySparkの入門書としては分量も手頃かつ機械学習やグラフ処理など幅広い範囲をカバーし、Sparkの基礎も押さえた良い書籍だと思います。訳書な上に出てから1年近く経ってしまっているのでちょっと情報が古くなってしまっていたり、物足りない部分があるのは事実ですが、Spark + PySparkの概要をさらっと押さえるに良いのではないでしょうか。
PySparkの入門のつもりで購入したのですが、このくらいの浅く広くな感じでいいので、Scalaで書かれたSparkの入門書で新しいSparkのバージョンに対応した本が出るといいなぁと思ってしまいました。