機械学習

PredictionIOで使用するSpark等のバージョンを変更する

PredictionIOはデフォルトでは以下のバージョンを使用します。 Scala 2.10.6 Spark 1.6.3 Hadoop 2.6.5 Elasticsearch 1.7.6 Scalaのバージョンはともかく、Spark(ストレージにElasticsearchを使用する場合はElasticsearchも)のバージョンがかなり古いのが…

Scala製の機械学習サーバApache PredictionIOを使ってみよう

PredictionIOはSparkを中心としたJVMベースの機械学習アプリケーションを開発・運用するために必要なミドルウェアやフレームワークなどを統合的に提供するもので、開発者はPredictionIOのフレームワークに従ってエンジンを作成することで、機械学習を使用し…

Apache PredictionIOのコミッタになりました

Apache PredictionIOはSpark MLlibを中心に、学習データやモデルデータを格納するためのストレージ、機械学習を利用したアプリケーションを定型的に開発するためのフレームワーク、作成したアプリケーションをWebサービスとしてデプロイする機能などを提供す…

IPython Notebookを使ってみる

scikit-learnによる機械学習ですが、チュートリアルを程度であればPython標準のインタラクティブシェルでもよいのですが、データセットやパラメータを変えながらいろいろ試したいという場合があります。そこでIPython Notebookというものを試してみます。こ…

scikit-learnによる機械学習入門

最近社内でscikit-learnを使った機械学習の勉強会が開催されています。scikit-learnというのはPythonで実装された機械学習ライブラリで、MahoutやMLlibなどと比べると非常に手軽に試すことができるのが特長です。実装されているアルゴリズムも豊富で、プロト…