これから勉強していきたいと思うもの

その数学が戦略を決める

その数学が戦略を決める


「その数学が戦略を決める」大学院生時代に図書館で借りて読んだ本です。

  • クレジットカードの使用履歴から将来離婚する確率を算出
  • 野球選手の有望性を判断するために統計的なデータを利用

などなど膨大なデータに対して統計・機械学習をつかってできることの可能性が説明されています。
読み物としてとても面白かったです。

この本を読んで以来、膨大なデータから有益な情報を取り出したり、
回帰分析を行って思わぬ関連性をみつけてビジネスに役立てるような
仕事をしてみたいなと思っていました。
そう思ったときには就活を終えていたのですが。。

運よく入社した会社で、データマイングやレコメンデーションを行う部署に入ることができました。
部署に入ってから、ほぼ知識0の状態であることを実感する毎日です。

そんな中でいろんなことを考えた結果、今後はこんなことを勉強していきたいなと思っています。


Hadoopの勉強
データサイズはテラバイトからペタバイトの時代です。
MySQLなどの既存のDBMSではとてもカバーできるサイズではありません。
そこで利用されているのがHadoopです。
Hadoopに関しては以下の本を勉強していきたいなと思っています。

Hadoop徹底入門

Hadoop徹底入門


そして余裕があればゾウさん本も
Hadoop: The Definitive Guide

Hadoop: The Definitive Guide

さらに余裕があればMapReduceの論文も読みたいと思っています。
MapReduce

Perlの勉強
Perlも業務で使う重要な言語です。

ラクダ本を読んでいきたい。

Learning Perl

Learning Perl


Intermediate Perl

Intermediate Perl

Javaの勉強
前述した通り、Hadoopの処理部分の記述はJavaです。
大学時代から利用していましたが、復習をかねて勉強をしたいなと思っています。

Effective Java (Java Series)

Effective Java (Java Series)

統計・機械学習の勉強
この辺りの知識が全然足りないので勉強しないと。。

まずはペンギン本で触りを

集合知プログラミング

集合知プログラミング

おしゃれstatisticsにも参加したいのでこの本を読んでみます。

Statistics

Statistics

その他参考になりそうなページ
BLOG::broomie.net: 機械学習の勉強を始めるには
http://d.hatena.ne.jp/echizen_tm/20110209/1297272686:title=

プログラミング能力の向上

この二冊さらさら読んでいます。

97 Things Every Programmer Should Know: Collective Wisdom from the Experts

97 Things Every Programmer Should Know: Collective Wisdom from the Experts


97 Things Every Software Architect Should Know

97 Things Every Software Architect Should Know

そんでもってこの本で頭を柔らかくしたいと思っています。

プログラマのための論理パズル 難題を突破する論理思考トレーニング

プログラマのための論理パズル 難題を突破する論理思考トレーニング


落ち着いたらTopCoderにも参加したいです。

それ簡単なコードを書いてgithubにコミットしてみようかと思っています

関数型言語の学習
関数型言語は多くの計算を必要とするデータマイニング分野で活用されていくのではないでしょうか。
友人に教えてもらったScalaHadoopでも利用されているようなので

Programming Scala

Programming Scala

Erlangにも興味があります

Erlang Programming

Erlang Programming

以上です。

やけにオライリーの洋書の紹介が多くなります。
会社の福利厚生で無料で読めるからです。。


風呂敷を広げすぎた気がしますが、
やりたいことは実際たくさんあります。

とりあえず9月まではHadoop、PerlJava、統計機械学習の勉強はしっかりとやっていきたいと思います。