トピックモデルによる統計的潜在意味解析 (自然言語処理シリーズ)の評価

本というのは2種類あります。大学の教授などが金儲け目的のためにとりあえず適当に本を書いて、毎年新入生に高価な教科書として買わせるもの。つまりはお金儲け目的のために適当に書かれた本です。こういった本は何度読んでも頭に入らず、しかも支離滅裂でありまったく体型だってなく自己完結的でもありません。一番買いたくない部類の本です。

一方で公のための社会貢献として書かれた本が存在します。そういった本はお金儲け目的ではなく、その分野の発展のために自分が持っている知識を切り売りするという自己犠牲の精神があります。そういった有益なことを教えてしまうのはご自身の金銭的な不利益になるかもしれないのに、あえて出し惜しみせず教えてくれるものです。

そして今回のこの機械学習本は後者の本です。ここまで真に機械学習分野を教えたいという考えから書かれた本はそうそうありません。

佐藤一誠先生は若くして東京大学の杉山先生と一緒に研究室を運営されている方です。特に若手の教員というのはありとあらゆる雑務で忙しいのに、このような第一線で活躍されている先生がこのような精力的な本を出版してくださるのは本当に頭がさがる思いです。

そのためこの本のタイトルにもトピックモデルによる~となっており、内容としては機械学習全般において役立つ普遍的な知識が数学から逃げずに、むしろ数学を最大の拠り所として記載されています。

佐藤一誠先生は修士の頃からテキストマイニングを専門にしており、この本もテキストマイニングで用いられるモデルの一つであるトピックモデルを取り上げています。

ですがトピックモデルのみの本ではなく、機械学習のモデルと学習アルゴリズムを幅広く扱っている本です。

この本は章ごとに依存関係がしっかり書いてあり、それにしたがって読んでいけばいいでしょう。また必要最小限の数学知識も付録にかいてありますが、学部1年の教養レベルの数学をやっていれば見たことがある分野だと思います。

270ページくらいのわりに読むのはけっこうたいへんなので、スーパーバイザーが周りに居る場合には持ち回りで輪講して強力なツッコミを入れてもらうと勉強になるでしょう。

佐藤一誠先生は他にもノンパラメトリックベイズの本を出されているのでそのうちそちらも購入してみるつもりです。