現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~の評価

株式などの投資と時系列分析を合わせた入門書はいままで日本ではなかった。米国ではこのような本は非常に多いのだが、それがなかった日本において出版されたこの本は画期的と言える。

まず株式投資の本というのは胡散臭い物が多い。書店で見てもわかる通りギャンブルのような本ばかりだ。よって情報商材や自動売買ソフトウェアなども詐欺まがいのものばかりが流通している。

この分野では計量経済学という大学の教員が研究しているしっかりした学問分野がある。その中の一つとして時系列分析、特に経済時系列分析や金融時系列分析という分野がある。この本の著者は一橋大学の教員だが、一橋大学というのは計量ファイナンスの分野に限れば東大よりも網羅的に教員が揃っておりこの分野では一家言ある。

そういった点からみると、この本は大学の教員が書いたものらしくない。株取引というものを扱っており、アカデミックな重厚さがない本になっている。こういった本は本来は大学の教員は書きたがらない。本というのは書いたらずっと残るから、格式が低い本を書いてしまうと硬派な研究をしている人の間では評価が下がってしまうからだ。

だから株式投資というのは大学の教員ではなく、今まではギャンブルをやっていたが投資も始めたという素人によって書かれた本ばかりだった。それが国立大学の教員というまともな人によってこのような本が書かれたのは本当に貴重だ。

時系列分析の本というのはすでに多数ある。統計数理研究所の所長も務めた北川源四郎先生の本も有名だ。だがそういう本と株式投資というものを橋渡しする本が日本には全くなかった。洋書では昔からかなりあり、間違いだらけの和訳書も一応あるのだが、最初から日本語として著された日本の大学教員による本はこれまでなかった。

この本はRをつかっているため、理論をどのように実装するかどうかについては踏み込まない。

だから全部自分で一から実装しようとしている人には役不足だがとっかかりにはなる。

特に時系列データのリターンではなく、累積リターンを使って実務では分析されているというのが書いてある点はかなり有益で、こういった業界では常識的なことも今まで出版した研究者はいなかった。

問題点があるとするとRのADF検定にはラグ数を決定する部分が適当であり、自分で修正されたAIC基準を使ったり、ラグ数が大きい順からt検定やF検定を行ってラグ数を自分で決めたほうがいい。

さらには回帰分析もOLSまでしか扱っていない。実際はDOLSやGLSくらいは使うべきである。

そして最後にのっているペアの決定方法も、クラスタリングというアルゴリズムの勉強としては面白いが実際にそれが使えるかどうと別。せめてバックテスト法で累積収益を集計しておいて、それが優秀な順でペアを選択すべきである。さらに凝るなら確率モデルで収益をモデル化して、DFO Derivative Free Optimizationで期待収益率を算出してそれが優秀な順に並べるのがいい。ADF検定のt-valueやp-valueが優秀な順に並べるという方法は直感的に正しそうだが、Walkforwardテストを行うと得られる収益率はそうでもない。

この本はこの分野がまったくわからない人のとっかかりとしてはいい。古本で高値で取引されてしまっている「実践的ペアトレーディングの理論」よりも内容は正確だし、具体的手順は乗ってるしということで入門としてはいい。だがこれは入り口であり、これより発展した理論はいくらでもすでに研究されていて十分実証されている。この本から先は各自の実力で大学で使われる専門書を読んだり洋書を読んだり論文を読んで進める必要がある。

あと数学3C程度の数学力は当然の大前提なので、数学は中学や高校時代にドロップアウトしたという人は買っても何もわからずに終わってしまう確率が高い。