「ITエンジニアのための機械学習理論入門」を買った

ミーハーなので、こういう本が出るとつい買ってしまう。。。

作者: 中井悦司
出版社/メーカー: 技術評論社
発売日: 2015/10/17
メディア: 単行本（ソフトカバー）
この商品を含むブログを見る

深層学習の本を前に買って、これ系の分析アルゴリズムをちょっと勉強し直したいなと思いいろいろと探していたのだった。

作者: 岡谷貴之
出版社/メーカー: 講談社
発売日: 2015/04/08
メディア: 単行本（ソフトカバー）
この商品を含むブログ (6件) を見る

まずは、回帰分析の中でも最も基本的なアルゴリズム、最小二乗法についての章まで読み進めた。最小二乗法はトレーニングセットが与えれらた中で、推定を行って、最も誤差の小さい関数を推定する方法だ。本書で取り上げられていた例では、三角関数sin()をある程度ランダムに振ったトレーニングセットを9点ほど用意し、多項式で近似することを考えている。この時、多項式の次数Mを0から9まで変化させて、誤差がどの程度になるかをチェックしている。

回帰分析のアルゴリズム自体は、学生のときに授業であったので覚えているのだが、Mを大きくしていくときに気をつけなければならないのは、「オーバーフィッティング」という、過剰にトレーニングセットに適用されてしまうせいで、汎用的な関数を推定できていないことがある点だ。このことを考えて、サンプル点を「トレーニングセット」と「テストセット」に分け、トレーニングセットで学習した上でテストセットを実行し、テストセットとトレーニングセットがどの程度離れているかを確認するという方法が紹介されている。言うなればこれは別に特別な方法でも何でもなく、サンプル点を全て用いて学習すると、そのサンプルセットのみに最適化されたものになってしまうため、過剰に学習することを抑える役割を持っている。

Wikipediaにも良い画像が用意してあった。過剰に学習をさせると、トレーニングセットでは完璧に学習できているが、サンプルセットでは全く近似が出来ていない(誤差が大きい)ということになってしまう。本書ではPythonで書いてあるが、勉強のためにはC++で書き直してみるのもおもしろそうかな。あるいは、GPGPUとかを使って高速化する方法も勉強してみるといいかもしれない。