機械学習と深層学習の書籍を読んでソースコードの実験をしてみる。第2章「機械学習の基礎」、2.1「帰納学習」について、ソースコードを見ながらトライした。
今回から、理解したことスライドにまとめてアップロードしていくことにした。
今回は帰納学習ということで、複数のデータの特徴を抽出する。書籍の内容なのであまり詳細は触れないが、100個の過去のデータからその特徴を抽出する。 具体的には、10000種類のテストパタンを生成して、そのパタンを、過去のパタンと比較する。
過去のパタンと類似度が高ければスコアが高く、類似度が引くければスコアが低い。 これで最大のスコアになるものを見つけ出す。
写経してみた。これを実行してみると、以下のようになった。
横軸に10種類のデータ(本書の場合は会社A→Iまで)、0が株価の下降、1が株価の上昇、2がどちらでもない、ということで判定している。
$ ./leanstock < ../book/ch2/ldata.txt 0 2 1 1 0 0 0 0 2 1 :score=74 1 0 0 0 1 1 1 1 0 2 :score=76 0 2 0 0 0 0 2 0 2 0 :score=77 0 2 0 2 2 1 1 1 2 2 :score=78 2 2 0 1 2 1 2 2 0 2 :score=84 2 2 0 1 2 2 2 2 0 2 :score=88 Best Answer 2 2 0 1 2 2 2 2 0 2 :score=88