前回Dot Productアクセラレータを作ったのだが、正しく動作していなかったのでデバッグしていた。
よく考えたら、行列積 を求めるにあたり、メモリのフェッチアドレスのとび幅を決めるのに、行列の列サイズも必要だったので、それを設定するファンクションも追加して再測定。
今回は、 の行列積を実行して、シミュレーション上でデバッグした。
結果は正しく動作したようだ。次にFPGAに同じデザインをインプリメントして実機での動作を確認する。実機では、さらに大きな行列を使用してみようと思う。 まず、 のサイズの行列を用意してみたが、正しく動作してくれなかった。具体的には数値がソフトウェアでの結果とずれている。
そこで再度で実行してみたのだが、先頭の要素だけずれている。これは何でだろう?まだデバッグが必要だ。