FPGA開発日記

FPGAというより、コンピュータアーキテクチャかもね! カテゴリ別記事インデックス https://sites.google.com/site/fpgadevelopindex/

OpenCLの入門のFFTをやってみた

改訂新版 OpenCL入門 1.2対応 マルチコアCPU・GPUのための並列プログラミング

改訂新版 OpenCL入門 1.2対応 マルチコアCPU・GPUのための並列プログラミング

毎度同じみOpenCLの入門書である。

ケーススタディとして、FFTの高速化のサンプルをやってみた。やったことは、殆ど写経だ。 やはり、難しいのはタスクの分割方法と、どのように載せるのかということか。 どうでもいいが、写経している最中にCUに載せるカーネル部のtypoが多くて動かなくてまいった。 やはりソースをコンパイルする形ではなく、一旦コンパイルする形でないと、デバッグがしにくいな。 CU内でどのように実行されるのか、バイナリを逆アセンブルしてみたいとも思うし。

  • 入力

f:id:msyksphinz:20150228032452j:plain

  • 出力(ハイパスフィルタ適用)

f:id:msyksphinz:20150228032505j:plain