CUDA by Example 汎用GPUプログラミング入門
- 作者: Jason Sanders,Edward Kandrot,株式会社クイープ
- 出版社/メーカー: インプレスジャパン
- 発売日: 2011/02/14
- メディア: 単行本(ソフトカバー)
- 購入: 1人 クリック: 36回
- この商品を含むブログ (11件) を見る
もはや自分の個人的メモだwww
prop.totalGloblaMemはsize_tで宣言されているが、%lldで表示しないとマイナス表示されてしまった。
$ ./enum_gpu --- General Information for device 0 --- Name: GeForce GTX 780 Ti Compute capability: 3.5 Clock rate: 1084500 Device copy overlap: Enabled Kernel execution timeout : Enabled --- Memory Information for device 0 --- Total global mem: 3221225472 Total constant Mem: 65536 Max mem pitch: 2147483647 Texture Alignmnet: 512 --- MP Information for device 0--- Multiprocessor count: 15 Shared mem per mp: 49152 Registers per mp: 65536 Threads in warp: 32 Max threads per block: 1024 Max thread dimensions: (1024, 1024, 64) Max grid dimensions: (2147483647, 65535, 65535)
Chapter-4 CUDA-Cによる並列プログラミング
cuComplex (float a, float b) : r(a), i(b) {}
にも、device 接頭語を付けるべき。