FPGA開発日記

FPGAというより、コンピュータアーキテクチャかもね! カテゴリ別記事インデックス https://sites.google.com/site/fpgadevelopindex/

GeForce 780 Ti でのcudaGetDeviceProperties の結果

CUDA by Example 汎用GPUプログラミング入門

CUDA by Example 汎用GPUプログラミング入門

もはや自分の個人的メモだwww

prop.totalGloblaMemはsize_tで宣言されているが、%lldで表示しないとマイナス表示されてしまった。

$ ./enum_gpu
   --- General Information for device 0 ---
Name: GeForce GTX 780 Ti
Compute capability: 3.5
Clock rate: 1084500
Device copy overlap:  Enabled
Kernel execution timeout : Enabled
   --- Memory Information for device 0 ---
Total global mem: 3221225472
Total constant Mem: 65536
Max mem pitch: 2147483647
Texture Alignmnet: 512
   --- MP Information for device 0---
Multiprocessor count: 15
Shared mem per mp: 49152
Registers per mp: 65536
Threads in warp: 32
Max threads per block: 1024
Max thread dimensions: (1024, 1024, 64)
Max grid dimensions:  (2147483647, 65535, 65535)

Chapter-4 CUDA-Cによる並列プログラミング

cuComplex (float a, float b) : r(a), i(b) {}

にも、device 接頭語を付けるべき。