ikautak.log

C/C++, Python, CUDA, Android, Linux kernel, Network, etc.

CUDAプログラミング実践講座

CUDAプログラミング実践講座 ? 超並列プロセッサにおけるプログラミング手法

CUDAプログラミング実践講座 ? 超並列プロセッサにおけるプログラミング手法

  • 作者: David B. Kirk,Wen-men W. Hwu,加藤諒,(株)Bスプラウト
  • 出版社/メーカー: ボーンデジタル
  • 発売日: 2010/11/22
  • メディア: 単行本(ソフトカバー)
  • 購入: 1人 クリック: 21回
  • この商品を含むブログ (1件) を見る

CUDA by Exampleと結構かぶっているが、こっちの方が実践的。
借りて読んでる途中だったが、すぐに返してしまって最初の方しか読んでない。
買うには高いんだよな。

データ並列性
データ構造に対して多量の数値演算を同時に安全に実行できるプログラム特性。

SPMD(Single Program, Multiple Data)
並列処理装置が複数のデータ部分に対して同じプログラムを実行。同じ命令を実行するとは限らない。

Warp
スレッドスケジューリングの単位。32スレッドごとにSM(Streaming Multi-processor)に割り当てられる。
あるwarpのスレッドによって実行される命令が、その前に実行される長いレイテンシを待たなければならない場合は、そのwarpは実行対象にならない。結果を待たなくてよい他のwarpが選択される(レイテンシ隠蔽)。