「cuda3.2のあれこれ」の編集履歴(バックアップ)一覧はこちら

cuda3.2のあれこれ」(2011/08/06 (土) 09:09:47) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

*実行中凍る ディスプレイ兼用で長時間カーネルを走らせると凍るのは仕様。 計算用にもう一本GPUを用意するか、カーネルを分割する。 *unspecified launch failureについて -cudaMemcpyとかの行に出現するけど、大半の原因は直前のカーネル実行。 -大体2タイプあってsegmentation faultタイプとstack overflowタイプがある。 -そして区別がつかない。 -ひとまずカーネルで範囲外配列参照とかぬるぽとかしてないか前者の確認。 -後者の対応はよく分からない。 -GPUサイドのスタックはCPUのスタックよりかなり小さい印象。 -ローカル変数とか関数呼び出しとかをできるだけ少なくするアルゴリズムにするぐらいか。 -__device__ staticで扱っていた定数を__constant__に切り替えると直ったり *MPI連携で外と繋ぐとき CUDA部分とMPI部分を分割してコンパイルする。 MPI側から呼び出されるCUDA側の関数の前にextern "C"を書いとくのを忘れずに。 参考: [[MPI and CUDA mixed programming - NVIDIA Forums>http://forums.nvidia.com/index.php?showtopic=30741]] [[Omeg4 ブロ~具: MPI+CUDA テスト>http://omeg4blog.blogspot.com/2010/09/mpicuda.html]] #comment
*実行中凍る ディスプレイ兼用で長時間カーネルを走らせると凍るのは仕様。 計算用にもう一本GPUを用意するか、実行時間が少なくなるようカーネルを分割する。 *unspecified launch failureについて -cudaMemcpyとかの行に出現するけど、大半の原因は直前のカーネル実行。 -大体2タイプあってsegmentation faultタイプとstack overflowタイプがある。 -そして区別がつかない。 -ひとまずカーネルで範囲外配列参照とかぬるぽとかしてないか前者の確認。 -後者の対応はよく分からない。 -GPUサイドのスタックはCPUのスタックよりかなり小さい印象。 -ローカル変数とか関数呼び出しとかをできるだけ少なくするアルゴリズムにするぐらいか。 -__device__ staticで扱っていた定数を__constant__に切り替えると直ったり *MPI連携で外と繋ぐとき CUDA部分とMPI部分を分割してコンパイルする。 MPI側から呼び出されるCUDA側の関数の前にextern "C"を書いとくのを忘れずに。 参考: [[MPI and CUDA mixed programming - NVIDIA Forums>http://forums.nvidia.com/index.php?showtopic=30741]] [[Omeg4 ブロ~具: MPI+CUDA テスト>http://omeg4blog.blogspot.com/2010/09/mpicuda.html]] #comment

表示オプション

横に並べて表示:
変化行の前後のみ表示:
目安箱バナー