[cuda3.2のあれこれ]の変更点 - 超音波流体屋のプログラム備忘録

「cuda3.2のあれこれ」(2011/08/06 (土) 09:09:47) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

*実行中凍るディスプレイ兼用で長時間カーネルを走らせると凍るのは仕様。計算用にもう一本GPUを用意するか、カーネルを分割する。 *unspecified launch failureについて -cudaMemcpyとかの行に出現するけど、大半の原因は直前のカーネル実行。 -大体2タイプあってsegmentation faultタイプとstack overflowタイプがある。 -そして区別がつかない。 -ひとまずカーネルで範囲外配列参照とかぬるぽとかしてないか前者の確認。 -後者の対応はよく分からない。 -GPUサイドのスタックはCPUのスタックよりかなり小さい印象。 -ローカル変数とか関数呼び出しとかをできるだけ少なくするアルゴリズムにするぐらいか。 -__device__ staticで扱っていた定数を__constant__に切り替えると直ったり *MPI連携で外と繋ぐとき CUDA部分とMPI部分を分割してコンパイルする。 MPI側から呼び出されるCUDA側の関数の前にextern "C"を書いとくのを忘れずに。参考: [[MPI and CUDA mixed programming - NVIDIA Forums>http://forums.nvidia.com/index.php?showtopic=30741]] [[Omeg4 ブロ～具: MPI+CUDA テスト>http://omeg4blog.blogspot.com/2010/09/mpicuda.html]] #comment

*実行中凍るディスプレイ兼用で長時間カーネルを走らせると凍るのは仕様。計算用にもう一本GPUを用意するか、実行時間が少なくなるようカーネルを分割する。 *unspecified launch failureについて -cudaMemcpyとかの行に出現するけど、大半の原因は直前のカーネル実行。 -大体2タイプあってsegmentation faultタイプとstack overflowタイプがある。 -そして区別がつかない。 -ひとまずカーネルで範囲外配列参照とかぬるぽとかしてないか前者の確認。 -後者の対応はよく分からない。 -GPUサイドのスタックはCPUのスタックよりかなり小さい印象。 -ローカル変数とか関数呼び出しとかをできるだけ少なくするアルゴリズムにするぐらいか。 -__device__ staticで扱っていた定数を__constant__に切り替えると直ったり *MPI連携で外と繋ぐとき CUDA部分とMPI部分を分割してコンパイルする。 MPI側から呼び出されるCUDA側の関数の前にextern "C"を書いとくのを忘れずに。参考: [[MPI and CUDA mixed programming - NVIDIA Forums>http://forums.nvidia.com/index.php?showtopic=30741]] [[Omeg4 ブロ～具: MPI+CUDA テスト>http://omeg4blog.blogspot.com/2010/09/mpicuda.html]] #comment

表示オプション

横に並べて表示：

変化行の前後のみ表示：

超音波流体屋のプログラム備忘録

記事メニュー

メニュー

各言語基本事項

応用事項

数値計算

有限要素法

人気記事ランキング

最近更新されたページ

人気Wikiランキング

atwikiでよく見られているWikiのランキングです。新しい情報を発見してみよう！

全体ページランキング

最近アクセスの多かったページランキングです。話題のページを見に行こう！