sys_parallel
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[FrontPage]] > [[sys_parallel]]
* 並列分散システム特論 [#ac46fad9]
-担当部分: 69〜76ページ
*前提となる内容 [#rf1e00b9]
途中からだと意味がわからんので。
**2.11 Invalidation Patterns [#bb1db98e]
前章では並列アプリケーションが生成する通信量に注目した。
この章ではなんでそのような通信量が発生するのか深く見る。
どのアプリケーションも無限のキャッシュ(4〜8 バイトの小さ...
どれだけのプロセッサがラインを共有していて、書き込みによ...
各書き込みに対応する無効化の回数は、書き込まれたアドレス...
***2.11.1 Classification of Data Objects [#z3f2faba]
-2.11.1.1 Code and Read-Only Data Objects
--どんなデータか:読み取り専用データで、確保、初期化後は...
--キャッシュへの影響:あまりない。
--例:fixed database などがそう。
-2.11.1.2 Migratory Data Objects
--どんなデータか:一つのプロセッサから操作されるデータで...
--キャッシュへの影響:単一の無効化(※)を引き起こす。
--例:MP3D のスペースセルなどがそう。
---単一の無効化とは)(※)ある CPU A だけが触る、その後に...
-2.11.1.3 Mostly-Read Data Objects
--どんなデータか:頻繁に読まれるデータで、何か書き込むべ...
--キャッシュへの影響:書き込みされると、周りのキャッシュ...
--例:LocusRoute のコストアレイがそうらしい。
-2.11.1.4 Frequently Read/Written Objects
--どんなデータか:読み込みも書き込みも頻繁に行われる。
--キャッシュへの影響:各書き込みは小さな無効化しか引き起...
--例:今回用いた中にこの例はない。
---普通のオブジェクトなのに、間違って同期オブジェクトとし...
-2.11.1.5 Synchronization Objects
--どんなデータか:同期処理に使われるデータである。低衝突...
---低衝突:あまり無効化が起きない。例:共有データを保護す...
---高衝突:かなりの無効化が生じる。例:タスクキューなど。
--キャッシュへの影響:
--例:ロックやバリアといったものがそう。
---プロセッサ数をスケールさせるためには、同期オブジェクト...
*担当部分の内容 [#a8ae5bcf]
***2.11.6 PTHOR [#m577b1f7]
2-10(a) は PTHOR での無効化の分布を表している。大規模な無...
PTHOR の基本オブジェクトは論理素子と、ネットデータ構造で...
グローバルスカラが、アルゴリズム中でデッドロックに至って...
2-10(c)にデータオブジェクトについて書いてある。
----
プログラムの実行中、論理素子は移動する(migratory)オブジ...
要素データ構造の一部分は、それを見るプロセッサの全てから...
これら長寿命な値、例えば要素(elements)の最小有効時間、...
----
PTHOR で共有されるネットデータは、回路の接続によって決ま...
典型的には、多くのネットデータは少ない素子(elements)し...
----
データ構造のためにある free list のヘッドポインタは、大抵...
しかしヘッドポインタは、アイテムを持ってくる前に、free li...
PTHOR で起きる無効化のうち、多くの割合を占めるのは、task ...
プロセス毎の値は、普通はちいさな無効化の原因となる。各プ...
----
gobal values カテゴリの無効化の中心となる一つの値、これは...
free list から持ってきたあとのデータ構造は、全く無効化を...
同期の振る舞いは(2-10(e) に示している)要素(elements)...
アンロックされる時の待機者の多くは、Chandy-Misra シミュレ...
***2.11.7 LocusRoute [#o0965996]
2-11(a) は LocusRoute での無効化の分布を示している。15以...
LocusRoute では、無効化に対して遙かに大きな原因となるのは...
これは異なるルートを配線するテストをする間、頻繁に読まれ...
コスト配列に無効化を起こす書き込みがなされた毎に無効化が...
ちいさな無効化はより多く見られる(more common)、なぜなら...
----
density array というオブジェクトのグループは(2-11(c) と ...
----
無効化を起こす書き込みのうち、三つ目に大きな原因となるの...
この変数のうちよく使われる変数は RouteRecord というもので...
そして 0 あるいは単一の無効化が起きる。配線作業に関連した...
----
global values というグループはグローバル変数の集まりを表...
グローバルカウント、これは読んで変更して書く(read-modify...
グローバルフラグ、これは多くのプロセッサから読まれる。し...
----
implicit sync としたグループは、プロセスの同期に使われる...
これらが示すのは、例えばタスクキューが一杯か、空か、とか...
2-11(e) は LocusRoute における同期の振る舞いである。131 ...
残る三つのうち 2つだけ、どのプロセッサがタスクキューから...
***2.11.8 Cholesky [#t216ca0d]
コレスキーだと 1より大きいサイズではほとんど無効化が起こ...
一度全てのアップデートが完了したら、パネルはプロセッサが...
無効化の次の原因は、incoming count の配列である。これはス...
コレスキーの同期処理は 2-12(e) に示している。256 の列のロ...
残ったロックは、タスクキューにアクセスをする。そして多く...
特徴的なアンロックの数(約 40〜55 の待機者)がある。これ...
***2.11.9 Barnes-Hut [#p6f02835]
Barnes-Hut アプリケーションは特徴的で、移動するデータ(mi...
時間が経つ間、データが書かれて、その結果大きな無効化が起...
Barnes-Hut の主なデータ構造はセルと粒子のツリーです。これ...
----
無効化の大部分はノードデータ(良く読まれる(mostly-read)...
次に大きい要因は、セルと粒子のツリーを作るためのリンク構...
最後はグローバルデータの集合であるよ。この集合は二つのグ...
カウンタは常に読まれて、変更されているから、単一の無効化...
ツリーのルートは良く読まれる(mostly-read)データで、非常...
----
2-13(e) は Barnes-Hut の同期の振る舞いを示しているぞ。ア...
ツリーの下の方にあるこれらのロックは、ほぼ衝突がない。が...
三つのロックがグローバル構造体を守るために残っている。こ...
***2.11.10 Summary of Individual Invalidation Distributio...
今まで見てきたアプリケーションの中で、無効化の分布の大半...
大きな無効化は頻繁に読み出されるデータオブジェクトに起因...
これらのオブジェクトが書き込まれるのは比較的まれである。
普通は、広く共有されないか、あるいは頻繁に書かれないと思...
これはキャッシュ無効式のコヒーレントプロトコルや、ディレ...
----
同期オブジェクトはデータオブジェクトと著しく違う振る舞い...
あまり競合(contention)のない同期オブジェクトだと、少し...
かなり競合している(high contention)オブジェクトだと、大...
この場合、これらのオブジェクトを対象としたハードウェアの...
----
残りのセクション(↓二個)はアプリケーション中に見られる無...
***2.11.11 Effect of Problem Size [#md1e831e]
比較的遅いシミュレーションによる物だったから、比較的小さ...
キャッシュの無効化に問題サイズが及ぼす影響を勉強するには...
ここでは三つの条件、今まで使ってきた物、今までの倍、今ま...
問題サイズが増加したとき、無効化の分布が同じか、あるいは...
問題サイズが増加すると、共有オブジェクトがより少なくなっ...
唯一の例外は LocusRoute である。回路のサイズより、回路の...
次に重要な傾向としては、問題サイズが増加すると無効化を伴...
この傾向は、問題サイズが大きいと通信と計算の比がより有利...
問題サイズが大きくなったとき、多くの仕事は、それまでと同...
***2.11.12 Effect of Number of Processors [#m8a83c7f]
書こうとしたら、塚田君とかぶってたぜ!
終了行:
[[FrontPage]] > [[sys_parallel]]
* 並列分散システム特論 [#ac46fad9]
-担当部分: 69〜76ページ
*前提となる内容 [#rf1e00b9]
途中からだと意味がわからんので。
**2.11 Invalidation Patterns [#bb1db98e]
前章では並列アプリケーションが生成する通信量に注目した。
この章ではなんでそのような通信量が発生するのか深く見る。
どのアプリケーションも無限のキャッシュ(4〜8 バイトの小さ...
どれだけのプロセッサがラインを共有していて、書き込みによ...
各書き込みに対応する無効化の回数は、書き込まれたアドレス...
***2.11.1 Classification of Data Objects [#z3f2faba]
-2.11.1.1 Code and Read-Only Data Objects
--どんなデータか:読み取り専用データで、確保、初期化後は...
--キャッシュへの影響:あまりない。
--例:fixed database などがそう。
-2.11.1.2 Migratory Data Objects
--どんなデータか:一つのプロセッサから操作されるデータで...
--キャッシュへの影響:単一の無効化(※)を引き起こす。
--例:MP3D のスペースセルなどがそう。
---単一の無効化とは)(※)ある CPU A だけが触る、その後に...
-2.11.1.3 Mostly-Read Data Objects
--どんなデータか:頻繁に読まれるデータで、何か書き込むべ...
--キャッシュへの影響:書き込みされると、周りのキャッシュ...
--例:LocusRoute のコストアレイがそうらしい。
-2.11.1.4 Frequently Read/Written Objects
--どんなデータか:読み込みも書き込みも頻繁に行われる。
--キャッシュへの影響:各書き込みは小さな無効化しか引き起...
--例:今回用いた中にこの例はない。
---普通のオブジェクトなのに、間違って同期オブジェクトとし...
-2.11.1.5 Synchronization Objects
--どんなデータか:同期処理に使われるデータである。低衝突...
---低衝突:あまり無効化が起きない。例:共有データを保護す...
---高衝突:かなりの無効化が生じる。例:タスクキューなど。
--キャッシュへの影響:
--例:ロックやバリアといったものがそう。
---プロセッサ数をスケールさせるためには、同期オブジェクト...
*担当部分の内容 [#a8ae5bcf]
***2.11.6 PTHOR [#m577b1f7]
2-10(a) は PTHOR での無効化の分布を表している。大規模な無...
PTHOR の基本オブジェクトは論理素子と、ネットデータ構造で...
グローバルスカラが、アルゴリズム中でデッドロックに至って...
2-10(c)にデータオブジェクトについて書いてある。
----
プログラムの実行中、論理素子は移動する(migratory)オブジ...
要素データ構造の一部分は、それを見るプロセッサの全てから...
これら長寿命な値、例えば要素(elements)の最小有効時間、...
----
PTHOR で共有されるネットデータは、回路の接続によって決ま...
典型的には、多くのネットデータは少ない素子(elements)し...
----
データ構造のためにある free list のヘッドポインタは、大抵...
しかしヘッドポインタは、アイテムを持ってくる前に、free li...
PTHOR で起きる無効化のうち、多くの割合を占めるのは、task ...
プロセス毎の値は、普通はちいさな無効化の原因となる。各プ...
----
gobal values カテゴリの無効化の中心となる一つの値、これは...
free list から持ってきたあとのデータ構造は、全く無効化を...
同期の振る舞いは(2-10(e) に示している)要素(elements)...
アンロックされる時の待機者の多くは、Chandy-Misra シミュレ...
***2.11.7 LocusRoute [#o0965996]
2-11(a) は LocusRoute での無効化の分布を示している。15以...
LocusRoute では、無効化に対して遙かに大きな原因となるのは...
これは異なるルートを配線するテストをする間、頻繁に読まれ...
コスト配列に無効化を起こす書き込みがなされた毎に無効化が...
ちいさな無効化はより多く見られる(more common)、なぜなら...
----
density array というオブジェクトのグループは(2-11(c) と ...
----
無効化を起こす書き込みのうち、三つ目に大きな原因となるの...
この変数のうちよく使われる変数は RouteRecord というもので...
そして 0 あるいは単一の無効化が起きる。配線作業に関連した...
----
global values というグループはグローバル変数の集まりを表...
グローバルカウント、これは読んで変更して書く(read-modify...
グローバルフラグ、これは多くのプロセッサから読まれる。し...
----
implicit sync としたグループは、プロセスの同期に使われる...
これらが示すのは、例えばタスクキューが一杯か、空か、とか...
2-11(e) は LocusRoute における同期の振る舞いである。131 ...
残る三つのうち 2つだけ、どのプロセッサがタスクキューから...
***2.11.8 Cholesky [#t216ca0d]
コレスキーだと 1より大きいサイズではほとんど無効化が起こ...
一度全てのアップデートが完了したら、パネルはプロセッサが...
無効化の次の原因は、incoming count の配列である。これはス...
コレスキーの同期処理は 2-12(e) に示している。256 の列のロ...
残ったロックは、タスクキューにアクセスをする。そして多く...
特徴的なアンロックの数(約 40〜55 の待機者)がある。これ...
***2.11.9 Barnes-Hut [#p6f02835]
Barnes-Hut アプリケーションは特徴的で、移動するデータ(mi...
時間が経つ間、データが書かれて、その結果大きな無効化が起...
Barnes-Hut の主なデータ構造はセルと粒子のツリーです。これ...
----
無効化の大部分はノードデータ(良く読まれる(mostly-read)...
次に大きい要因は、セルと粒子のツリーを作るためのリンク構...
最後はグローバルデータの集合であるよ。この集合は二つのグ...
カウンタは常に読まれて、変更されているから、単一の無効化...
ツリーのルートは良く読まれる(mostly-read)データで、非常...
----
2-13(e) は Barnes-Hut の同期の振る舞いを示しているぞ。ア...
ツリーの下の方にあるこれらのロックは、ほぼ衝突がない。が...
三つのロックがグローバル構造体を守るために残っている。こ...
***2.11.10 Summary of Individual Invalidation Distributio...
今まで見てきたアプリケーションの中で、無効化の分布の大半...
大きな無効化は頻繁に読み出されるデータオブジェクトに起因...
これらのオブジェクトが書き込まれるのは比較的まれである。
普通は、広く共有されないか、あるいは頻繁に書かれないと思...
これはキャッシュ無効式のコヒーレントプロトコルや、ディレ...
----
同期オブジェクトはデータオブジェクトと著しく違う振る舞い...
あまり競合(contention)のない同期オブジェクトだと、少し...
かなり競合している(high contention)オブジェクトだと、大...
この場合、これらのオブジェクトを対象としたハードウェアの...
----
残りのセクション(↓二個)はアプリケーション中に見られる無...
***2.11.11 Effect of Problem Size [#md1e831e]
比較的遅いシミュレーションによる物だったから、比較的小さ...
キャッシュの無効化に問題サイズが及ぼす影響を勉強するには...
ここでは三つの条件、今まで使ってきた物、今までの倍、今ま...
問題サイズが増加したとき、無効化の分布が同じか、あるいは...
問題サイズが増加すると、共有オブジェクトがより少なくなっ...
唯一の例外は LocusRoute である。回路のサイズより、回路の...
次に重要な傾向としては、問題サイズが増加すると無効化を伴...
この傾向は、問題サイズが大きいと通信と計算の比がより有利...
問題サイズが大きくなったとき、多くの仕事は、それまでと同...
***2.11.12 Effect of Number of Processors [#m8a83c7f]
書こうとしたら、塚田君とかぶってたぜ!
ページ名: