2009年9月10日木曜日

国策スパコンネタ


性能競争のイタチごっこから脱した 次世代スパコン開発の行方

Blue GeneがECC機能を持たない(ほんとか?)ことを批判しているのに、
あるスパコン技術者は「グラフィックスチップでアクセラレータを付加すれば20ペタFLOPS以上は十分射程内」と指摘する。
なんてことを書いちゃうのはどうなんだろう。

…なんてことを書いたのは、SC09で以下のようなポスターセッションがあると知ったから。

GPUs: TeraFLOPS or TeraFLAWED?
A lack of error checking and correcting (ECC) capability in the memory subsystems of graphics cards has been cited as hindering acceptance of GPUs as high-performance coprocessors,
やっぱり、本気でGPGPUやろうと思うと問題になるよねえ。

たとえば、スパコン専用のECC付きGPUを作れば解決かというと、GPUはコモディティだから安くできるのであって、専用設計にしたら「こんなにバカでかいチップ作ってスパコン専用CPU作るのと何が違うの?」って話になってしまう。

また、ECCでエラーが解決できなくて再計算するとなった場合、おそらくGPGPUでは、エラーが起きたデータブロックの計算結果は捨てて、そこはまるごと再計算するしかないのではないか。したがって、もしエラーが頻発するようだと、実アプリでの性能はでないということになる。あるいは、再計算の単位を小さくするために、たとえばALU間で同期とるためのアービターなどを付けたりしたら、やっぱり「スパコン専用CPU作るのと何が違うの」って話になってくるような気も。

もろもろ考えると、SIMD拡張した比較的シンプルな汎用コアをたくさん並べるIntelのLarrabee的なアプローチがまっとうなのかなあ、という気がしないでもないでも。


['09.09.11 追記]

> Blue GeneがECC機能を持たない(ほんとか?)

Roadrunnerについては全くのガセの模様。

HOT CHIPS 20 - 新しい内容も含まれていたIntel Larrabeeの論文
PowerXCell 8iはPS3のエンジンであるCELLプロセサをベースに、科学技術計算向けに倍精度浮動小数点演算性能を改善したチップであるが、Roadrunner のように大規模システム向けにエラー検出機構やECCなどが組み込まれていることが明らかにされた。
また、「FORTRANやC言語が使えない」という件についても、

Roadrunner: Hardware and Software Overview [PDF]
API    Application Programming Interface. An application
programming interface defines the syntax and semantics
for invoking services from within an executing application.
All APIs are targeted to be available to both FORTRAN
and C programs, although implementation issues (such
as whether the FORTRAN routines are simply wrappers
for calling C routines) are up to the supplier.
とのこと。

Blue Geneについては真面目に調べていないが、CPU内部のECC機能は無いのかもしれない。しかし、メモリ周りは当然ながらECC対応のようだ。「FORTRANやC言語が使えない」というのも、ちょっとありえないように思う。性能を出すには言語仕様の拡張が必要(本当にそうなのかは知らない)などといった情報を勘違いしたのではないだろうか。

0 件のコメント:

コメントを投稿