Myページ
ホーム
コミュニティの人々
ソフトウェア
技術紹介
適用分野
Tyzohとは
ご意見お問い合わせ

kkatoのブログ

2008年11月アーカイブ

SC08:論文紹介

今回は体調を崩したこともあり論文セッションはあまり出席できず残念でした。
以下にちょっとだけ紹介しておきます。

N.K. Govindaraju et al.
High Performance Discrete Fourier Transforms on Graphics Processors

NVIDIAのCUDAを使ってFFT(高速フーリエ変換)を計算した。問題のサイズによってアルゴリズムを変えることで、常に高速になるように工夫している。すでにFFTのライブラリとしてはNVIDIAが提供するCUFFTがあるのだが、それと比べて2~4倍の速度を達成した。

Y.Xia and V.K. Prasanna
Parallel Exact Inference on the Cell Broadband Engine Processor

Cell BEを使ってexact inference問題を解くという話。exact inference問題とは、ベイジアンネットワーク内で、確率値を伝搬しながら更新するという問題で、NP困難である。これをCellを使ってCPUの数倍~数十倍のスピードで計算した。



kkato (2008-11-22 10:41) | コメント(0)| トラックバック(0)

SC08:6日目(エグジビション)

IMG_7380.JPG
風邪から辛うじて復活するも、まだ縮退運転という感じでエグジビションの方を見てきました。
論文セッションについては別途まとめます。

各社大きなハコモノを持ち込んで、速さ自慢大会という感じです。
いろいろなところで、轟音を立てながらすさまじい熱を出しています。

中でも私が個人的に注目したのは、NVIDIAのブースで、1Uサーバ4個(=Tesla16個)で、N体問題のN=14000000のときを計算してました(写真参考)。
IMG_7360.JPG

動きはカクカクという感じでしたが、それなりに速くリアルタイムで動いているようです。
写真はブレまくりですみません。



kkato (2008-11-22 05:47) | コメント(0)| トラックバック(0)

アメリカについて感じたこと

ビジネスマン、留学生を含め、日本から山ほどアメリカに行ってる今となっては、初めてアメリカに行ったやつがアメリカ文化論を論じてもあまり足しにもならないでしょうけど、あえて感じたことを書いてみます。

●不便さと親切さのバランス
他の外国とくらべて、アメリカって標識の面ですごく不便だと思いました。まず最初に面食らったのがシアトルの空港。私は世界の空港20か所くらいは経験してますが、あれはわかりづらさではワーストかも。

出口がわからなくて、うろうろしてたら
「そっちはセキュリティーゾーンだから行くなゴルァ!」(超訳)
って怒られた、
「だから出口がわかんねーんだよ!」(逆ギレ)
といったら、すごく紳士的に丁寧に教えてくれた。

その他、バスのシステムや、美術館の出入り口や、わかりづらいことだらけ。でも現地の人の様子を見ていて気付いたのですが、ようするに「わからなければ聞けばいい」そういう文化なんですね。実際、質問するとすごく親切に答えてくれる人が多い。

道に迷ってたりすると、実にフレンドリーに話しかけて教えてくれたりします。ヨーロッパやアジアだとこの手の輩はろくなやつがいなかったりする(ヤバいところに連れて行かれそうになった経験多数)のですが、アメリカ人はみんな親切でした。

●物乞いについて
物乞いというと、ヨーロッパだとうつむき加減で暗い顔してカップを差し出すイメージがあるんですが、アメリカはずいぶんちがう。

まず黙って座ってるわけじゃなくて、普通に街を歩いてて、妙にフレンドリーに話しかけてきたりする。

「やあ!1ドルくれないかなあ?」(戸田奈津子風)
「金くれるとぼくちゃんよろこんだりしちゃったりするんだけどなあ、とかなんとか言ったりみちゃったりして!」(広川太一郎風)

そんな感じでびっくりしました。

kkato (2008-11-20 11:14) | コメント(2)| トラックバック(0)

SC08:5日目(死んでました)

風邪ひいた。おなか壊した。ホテルで寝てた。
以上

kkato (2008-11-20 11:13) | コメント(0)| トラックバック(0)

SC08:4日目(基調講演)

Michael Dell(DellのCEO)講演がありました。
いま講演が終わったばかりですが、以下速報です。

・これからのスーパーコンピューティングで必要なのは、標準化、高密度化、低エネルギー化、管理の容易化の4つ
・人間の脳の計算能力はは20PFLOPで、これは今でも約33億ドル出せば作れる。しかし、人間の消費電力は20ワット、これは現在のコンピュータはかなわない
・Dellではregenerationというキーワードで、低電力化を進めている。(http://www.regeneration.org)
・(質問に答えて)今後のクラスター技術は、仮想化がカギになるだろう。仮想化はもともとサーバ向け技術だが、クラスターの技術としても広まるだろう。


以上、なぜあわててレポートしたかというと、この講演の内容はどうせどこかのメディアが報道すると思ったので、それに対してスピードで勝とうと思ったのでした。勝てたかな?

kkato (2008-11-19 00:52) | コメント(0)| トラックバック(0)

SC08:3日目(チュートリアル)

今日はチュートリアル
M02: High Performance Computing with CUDA
Presenters:
Massimiliano Fatica  (NVIDIA)
Patrick LeGresley  (NVIDIA)
Ian Buck  (NVIDIA)
John Stone  (University of Illinois at Urbana-Champaign)
Jim Phillips  (University of Illinois at Urbana-Champaign)
Scott Morton  (Hess Corporation)
Paulius Micikevicius  (NVIDIA)
を受けました。

その内容を以下に簡単にまとめます。

・CUDAでのプログラミングについて
   - スレッドとスレッドブロック
   - プログラミングの基本

・CUDAツールキットについて
   - CUBLAS(行列計算)やCUFFT(高速フーリエ変換)がある
   - MATLABにも対応している

・CUDAでのプログラムのチューニング
   - メモリアクセスのアライメントを工夫してコアレス(複数スレッドからのメモリアクセスが1回のフェッチになること)させることが重要
   - コアレスのための条件はGPUのバージョンによって違う
   - グローバルメモリから一度共有メモリに読み込んでからレジスタに読み込むという2段階データ読み込みが有効。容量の制限がきついので、局所性に十分注意
   - ストリームと非同期APIをうまく使い、計算と通信のオーバーラップをうまくやる

・地震学的計算
   - 測定データから地下の状況(地層、ガス、石油など)の断面を計算する
   - キルヒホフ積分による解法と、ウェーブ方程式による解法がある
   - ビデオドライバのバグに悩まされて大変だったらしい。ドライバをアップデートすると解決することも
   - 最大50倍のスピードを実現
   - 工数は12人月

・分子の可視化
   - 原子の位置が与えられた時に、各格子点での原子から与えられる力を計算する
   - 注目している格子点から、一定の距離以内の原子からの力の総和
   - スレッドが独立に動くようアルゴリズムを考えることで、通信遅延はほぼ無視できるレベルになった
   - CPUとGPUをオーバーラップして働かせることで、見た目の通信遅延はなくなった

・分子動力学
   - 分子の動的な変形を計算する
   - NAMDという既存のプログラムをCUDAに移植
   - ロードバランシングのための分割ロジックは既存のものがそのまま使えた
   - コアレスのためのデータサイズの調整と、(共有メモリからの)バンク衝突を避けるためのデータサイズ調整が重要

・流体計算
   - NSSUS(スタンフォード大によるナビエ・ストークス方程式のソルバ)をCUDAに移植した
   - 元がfortranで書かれているので、fortran→Cによるラッパ→CUDAという手順で呼び出し。Fortran 2003のinterop機能が役に立った
   - 境界部分の計算がパフォーマンス的にネック


実際のアプリケーションの話をいろいろと聞けておもしろかったです。ただ、内容が多彩な割には進むのが速すぎて頭がついていくのが大変だったです。そこらへん、もうちょっと考慮してほしかったなあと思います。今日の話、すべてについて専門家な人はいないはずなので。

kkato (2008-11-18 13:02) | コメント(0)| トラックバック(0)

SC08:2日目(チュートリアル)

1日目は諸手続のみで、2日目の今日はチュートリアル
S02: Application Supercomputing and the Many-Core Paradigm Shift
Presenters:
Alice Koniges  (Lawrence Livermore National Laboratory)
William Gropp  (University of Illinois at Urbana-Champaign)
Ewing (Rusty) Lusk  (Argonne National Laboratory)
David Eder  (Lawrence Livermore National Laboratory)
Rolf Rabenseifner  (High Performance Computing Center Stuttgart)
を受けました。

その内容を以下に簡単にまとめます。

・並列計算アーキテクチャおよびリソースについて
    - Top500に入っているコンピュータのアーキテクチャは、大きなくくりでいうと収束してきている。特にクラスター+クワッドコアが多い
    - とはいっても、詳細を見ると各マシンごとに特色がある
    - マルチコアでパフォーマンスを出すにはメモリバスのバンド幅が重要
    - TotalViewなどを使うとビジュアルなチューニングができる
    - パフォーマンスチューニングについてもビジュアルなツールがあり便利

・並列計算のプログラミングモデルについて
    - a)複雑な計算ができること、b)並列でよいパフォーマンスがでること、c)実装しやすいこと、のすべてを同時に満たすプログラミングモデルは難しい
    - HPF, OpenMPは実装しやすい面でのメリットが大きい
    - よくチューンされたMPIプログラムに対しハイブリッドモデル(OpenMP+MPI)を導入しても、パフォーマンスの向上は難しい。
    - MPIには、OpenMPと一緒に使うための命令群がある
    - パフォーマンスチューニングには、タイムチャートを可視化するツールがあるので便利

・MPIについて
    - Grid(ノードの接続が格子状になっている)の場合に特化してよいパフォーマンスを出すためのMPIのAPIがある
    - その場合、send, receiveともに非同期にすることで、通信遅延が少なくなる
    - PETScなどのライブラリをうまく利用すると、パフォーマンスが得やすい

・並列計算アプリケーションの設計について
    - まず問題の分割の仕方が大事。これはアプリケーションに依存する部分
    - その上で採用する並列アーキテクチャに応じた設計が必要
    - シングルプロセッサ(またはシングルノード)でのチューニングも重要
    - 最高のパフォーマンスを出すには、それなりに大きな開発チームが必要

・ハイブリッドプログラミング(OpenMP+MPIによるプログラミング)について
    - ハイブリッドに向く問題とそうでないものがあり、見極めが必要。MPI単独のほうが速いということもよくある。
    - 問題のサイズがダイナミックに変わるような場合、MPI単独だとロードバランシングが苦手で、ハイブリッドが有効
    - ノード間の通信を減らすべきなのはもちろんだが、同一ノード内の複数チップ間の通信も大きくパフォーマンスを落とす原因になる
    - ノード間通信による遅延を減らすには、通信中にオーバーラップして計算することが重要。そのための仕組みがOpenMPにproposalとして出ている。


この分野、私は新参者で、だからこそ勉強しに来たわけですが、今日のチュートリアルはとてもわかりやすく興味深かったです。8:30~17:00という長丁場であるにかかわらず一度も寝ませんでした:-)

新参者っていうことで、間違って理解しているところや、専門用語の使い方がおかしいところがあるかもしれません。ご了承ください。

kkato (2008-11-17 10:20) | コメント(0)| トラックバック(0)

ジミ・ヘンドリックス

今となってはおとといの話ですが、シアトルの思い出をひとつ。

空いた時間を利用して、Experience Music Projectという音楽ミュージアムみたいなところにいってきたのですが、その1/4くらいはジミ・ヘンドリックス部屋。ほとんどジミヘン博物館みたいになっています。

ライブの映像や、ドキュメント映画が流れていたりするんですが、すっかり洗脳されてしまいました。

いままであまり聞いたことなったですが、いやあ、いいですねえ。しびれました。
ウッドストックの様子も流れていましたが、かっこよすぎます。

ジミ・ヘンドリクスが使ったギターも展示していました。あの、ぶっ壊したギターもありましたが、ありがたく拝んできました。
ありがたや、ありがたや。

追記:
ウッドストックでの様子は、ここで視聴&購入できるようです。

kkato (2008-11-16 02:14) | コメント(0)| トラックバック(0)

テキサスのオースティンに来ています

今日シアトルから移動しました。

明日から始まるSupercomputing 2008(SC08)というカンファレンス(兼エグジビション)に出席するために来ました。今回私は論文等を発表するわけではなく、純粋に話を聞きに来ました。チュートリアルもあって、いくつか受ける予定です。

シアトルは寒かったのですが、ここは暑いです。部屋にはクーラーが入ってます。
周りの様子を見に散歩してきましたが、軽く汗をかきました。

kkato (2008-11-15 10:48) | コメント(0)| トラックバック(0)

洪水警報

昨日の夜からシアトルは嵐です。
いま、テレビを見てたらついに洪水警報が出てました。

テレビでは
・3日分の食糧
・懐中電灯
を用意すること、などと不穏なことを言っています。

それなんていう籠城?

せっかく今日はオフでお買い物でもしようかと思ってたのですが、しょうがないので部屋にこもってプログラムでも書いています。

そうだ、念のため3日分のビールでも買い込んでおこう。

kkato (2008-11-12 22:07) | コメント(1)| トラックバック(0)

いまシアトルに着きました

飛行機で8時間は近いじゃん、と思ってしまうのは感覚の麻痺だろうか。
酒飲んで寝てたので、体感時間は1時間くらいだった。これは違う意味の感覚の麻痺。

kkato (2008-11-11 04:14) | コメント(2)| トラックバック(0)

家族の日

11月の第3日曜日は「家族の日」で、その前後1週間は「家族の週間」なんだそうです。
その間はとくに家族を大事にしましょうという趣旨なんだろうと思いますが、その間中海外出張で家族とは離ればなれで、まったく趣旨に反する私でした。

ということで、来週10日からアメリカに行ってきます。

kkato (2008-11-07 13:23) | コメント(0)| トラックバック(0)

« 2008年10月 | メインページ | 2008年12月 »

プロフィール

kkato

・10年以上前からのdebian使いです。
・C++, Ruby, perl, ocamlなどの言語をよく使います。
・数値計算などが得意です。
・スパムメールの文面をよく読むのが好きです。
ホームページ:
http://sites.google.com/site/kimikazu/

カテゴリ

RSSフィード

コミュニティの人々 | ソフトウェア | 技術紹介 | 適用分野 | Tyzohとは | ご意見お問い合わせ

Copyright (C) 2004-2011 Nihon Unisys, Ltd. All Rights Reserved.
Powered by Movable Type Open Source