研究について

研究について†

主な研究分野†

超並列計算機におけるハイパフォーマンスコンピューティング†

筑波大学計算科学研究センターに設置されているCP-PACSを始めとする、各種大規模並列処理環境におけるハイパフォーマンスコンピューティング技術(アーキテクチャ、ネットワーク、システムソフトウェア、アプリケーションへの適用、チューニング)の研究を行なっている。現在は主にクラスタ型並列処理システムにおけるシステムソフトウェアとアプリケーションチューニングの研究を進めている。対象アプリケーションは、QCD、分子動力学法(Molecular Dynamics)、物性物理学(密度汎関数法)、計算宇宙物理学等である。

↑

コモディティベースの並列処理システムにおけるハイパフォーマンスコンピューティング†

超並列クラスタの性能評価、システム構築(特に相互結合網)に関する研究を、計算物理学アプリケーションを中心に行なっている。当面のターゲットマシンはコモディティ技術による超並列クラスタPACS-CSである。

↑

コモディティ媒体を用いた耐故障性・高バンド幅を提供するクラスタ向けネットワーク†

Gigabit Ethernetのようなコモディティネットワークは、SAN等に比べ非常に高い対価格性能比を持つが、絶対性能の点でそれらに劣る。これに対し、Gigabit Ethernetをトランク結合することにより、バンド幅と耐故障性の両者を追及するクラスタ向けネットワークシステムRI2N (Redundant Interconnection with Inexpensive Network)を開発中である。また、複数の空間分散された上位層スイッチに、L2レベルでトラフィックを自動分散させ、上位層でのバンド幅ボトルネックを作らないfat treeを構築する技術や、その応用として従来の超並列計算機向けネットワークをコモディティ技術だけで実現する手法等の研究を行なっている。

↑

計算科学のための超並列クラスタ PACS-CS†

筑波大学計算科学研究センターにおいて2005年度より始まった、2560 CPUによる超並列クラスタPACS-CSの基本設計・相互結合網・システム運用全般に跨る研究を行なっている。PACS-CSはGigabit Ethernetのトランク技術と3次元ハイパクロスバ網、メモリバンド幅優先の単一プロセッサノード構成等を持つ実効性能追及型のユニークな高性能PCクラスタである。2006年6月の稼働開始が予定されており、完成時のピーク性能は14.3Tflopsにもなる。

↑

専用・汎用計算機の組み合わせによるハイブリッド超並列計算システム†

高並列クラスタ(または超並列計算機)を汎用計算機部、重力専用計算機GRAPEを専用計算機部として、両者を融合した各種並列処理プラットフォームの研究を行なっている。両システムを両側に置き、その間を並列リンクによる高バンド幅ネットワークで結合したHMCSを、現在計算科学研究センターで稼働させている。また、グリッドRPCに基づくHMCS-Gも試験運用中である。 2004年度から始まったFIRSTプロジェクトでは、GRAPE-6のコンパクト版として Blade GRAPEを開発し、これを高性能PCサーバに塔載した高密度実装型のHMCS-E を実現する。2005年6月現在、16ノードが稼働中で、2006年6月には256ノードのフルシステムが完成する予定である。完成時の性能は、合計で38.5 Tflops(汎用計算機部3.5 Tflops、専用計算機部35 Tflops)にもなる。

↑

グリッドRPCを用いたハイブリッド計算環境†

数少ない貴重なリソースである専用計算機をグリッド上に展開し、グリッドRPCによって遠隔利用するシステムHMCS-Gを開発している。グリッドRPC であるOmniRPCを用い、実際に、流体計算と重力計算の連成計算に応用している。

↑

相互結合網のルーティング・性能評価に関する研究†

従来型の直接網方式の超並列計算機向け相互結合網から、超並列計算機CP-PACSに用いられているような多次元クロスバによる間接網まで、広範囲な相互結合網における転送性能、それらに向いたアルゴリズム等に焦点を当て、それらの性能評価を高いコスト/パフォーマンスで実現する手法について研究している。

↑

計算機シミュレーションによる性能評価†

各種相互結合網トポロジや、ルーティングアルゴリズムの、転送性能におよぼす影響を調べるには、計算機シミュレーションは不可欠な要素である。この作業を非常に安いコスト(特に人的コスト)で行なうために、汎用の相互結合網シミュレータは極めて有用である。我々は、各種ネットワークに対する性能評価を容易にするシミュレーション環境 INSPIRE (Interconnection Network Simulator with Programmable Interaction and Routing for Performance Evaluation)を構築し、これを様々なトポロジやルーティングアルゴリズムの性能評価、さらには実システム・実アプリケーションをターゲットとした並列処理システム全体の性能評価に用いている。

↑

相互結合網性能の理論解析†

クロスバスイッチを多用した間接網においては、システムの振舞いをある程度制約された条件下に置くことにより、スループットベースの転送性能解析が可能である。我々は、CP-PACSに用いられているハイパクロスバ網から出発し、多段結合網等を含むクロスバ系の相互結合網の理論性能評価を行なっている。

↑

並列入出力・可視化システムに関する研究†

↑

並列入出力システム†

大規模並列計算機における科学技術計算よって生成される膨大なデータを、外部環境にネットワークを通じて出力あるいは入力する場合、ネットワークのスループットが最大の問題になる。HIPPIのような高性能ではあるが極めて高価なネットワーク技術を用いることによって、ある程度の性能は得られるが、特に超並列計算機では入出力要求が、そのデバイスを持つI/Oプロセッサに集中するため、本体の計算性能に見当った入出力性能を引き出すことが難しい。我々は、非常に安価かつ高性能になった100base-TXイーサネットや、Gigabit イーサネット、あるいはMyrinetのようなSAN技術を積極的に利用することにより、空間並列性に基づく高性能な並列入出力システムについて研究している。 CP-PACSをプラットフォームにした実験システムでは、多数の入出力プロセッサに通信負荷を分散させ、外部環境との並列接続を統合化するPIO (Parallel Input/Output)と呼ばれるシステムを構築し、現在評価中である。

↑

並列可視化システム†

大量のデータの可視化もまた、大規模科学技術計算において重要な技術である。最近のSMPアーキテクチャに基づく並列グラフィックスワークステーションを効率的に利用することにより、リアルタイムな可視化処理が可能となっており、これに見合うだけの外部環境からのデータ入力性能が必要となってきている。我々は、上述のPIOシステムに基づく並列データ入力をベースに、並列計算機におけるデータ生成から並列グラフィックスワークステーションにおける可視化までの全ての経路と処理を並列化し、高スループット・低コストの並列可視化システムを構築している。現在、並列グラフィックスワークステーションSGI Onyx2と超並列計算機 CP-PACSをPIOにより結合し、AVS/Expressの上にこのような並列可視化システムを構築中である。AVS/Expressは本来、単一プロセッサ内でのファイルベースの閉じた可視化環境であるが、その中のデータ入力モジュールを新たに作成し、PIOのAPIに基づくネットワーク経由の並列データ入力・マルチスレッドによる並列データのストリーム化処理・共有メモリを用いたAVSプロセスとのゼロコピーのデータ転送を駆使し、高スループットの可視化環境を実現している。

↑

並列処理システムの性能評価環境に関する研究†

並列計算機の設計段階において、ある程度の実アプリケーションの実行を想定し、その予備性能評価を行なうシステム VIPPES (Virtual Parallel Processor Evaluation System) を研究中である。このシステムは基本的にはクロックレベルのシミュレータを用いた大規模シミュレーションを行なうものである。全体のシミュレーションを並列プログラムの予備実行フェーズ、プロセッサ単位での内部実行フェーズ、ネットワークを介した並列実行フェーズの３段階に分割することにより、最もコストのかかるプロセッサ内部のシミュレーションの並列/分散化を容易にし、全体の計算コストを大幅に縮小することが可能である。 VIPPESは主に非決定性のない静的な振舞いをする並列プログラムを対象とする。これに対し、動的な振舞いをするアプリケーションに対するシミュレーションや、プロセッサに対する各種性能評価(シミュレーション、インスツルメネーション、実測等)を相互結合網の評価と密接に結びつけるため、INSPIREの相互結合網評価部と、プロセッサのそれを切り離し、いろいろなプラットフォーム上で処理可能にしたOpenINSPIREを開発し、各種並列プログラムに対するより柔軟な性能評価環境を実現している。

↑

研究について