リモートメモリ書き込みを用いた MPI の効率的実装 Efficient implementation of MPI using remote memory write 建部 修見 児玉 祐悦 関口 智嗣 山口 喜教 Osamu Tatebe Yuetsu Kodama Satoshi Sekiguchi Yoshinori Yamaguchi E-mail: {tatebe,kodama,sekiguchi,yamaguti}@etl.go.jp 電子技術総合研究所 Electrotechnical Laboratory, AIST, MITI 概要 MPI は point-to-point 通信において, 対応する送信と受信のマッチングにお けるコストが大きく, 通信遅延が大きくなる原因となっている. 本研究では, ノンブロッキング受信が先行発行される通信パターンにおいて, 送信時に受信 側に問い合わせることなくリモートメモリ書き込みにより送信を行う方式を提 案し, 高並列計算機 EM-X に実装しその評価を行った. その結果, 通信遅延 15.3 usec., スループット 31.4 MB/s を達成し, 他 MPP に実装されている MPI に比べ優位な性能を示した. 本手法は, 他システムにおいても適応可能で あり, ハードウェアスペック通りの低遅延, 高スループットを得る為には重要 な方式と考えられる. ABSTRACT MPI point-to-point communication is a basic operation, however it requires runtime-matching of send and receive that causes to reduce performance. This paper proposes a new approach to send messages by remote memory write without inquiring of the receiver under a communication pattern such that nonblocking receive is issued in advance. Basically, this approach makes it possible to gain low latency and high bandwidth as the hardware specification. MPI-EMX, our implementation of the MPI on the EM-X multiprocessor, achieves a zero-byte latency of 15.3 usec. and a maximum bandwidth of 31.4 MB/s, which can compete with commercial MPPs. This approach to reduce communication latency is widely applicable to other systems and is quite a promising technique for achieving low latency and high bandwidth.