Architecture team
朴 泰祐 教授
GPUやメニーコアプロセッサ等の演算加速装置をより有効に大規模並列処理に活用する手法や超高性能並列処理向けネットワーク,さらにこれらを活用する高性能並列コンパイラの研究をしています.我々が提案しているTCA (Tightly Coupled Accelerators) というコンセプトでは,演算加速装置間を従来技術より高速に接続し、 効率的な並列処理を行う基盤技術開発を行っています. また,本学計算科学研究センターの研究者との実用的大規模アプリケーション, さらに連携大学院の佐藤三久教授との共同研究の下, 理化学研究所で進められている次世代超並列計算機(ポスト「京」)プロジェクトとの共同研究も行い, ネットワークシミュレーション,独自開発の並列処理言語・コンパイラ等の研究を進めています.
個人ページ
藤田 典久 助教
GPU/FPGA等の演算加速装置を高性能計算で活用することに関する研究を行っています.演算加速装置を用いた科学技術計算アプリケーションの高速化だけでなく,計算機を相互接続する高性能ネットワークに関する研究,FPGA間直接通信に関する研究を進めています.また,これらの研究要素を活用するためのプログラミング環境に関する研究など,システムソフトウェアに関する研究も行っています.
研究内容
アーキテクチャチームでは,GPUやメニーコアプロセッサ等の演算加速装置をより有効に大規模並列処理に活用する手法や,超高性能並列処理向けネットワーク,さらにこれらを活用する高性能並列コンパイラの研究をしています. 現在の主な研究テーマは以下の通りです.なお,朴及び藤田の2名が共同で適宜指導を行います。朴教授、藤田助教の共同募集で募集人数は5名です.
以下に,所属している学生達が行っている研究テーマについて紹介します.
GPU-FPGA複合システムにおけるデバイス間連携機構
我々は,高い演算性能とメモリバンド幅を有する GPU (Graphics Processing Unit) に演算通信性能に優れている FPGA (Field Programmable Gate Array) を連携させ,双方を相補的に利用する GPU-FPGA 複合システムに関する研究を進めています.我々が提案しているAiS(Accelerator in Switch) というコンセプトでは,FPGAを高速通信のできる再構成可能な演算加速装置として捉え,CPU-GPU クラスタ構成である現在のHPC システムの性能を更に向上させる鍵であると考えています.GPUとFPGAを組み合わせた世界初のスーパーコンピュータCygnus (左図) を用いて,実用的なアプリケーションをターゲットにした提案手法の実験を行っています.
右図に AiS コンセプトの概要を示します.各ノードには GPU と FPGA が搭載されており,それらは PCIe バスを介して接続されています.アプリケーションにおける大規模な粗粒度並列処理部分は従来通り GPU が担当しつつ,GPU ではカバーできない並列性の低い演算部分のオフロードおよび高速ノード間通信処理に FPGA を適用することによって,より効率的でレイテンシボトルネックの少ない強スケーリングの実現を目指しています.
高性能なFPGAアクセラレータを利用したアプリケーション開発に関する研究
近年,再構成可能ハードウェアとしてFPGAが注目され,多くの分野で使われるようになってきました. 高性能計算においてもその流れがあり,我々は現在利用されているGPUやCPUがどうしても解決できない問題について, FPGAを用いることで高性能化・高速化が行えないか検討しています.また,CPU, GPUに加え,FPGAにおいてもOpenCLプラットフォーム (右図) がサポートされ,FPGAを用いたプログラミングが従来よりも格段に容易になったこともその流れを後押ししています. このOpenCLの記述能力をフルに活用して,プログラミングコストを削減しつつ高性能なFPGAアクセラレータを実現することを目指しています. その一環として,初期宇宙の研究に重要な輻射輸送を解くプログラムで用いられているアルゴリズムをOpenCLで記述してFPGA向けに最適化する研究を本学の計算科学研究センターに所属する宇宙物理の研究者と共同で実施しています.
世界的な活動
朴教授は以下の国際会議にて、議長やプログラム委員長を務めるなど、世界的に活躍しています。
藤田助教も複数の国際会議でプログラム委員の経験があります。
他チームとの協力
FPGAチームと協力しFPGAの基礎評価や並列アプリケーションの実装などを行っています.
メンバー
朴 泰祐 教授
- アクセラレータ
- ネットワーク
大規模科学技術計算(計算科学)は,最先端のサイエンスを支える重要な研究であり, 我々は本学の計算科学研究センターを始めとする国内外の研究者との共同研究によってこれを実施しています. GPU,FPGA等の計算リソースは今後の同分野の研究推進に重要な要素であり, これらを積極的に用いた大規模計算科学の実質的な成果を目指した研究を日夜進めています. ぜひみなさんの若い力を貸して下さい!
藤田 典久 助教
- GPU
- FPGA
- アクセラレータ
大規模な科学技術計算にFPGAを適用する研究をしています。 FPGA向けのアプリケーション最適化に関する研究だけでなく、 FPGAが持つ高速な外部通信機構を用いて複数のFPGA間で通信し、 大規模な問題を複数のFPGAで並列に計算をする研究も行っています。 現在のFPGAは開発コストが高く、なかなか一筋縄にはいきませんが、 CPUや他のアクセラレータでは実現できない処理がFPGAでは可能であり、 将来性のあるデバイスであると考えています。そして何よりも、研究成果が出たときの達成感と喜びは格別です。 最近ではフランクフルトで開催された国際会議でHPC in ASIA poster awardを受賞しました。 これ以外にも本研究室の研究内容は世界的に評価されているので, 「何か凄いことをして世界中の注目を集めてみたい!」とこっそり思っている人にとって本研究室はまさに理想的な環境です。 1ミリでも興味を持ったら是非遊びに来て下さい!
北爪 開人 M2
- FPGA
スーパーコンピュータCygnus上で並列FPGA間通信をより使いやすくするためのフレームワーク改良に取り組んでいます。 この研究室は大学内で見てもかなり環境が整っている部類の研究室だと日々感じており、 中々手が出ない価格のハイエンドなFPGAやGPUを扱うことができます。「百聞は一見にしかず」かと思いますので、 ぜひ一度研究室へ見学にいらしてみてください。
鈴木 拓実 M2
- FPGA
私はHPCの知識がない状態で入り、今は、OpenMP、OpenMPI、Verilog HDL、OpenCLなどのHPCの基本的な言語やライブラリの勉強をしています。 先生方がわかりやすく教えて下さり、また、サーバ等の研究設備も整っており、良い環境で学ぶことができます。
Liang Wentao M2
- GPU
- FPGA
- oneAPI
The supercomputing now is using different kind of accelerator very often, the "traditional" way of using them is by OpenCL. Intel now introduce a new unified programming platform — oneAPI, the platform provided the runtime and library to program different accelerator, including host code. That's a great contribition to heterogeneous computing, and now I'm trying to use it to program both GPU and FPGA.
堀之内 航 B4
- GPU
今年度からArchitectureチームに配属となりました。 GPUを使ったアプリケーションの高速化の研究のための勉強をしています。 HPCに興味のある方はぜひお越しください。
白井 拓翔 B4
阿部 崇人 B4
- GPU
私は、GPUを用いた科学技術計算アプリケーションについての研究を行うため、NvidiaのGPUについて勉強しています。 研究室では、OpenMPやOpenMPIを通して並列計算の基礎について教えていただいたり、ほぼ毎週あるミーティングで自分の疑問を教授に直接相談することができるため、高性能計算の研究をする上で必要な並列計算や計算加速デバイスへの深い理解が得られます。そう言った分野に興味がある方は、ぜひ一度説明会に足を運んで見てください。
吉田 智 B4
近年の成果
- Liang, W., Fujita, N., Kobayashi, R., & Boku, T. (2024, January). Using Intel oneAPI for Multi-hybrid Acceleration Programming with GPU and FPGA Coupling. In Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region Workshops (pp. 69-76).
- Taisuke Boku, Masataka Sugita, Ryohei Kobayashi, Shinnosuke Furuya, Takuya Fujie, Masahito Ohue, Yutaka Akiyama, “Improving Performance on Replica-Exchange Molecular Dynamics Simulations by Optimizing GPU Core Utilization”, Proc. of ICPP2024, Visby, Sweden, Aug. 15th, 2024.
- Norihisa Fujita, Beau Johnston, Narasinga Rao Miniskar, Ryohei Kobayashi, Mohammad Alaul Haque Monil, Keita Teranishi, Seyong Lee, Jeffrey S. Vetter, Taisuke Boku, "CHARM-SYCL & IRIS: A Tool Chain for Performance Portability on Extremely Heterogeneous Systems," 2024 IEEE 20th International Conference on e-Science (e-Science), Osaka, Japan, pp. 1-10, Sept. 2024 doi: doi.org/10.1109/e-Science62913.2024.10678717.
- Ryohei Kobayashi, Norihisa Fujita, Yoshiki Yamaguchi, Taisuke Boku, Kohji Yoshikawa, Makito Abe, Masayuki Umemura, "Accelerating Radiative Transfer Simulation on NVIDIA GPUs with OpenACC", PDCAT 2022: Parallel and Distributed Computing, Applications and Technologies, Volume 13798, pp.344 – 358, 2023 年 4 月
- 綱島隆太, 小林諒平, 藤田典久, 朴泰祐, 村井均, 中尾昌広, ... & 佐藤三久. (2023). OpenACC単一記述によるGPU+FPGA複合デバイス処理システム. 情報処理学会論文誌コンピューティングシステム (ACS), 16(2), 1-15.
- Norihisa Fujita, Beau Johnston, Ryohei Kobayashi, Keita Teranishi, Seyong Lee, Taisuke Boku, and Jeffrey S. Vetter, “CHARM-SYCL: New Unified Programming Environment for Multiple Accelerator Types,” In Proceedings of the SC '23 Workshops of The International Conference on High Performance Computing, Network, Storage, and Analysis (SC-W '23). Association for Computing Machinery, New York, NY, USA, pp. 1651–1661, Nov. 2023. doi: doi.org/10.1145/3624062.3624244
- Boku, T. et al. (2023). OpenACC Unified Programming Environment for Multi-hybrid Acceleration with GPU and FPGA. In: Bienz, A., Weiland, M., Baboulin, M., Kruse, C. (eds) High Performance Computing. ISC High Performance 2023. Lecture Notes in Computer Science, vol 13999. Springer, Cham. https://doi.org/10.1007/978-3-031-40843-4_49
- Fujita, N., Kobayashi, R., Yamaguchi, Y., Boku, T. (2023). Implementation and Performance Evaluation of Memory System Using Addressable Cache for HPC Applications on HBM2 Equipped FPGAs. In: Singer, J., Elkhatib, Y., Blanco Heras, D., Diehl, P., Brown, N., Ilic, A. (eds) Euro-Par 2022: Parallel Processing Workshops. Euro-Par 2022. Lecture Notes in Computer Science, vol 13835. Springer, Cham. https://doi.org/10.1007/978-3-031-31209-0_9
- PDCAT 2022: Parallel and Distributed Computing, Applications and Technologies, 13798 344-358, Apr, 2023
- 佐野 由佳, 小林 諒平, 藤田 典久, 朴 泰祐, 佐藤 三久: ”FPGA高位合成における演算性能向上のための空間並列性記述に関する研究,” 情報処理学会第188回HPC研究報告会, Vol. 2023-HPC-188, No. 22, Jul 2023.
- Kohei Kikuchi, Norihisa Fujita, Ryohei Kobayashi, and Taisuke Boku. 2023. Implementation and Performance Evaluation of Collective Communications Using CIRCUS on Multiple FPGAs. In Proceedings of the HPC Asia 2023 Workshops (HPCAsia '23 Workshops). Association for Computing Machinery, New York, NY, USA, 15–23. https://doi.org/10.1145/3581576.3581602
- Ryohei Kobayashi, Norihisa Fujita, Yoshiki Yamaguchi, Taisuke Boku, Kohji Yoshikawa, Makito Abe, and Masayuki Umemura. 2023. GPU–FPGA-accelerated Radiative Transfer Simulation with Inter-FPGA Communication. In Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region (HPCAsia '23). Association for Computing Machinery, New York, NY, USA, 117–125. https://doi.org/10.1145/3578178.3578231
- Taisuke Boku, Norihisa Fujita, Ryohei Kobayashi, and Osamu Tatebe. 2023. Cygnus - World First Multihybrid Accelerated Cluster with GPU and FPGA Coupling. In Workshop Proceedings of the 51st International Conference on Parallel Processing (ICPP Workshops '22). Association for Computing Machinery, New York, NY, USA, Article 8, 1–8. https://doi.org/10.1145/3547276.3548629
- Ryohei Kobayashi, Kento Miura, Norihisa Fujita, Taisuke Boku, Toshiyuki Amagasa, An Open-source FPGA Library for Data Sorting, Journal of Information Processing, 2022, 30 巻, p. 766-777, 公開日 2022/10/15, Online ISSN 1882-6652, https://doi.org/10.2197/ipsjjip.30.766, https://www.jstage.jst.go.jp/article/ipsjjip/30/0/30_766/_article/-char/ja, 抄録: