Archチームの集合写真

Architecture team

朴 泰祐 教授

  • GPU 等の 演算加速装置 を含む並列処理アーキテクチャ及びネットワークに関する研究
  • これらのシステムを効率的に利用するための 並列処理言語 及び コンパイラ に関する研究
  • 実応用プログラム開発者との共同研究による 超並列アプリケーション の性能向上に関する研究

GPUやメニーコアプロセッサ等の演算加速装置をより有効に大規模並列処理に活用する手法や超高性能並列処理向けネットワーク,さらにこれらを活用する高性能並列コンパイラの研究をしています.我々が提案しているTCA (Tightly Coupled Accelerators) というコンセプトでは,演算加速装置間を従来技術より高速に接続し、 効率的な並列処理を行う基盤技術開発を行っています. また,本学計算科学研究センターの研究者との実用的大規模アプリケーション, さらに連携大学院の佐藤三久教授との共同研究の下, 理化学研究所で進められている次世代超並列計算機(ポスト「京」)プロジェクトとの共同研究も行い, ネットワークシミュレーション,独自開発の並列処理言語・コンパイラ等の研究を進めています.

個人ページ

藤田 典久 助教

  • GPU / FPGA 等の演算加速装置に関する研究,アプリケーションの高速化
  • 高性能計算における 高速ネットワーク に関する研究
  • 上記の要素を活用するための プログラミング環境 に関する研究

GPU/FPGA等の演算加速装置を高性能計算で活用することに関する研究を行っています.演算加速装置を用いた科学技術計算アプリケーションの高速化だけでなく,計算機を相互接続する高性能ネットワークに関する研究,FPGA間直接通信に関する研究を進めています.また,これらの研究要素を活用するためのプログラミング環境に関する研究など,システムソフトウェアに関する研究も行っています.

研究内容

アーキテクチャチームでは,GPUやメニーコアプロセッサ等の演算加速装置をより有効に大規模並列処理に活用する手法や,超高性能並列処理向けネットワーク,さらにこれらを活用する高性能並列コンパイラの研究をしています. 現在の主な研究テーマは以下の通りです.なお,朴及び藤田の2名が共同で適宜指導を行います。朴教授、藤田助教の共同募集で募集人数は5名です.

  • FPGAを用いた演算オフローディングと高速通信の融合に関する研究
  • 大規模メニーコアシステムを用いた超並列アプリケーションの実装と最適化に関する研究(朴)
  • FPGAを用いた高速ソーティング回路に関する研究
  • GPUクラスタに向けた並列プログラミング言語に関する研究
  • 次世代スーパーコンピュータの性能予測シミュレータに関する研究

以下に,所属している学生達が行っている研究テーマについて紹介します.

GPU-FPGA複合システムにおけるデバイス間連携機構

Supercomputer Cygnus

我々は,高い演算性能とメモリバンド幅を有する GPU (Graphics Processing Unit) に演算通信性能に優れている FPGA (Field Programmable Gate Array) を連携させ,双方を相補的に利用する GPU-FPGA 複合システムに関する研究を進めています.我々が提案しているAiS(Accelerator in Switch) というコンセプトでは,FPGAを高速通信のできる再構成可能な演算加速装置として捉え,CPU-GPU クラスタ構成である現在のHPC システムの性能を更に向上させる鍵であると考えています.GPUとFPGAを組み合わせた世界初のスーパーコンピュータCygnus (左図) を用いて,実用的なアプリケーションをターゲットにした提案手法の実験を行っています.

右図に AiS コンセプトの概要を示します.各ノードには GPU と FPGA が搭載されており,それらは PCIe バスを介して接続されています.アプリケーションにおける大規模な粗粒度並列処理部分は従来通り GPU が担当しつつ,GPU ではカバーできない並列性の低い演算部分のオフロードおよび高速ノード間通信処理に FPGA を適用することによって,より効率的でレイテンシボトルネックの少ない強スケーリングの実現を目指しています.

AiS concept

高性能なFPGAアクセラレータを利用したアプリケーション開発に関する研究

近年,再構成可能ハードウェアとしてFPGAが注目され,多くの分野で使われるようになってきました. 高性能計算においてもその流れがあり,我々は現在利用されているGPUやCPUがどうしても解決できない問題について, FPGAを用いることで高性能化・高速化が行えないか検討しています.また,CPU, GPUに加え,FPGAにおいてもOpenCLプラットフォーム (右図) がサポートされ,FPGAを用いたプログラミングが従来よりも格段に容易になったこともその流れを後押ししています. このOpenCLの記述能力をフルに活用して,プログラミングコストを削減しつつ高性能なFPGAアクセラレータを実現することを目指しています. その一環として,初期宇宙の研究に重要な輻射輸送を解くプログラムで用いられているアルゴリズムをOpenCLで記述してFPGA向けに最適化する研究を本学の計算科学研究センターに所属する宇宙物理の研究者と共同で実施しています.

aocl description
astro-FPGA description

世界的な活動

朴教授は以下の国際会議にて、議長やプログラム委員長を務めるなど、世界的に活躍しています。

  • Steering Committee Chair: HPC Asia
  • Steering Committee: IEEE Cluster
  • Steering Committee: ICPP
  • International Advisory Committee: HANAMI Europe-Japan Collaboration
  • Chair: 2023 ACM Gordon Bell Prize Committee
  • Committee Member (2021-2024): ACM Gordon Bell Prize Committee
  • General Co-Chair: IEEE Cluster 2025, Edinburgh
  • General Vice Co-Chair: IEEE Cluster 2024, Kobe
  • General Co-Chair: IEEE Cluster 2020, virtual
  • General Chair: ICPP2019, Kyoto

藤田助教も複数の国際会議でプログラム委員の経験があります。

  • Special Session Chair, Performance Optimization and Auto-Tuning of Software on Multicore/Manycore Systems 2024
  • Member, ISC 2024 Workshop Committee
  • Publicity Chair, HPC Asia 2024 Organizing Committee

他チームとの協力

FPGAチームと協力しFPGAの基礎評価や並列アプリケーションの実装などを行っています.

メンバー

朴 泰祐

朴 泰祐 教授

  • アクセラレータ
  • ネットワーク

大規模科学技術計算(計算科学)は,最先端のサイエンスを支える重要な研究であり, 我々は本学の計算科学研究センターを始めとする国内外の研究者との共同研究によってこれを実施しています. GPU,FPGA等の計算リソースは今後の同分野の研究推進に重要な要素であり, これらを積極的に用いた大規模計算科学の実質的な成果を目指した研究を日夜進めています. ぜひみなさんの若い力を貸して下さい!

藤田 典久

藤田 典久 助教

  • GPU
  • FPGA
  • アクセラレータ

大規模な科学技術計算にFPGAを適用する研究をしています。 FPGA向けのアプリケーション最適化に関する研究だけでなく、 FPGAが持つ高速な外部通信機構を用いて複数のFPGA間で通信し、 大規模な問題を複数のFPGAで並列に計算をする研究も行っています。 現在のFPGAは開発コストが高く、なかなか一筋縄にはいきませんが、 CPUや他のアクセラレータでは実現できない処理がFPGAでは可能であり、 将来性のあるデバイスであると考えています。そして何よりも、研究成果が出たときの達成感と喜びは格別です。 最近ではフランクフルトで開催された国際会議でHPC in ASIA poster awardを受賞しました。 これ以外にも本研究室の研究内容は世界的に評価されているので, 「何か凄いことをして世界中の注目を集めてみたい!」とこっそり思っている人にとって本研究室はまさに理想的な環境です。 1ミリでも興味を持ったら是非遊びに来て下さい!

北爪 開人

北爪 開人 M2

  • FPGA

スーパーコンピュータCygnus上で並列FPGA間通信をより使いやすくするためのフレームワーク改良に取り組んでいます。 この研究室は大学内で見てもかなり環境が整っている部類の研究室だと日々感じており、 中々手が出ない価格のハイエンドなFPGAやGPUを扱うことができます。「百聞は一見にしかず」かと思いますので、 ぜひ一度研究室へ見学にいらしてみてください。

鈴木 拓実

鈴木 拓実 M2

  • FPGA

私はHPCの知識がない状態で入り、今は、OpenMP、OpenMPI、Verilog HDL、OpenCLなどのHPCの基本的な言語やライブラリの勉強をしています。 先生方がわかりやすく教えて下さり、また、サーバ等の研究設備も整っており、良い環境で学ぶことができます。

Liang Wentao

Liang Wentao M2

  • GPU
  • FPGA
  • oneAPI

The supercomputing now is using different kind of accelerator very often, the "traditional" way of using them is by OpenCL. Intel now introduce a new unified programming platform — oneAPI, the platform provided the runtime and library to program different accelerator, including host code. That's a great contribition to heterogeneous computing, and now I'm trying to use it to program both GPU and FPGA.

堀之内 航

堀之内 航 B4

  • GPU

今年度からArchitectureチームに配属となりました。 GPUを使ったアプリケーションの高速化の研究のための勉強をしています。 HPCに興味のある方はぜひお越しください。

白井 拓翔

白井 拓翔 B4

阿部 崇人

阿部 崇人 B4

  • GPU

私は、GPUを用いた科学技術計算アプリケーションについての研究を行うため、NvidiaのGPUについて勉強しています。 研究室では、OpenMPやOpenMPIを通して並列計算の基礎について教えていただいたり、ほぼ毎週あるミーティングで自分の疑問を教授に直接相談することができるため、高性能計算の研究をする上で必要な並列計算や計算加速デバイスへの深い理解が得られます。そう言った分野に興味がある方は、ぜひ一度説明会に足を運んで見てください。

吉田 智

吉田 智 B4

近年の成果

  • Using Intel oneAPI for Multi-hybrid Acceleration Programming with GPU and FPGA Coupling
    • Liang, Wentao
    • Fujita Norihisa
    • Kobayashi Ryohei
    • Boku Taisuke
    Liang, W., Fujita, N., Kobayashi, R., & Boku, T. (2024, January). Using Intel oneAPI for Multi-hybrid Acceleration Programming with GPU and FPGA Coupling. In Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region Workshops (pp. 69-76).
  • Improving Performance on Replica-Exchange Molecular Dynamics Simulations by Optimizing GPU Core Utilization
    • Taisuke Boku
    • Masataka Sugita
    • Ryohei Kobayashi
    • Shinnosuke Furuya
    • Takuya Fujie
    • Masahito Ohue
    • Yutaka Akiyama
    Taisuke Boku, Masataka Sugita, Ryohei Kobayashi, Shinnosuke Furuya, Takuya Fujie, Masahito Ohue, Yutaka Akiyama, “Improving Performance on Replica-Exchange Molecular Dynamics Simulations by Optimizing GPU Core Utilization”, Proc. of ICPP2024, Visby, Sweden, Aug. 15th, 2024.
  • CHARM-SYCL & IRIS: A Tool Chain for Performance Portability on Extremely Heterogeneous Systems,
    • Norihisa Fujita
    • Beau Johnston
    • Narasinga Rao Miniskar
    • Ryohei Kobayashi
    • Mohammad Alaul Haque Monil
    • Keita Teranishi
    • Seyong Lee, Jeffrey S. Vetter
    • Taisuke Boku
    Norihisa Fujita, Beau Johnston, Narasinga Rao Miniskar, Ryohei Kobayashi, Mohammad Alaul Haque Monil, Keita Teranishi, Seyong Lee, Jeffrey S. Vetter, Taisuke Boku, "CHARM-SYCL & IRIS: A Tool Chain for Performance Portability on Extremely Heterogeneous Systems," 2024 IEEE 20th International Conference on e-Science (e-Science), Osaka, Japan, pp. 1-10, Sept. 2024 doi: doi.org/10.1109/e-Science62913.2024.10678717.
  • Accelerating Radiative Transfer Simulation on NVIDIA GPUs with OpenACC
    • Ryohei Kobayashi
    • Norihisa Fujita
    • Yoshiki Yamaguchi
    • Taisuke Boku
    • Kohji Yoshikawa
    • Makito Abe
    • Masayuki Umemura
    Ryohei Kobayashi, Norihisa Fujita, Yoshiki Yamaguchi, Taisuke Boku, Kohji Yoshikawa, Makito Abe, Masayuki Umemura, "Accelerating Radiative Transfer Simulation on NVIDIA GPUs with OpenACC", PDCAT 2022: Parallel and Distributed Computing, Applications and Technologies, Volume 13798, pp.344 – 358, 2023 年 4 月
  • OpenACC 単一記述による GPU+ FPGA 複合デバイス処理システム
    • 綱島 隆太
    • 小林 諒平
    • 藤田 典久
    • 朴 泰祐
    • Lee Seyong
    • Vetter Jeffrey S.
    • 村井 均
    • 中尾 昌広
    • 辻 美和子
    • 佐藤 三久
    綱島隆太, 小林諒平, 藤田典久, 朴泰祐, 村井均, 中尾昌広, ... & 佐藤三久. (2023). OpenACC単一記述によるGPU+FPGA複合デバイス処理システム. 情報処理学会論文誌コンピューティングシステム (ACS), 16(2), 1-15.
  • CHARM-SYCL: New Unified Programming Environment for Multiple Accelerator Types
    • Norihisa Fujita
    • Beau Johnston
    • Ryohei Kobayashi
    • Keita Teranishi
    • Seyong Lee
    • Taisuke Boku
    • Jeffrey S. Vetter
    Norihisa Fujita, Beau Johnston, Ryohei Kobayashi, Keita Teranishi, Seyong Lee, Taisuke Boku, and Jeffrey S. Vetter, “CHARM-SYCL: New Unified Programming Environment for Multiple Accelerator Types,” In Proceedings of the SC '23 Workshops of The International Conference on High Performance Computing, Network, Storage, and Analysis (SC-W '23). Association for Computing Machinery, New York, NY, USA, pp. 1651–1661, Nov. 2023. doi: doi.org/10.1145/3624062.3624244
  • OpenACC Unified Programming Environment for Multi-hybrid Acceleration with GPU and FPGA
    • Boku Taisuke
    • Tsunashima Ryuta
    • Kobayashi Ryohei
    • Fujita Norihisa
    • Lee Seyong
    • Vetter Jeffrey S
    • Murai Hitoshi
    • Nakao Masahiro
    • Tsuji Miwako
    • Sato Mitsuhisa
    Boku, T. et al. (2023). OpenACC Unified Programming Environment for Multi-hybrid Acceleration with GPU and FPGA. In: Bienz, A., Weiland, M., Baboulin, M., Kruse, C. (eds) High Performance Computing. ISC High Performance 2023. Lecture Notes in Computer Science, vol 13999. Springer, Cham. https://doi.org/10.1007/978-3-031-40843-4_49
  • Implementation and Performance Evaluation of Memory System Using Addressable Cache for HPC Applications on HBM2 Equipped FPGAs
    • Fujita Norihisa
    • Kobayashi Ryohei
    • Yamaguchi Yoshiki
    • Boku Taisuke
    Fujita, N., Kobayashi, R., Yamaguchi, Y., Boku, T. (2023). Implementation and Performance Evaluation of Memory System Using Addressable Cache for HPC Applications on HBM2 Equipped FPGAs. In: Singer, J., Elkhatib, Y., Blanco Heras, D., Diehl, P., Brown, N., Ilic, A. (eds) Euro-Par 2022: Parallel Processing Workshops. Euro-Par 2022. Lecture Notes in Computer Science, vol 13835. Springer, Cham. https://doi.org/10.1007/978-3-031-31209-0_9
  • Accelerating Radiative Transfer Simulation on NVIDIA GPUs with OpenACC
    • Kobayashi Ryohei
    • Fujita Norihisa
    • Yamaguchi Yoshiki
    • Boku Taisuke
    • Yoshikawa Kohji
    • Abe Makito
    • Umemura Masayuki
    PDCAT 2022: Parallel and Distributed Computing, Applications and Technologies, 13798 344-358, Apr, 2023
  • FPGA高位合成における演算性能向上のための空間並列性記述に関する研究
    • 佐野 由佳
    • 小林 諒平
    • 藤田 典久
    • 朴 泰祐
    • 佐藤 三久
    佐野 由佳, 小林 諒平, 藤田 典久, 朴 泰祐, 佐藤 三久: ”FPGA高位合成における演算性能向上のための空間並列性記述に関する研究,” 情報処理学会第188回HPC研究報告会, Vol. 2023-HPC-188, No. 22, Jul 2023.
  • Implementation and Performance Evaluation of Collective Communications Using CIRCUS on Multiple FPGAs
    • Kikuchi Kohei
    • Fujita Norihisa
    • Kobayashi Ryohei
    • Boku Taisuke
    Kohei Kikuchi, Norihisa Fujita, Ryohei Kobayashi, and Taisuke Boku. 2023. Implementation and Performance Evaluation of Collective Communications Using CIRCUS on Multiple FPGAs. In Proceedings of the HPC Asia 2023 Workshops (HPCAsia '23 Workshops). Association for Computing Machinery, New York, NY, USA, 15–23. https://doi.org/10.1145/3581576.3581602
  • GPU-FPGA-accelerated Radiative Transfer Simulation with Inter-FPGA Communication
    • Kobayashi Ryohei
    • Fujita Norihisa
    • Yamaguchi Yoshiki
    • Boku Taisuke
    • Yoshikawa Kohji
    • Abe Makito
    • Umemura Masayuki
    Ryohei Kobayashi, Norihisa Fujita, Yoshiki Yamaguchi, Taisuke Boku, Kohji Yoshikawa, Makito Abe, and Masayuki Umemura. 2023. GPU–FPGA-accelerated Radiative Transfer Simulation with Inter-FPGA Communication. In Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region (HPCAsia '23). Association for Computing Machinery, New York, NY, USA, 117–125. https://doi.org/10.1145/3578178.3578231
  • Cygnus - World First Multihybrid Accelerated Cluster with GPU and FPGA Coupling
    • Boku Taisuke
    • Fujita Norihisa
    • Kobayashi Ryohei
    • Tatebe Osamu
    Taisuke Boku, Norihisa Fujita, Ryohei Kobayashi, and Osamu Tatebe. 2023. Cygnus - World First Multihybrid Accelerated Cluster with GPU and FPGA Coupling. In Workshop Proceedings of the 51st International Conference on Parallel Processing (ICPP Workshops '22). Association for Computing Machinery, New York, NY, USA, Article 8, 1–8. https://doi.org/10.1145/3547276.3548629
  • An Open-source FPGA Library for Data Sorting
    • Kobayashi Ryohei
    • Miura Kento
    • Fujita Norihisa
    • Boku Taisuke
    • Amagasa Toshiyuki
    Ryohei Kobayashi, Kento Miura, Norihisa Fujita, Taisuke Boku, Toshiyuki Amagasa, An Open-source FPGA Library for Data Sorting, Journal of Information Processing, 2022, 30 巻, p. 766-777, 公開日 2022/10/15, Online ISSN 1882-6652, https://doi.org/10.2197/ipsjjip.30.766, https://www.jstage.jst.go.jp/article/ipsjjip/30/0/30_766/_article/-char/ja, 抄録: