Archチームの集合写真

Architecture team

朴 泰祐 教授

  • GPU 等の 演算加速装置 を含む並列処理アーキテクチャ及びネットワークに関する研究
  • これらのシステムを効率的に利用するための 並列処理言語 及び コンパイラ に関する研究
  • 実応用プログラム開発者との共同研究による 超並列アプリケーション の性能向上に関する研究

GPUやメニーコアプロセッサ等の演算加速装置をより有効に大規模並列処理に活用する手法や超高性能並列処理向けネットワーク,さらにこれらを活用する高性能並列コンパイラの研究をしています.我々が提案しているTCA (Tightly Coupled Accelerators) というコンセプトでは,演算加速装置間を従来技術より高速に接続し、 効率的な並列処理を行う基盤技術開発を行っています. また,本学計算科学研究センターの研究者との実用的大規模アプリケーション, さらに連携大学院の佐藤三久教授との共同研究の下, 理化学研究所で進められている次世代超並列計算機(ポスト「京」)プロジェクトとの共同研究も行い, ネットワークシミュレーション,独自開発の並列処理言語・コンパイラ等の研究を進めています.

個人ページ

小林 諒平 助教

  • 高性能な FPGAアクセラレータ とその開発方式に関する研究

大規模なデータ処理や科学技術計算を高速,かつ低消費電力に実行できるようにするために,電子回路のパターンをプログラムできるハードウェアであるFPGAを応用した計算機システムについて研究しています.具体的にはCPUやGPUをより効率的・大規模に利用するための,FPGA向けのハードウェアアルゴリズムやFPGAベースの専用アクセラレータの提案,実装を行っていきます.また,高性能なFPGAアクセラレータの効率的な開発を睨んだプラットフォームについても同時に研究しています.

個人ページ

研究内容

アーキテクチャチームでは,GPUやメニーコアプロセッサ等の演算加速装置をより有効に大規模並列処理に活用する手法や,超高性能並列処理向けネットワーク,さらにこれらを活用する高性能並列コンパイラの研究をしています. 現在の主な研究テーマは以下の通りです.なお,朴及び小林,藤田の3名が共同で適宜指導を行います。朴教授、小林助教、藤田助教の共同募集で募集人数は8名です.

  • FPGAを用いた演算オフローディングと高速通信の融合に関する研究
  • 大規模メニーコアシステムを用いた超並列アプリケーションの実装と最適化に関する研究(朴)
  • FPGAを用いた高速ソーティング回路に関する研究
  • GPUクラスタに向けた並列プログラミング言語に関する研究
  • 次世代スーパーコンピュータの性能予測シミュレータに関する研究

以下に,所属している学生達が行っている研究テーマについて紹介します.

GPU-FPGA複合システムにおけるデバイス間連携機構

Supercomputer Cygnus

我々は,高い演算性能とメモリバンド幅を有する GPU (Graphics Processing Unit) に演算通信性能に優れている FPGA (Field Programmable Gate Array) を連携させ,双方を相補的に利用する GPU-FPGA 複合システムに関する研究を進めています.我々が提案しているAiS(Accelerator in Switch) というコンセプトでは,FPGAを高速通信のできる再構成可能な演算加速装置として捉え,CPU-GPU クラスタ構成である現在のHPC システムの性能を更に向上させる鍵であると考えています.GPUとFPGAを組み合わせた世界初のスーパーコンピュータCygnus (左図) を用いて,実用的なアプリケーションをターゲットにした提案手法の実験を行っています.

右図に AiS コンセプトの概要を示します.各ノードには GPU と FPGA が搭載されており,それらは PCIe バスを介して接続されています.アプリケーションにおける大規模な粗粒度並列処理部分は従来通り GPU が担当しつつ,GPU ではカバーできない並列性の低い演算部分のオフロードおよび高速ノード間通信処理に FPGA を適用することによって,より効率的でレイテンシボトルネックの少ない強スケーリングの実現を目指しています.

AiS concept

高性能なFPGAアクセラレータを利用したアプリケーション開発に関する研究

近年,再構成可能ハードウェアとしてFPGAが注目され,多くの分野で使われるようになってきました. 高性能計算においてもその流れがあり,我々は現在利用されているGPUやCPUがどうしても解決できない問題について, FPGAを用いることで高性能化・高速化が行えないか検討しています.また,CPU, GPUに加え,FPGAにおいてもOpenCLプラットフォーム (右図) がサポートされ,FPGAを用いたプログラミングが従来よりも格段に容易になったこともその流れを後押ししています. このOpenCLの記述能力をフルに活用して,プログラミングコストを削減しつつ高性能なFPGAアクセラレータを実現することを目指しています. その一環として,初期宇宙の研究に重要な輻射輸送を解くプログラムで用いられているアルゴリズムをOpenCLで記述してFPGA向けに最適化する研究を本学の計算科学研究センターに所属する宇宙物理の研究者と共同で実施しています.

aocl description
astro-FPGA description

世界的な活動

朴教授は国際会議における議長やプログラム委員長を務めるなど、世界的に活躍しています. また,小林助教も国際会議のプログラム委員の経験があります.

他チームとの協力

並列プログラミング言語に関する研究はPAチームとの共同研究で,我々のPEACH2をPAチームで開発している並列言語XcalableMPの演算加速装置向け拡張XcalableACCに導入した実績もあります. また,FPGAチームとも協力しFPGAの基礎評価や並列アプリケーションの実装などを行っています.

メンバー

朴 泰祐

朴 泰祐 教授

  • アクセラレータ
  • ネットワーク

大規模科学技術計算(計算科学)は,最先端のサイエンスを支える重要な研究であり, 我々は本学の計算科学研究センターを始めとする国内外の研究者との共同研究によってこれを実施しています. GPU,FPGA等の計算リソースは今後の同分野の研究推進に重要な要素であり, これらを積極的に用いた大規模計算科学の実質的な成果を目指した研究を日夜進めています. ぜひみなさんの若い力を貸して下さい!

藤田 典久

藤田 典久 助教

  • GPU
  • FPGA
  • アクセラレータ

大規模な科学技術計算にFPGAを適用する研究をしています。 FPGA向けのアプリケーション最適化に関する研究だけでなく、 FPGAが持つ高速な外部通信機構を用いて複数のFPGA間で通信し、 大規模な問題を複数のFPGAで並列に計算をする研究も行っています。 現在のFPGAは開発コストが高く、なかなか一筋縄にはいきませんが、 CPUや他のアクセラレータでは実現できない処理がFPGAでは可能であり、 将来性のあるデバイスであると考えています。そして何よりも、研究成果が出たときの達成感と喜びは格別です。 最近ではフランクフルトで開催された国際会議でHPC in ASIA poster awardを受賞しました。 これ以外にも本研究室の研究内容は世界的に評価されているので, 「何か凄いことをして世界中の注目を集めてみたい!」とこっそり思っている人にとって本研究室はまさに理想的な環境です。 1ミリでも興味を持ったら是非遊びに来て下さい!

小林 諒平

小林 諒平 助教

  • GPU
  • FPGA
  • アクセラレータ
  • 高性能インターコネクト

FPGAを使って自分だけの高性能ハードウェアを作ってみたい, 高性能ハードウェアを簡単に作れる素敵なツールを実装してみたい,FPGAだけじゃなく, CPU, GPUを含めたヘテロジニアスコンピューティングについて探求したいという人は間違いなく当研究室に向いているので, どうぞ見学においで下さい.当研究室は,世界の第一線で活躍されている先生方を多く抱え, かつ学外の一流の研究者とも連携することができ,研究をするにおいてこれ以上無いくらい理想的な環境が用意されています. 是非一緒に世界を獲る研究を行っていきましょう!(詳細) (TSUKUBA FUTUREの記事)

北爪 開人

北爪 開人 M2

  • FPGA

スーパーコンピュータCygnus上で並列FPGA間通信をより使いやすくするためのフレームワーク改良に取り組んでいます。 この研究室は大学内で見てもかなり環境が整っている部類の研究室だと日々感じており、 中々手が出ない価格のハイエンドなFPGAやGPUを扱うことができます。「百聞は一見にしかず」かと思いますので、 ぜひ一度研究室へ見学にいらしてみてください。

鈴木 拓実

鈴木 拓実 M2

  • FPGA

私はHPCの知識がない状態で入り、今は、OpenMP、OpenMPI、Verilog HDL、OpenCLなどのHPCの基本的な言語やライブラリの勉強をしています。 先生方がわかりやすく教えて下さり、また、サーバ等の研究設備も整っており、良い環境で学ぶことができます。

Liang Wentao

Liang Wentao M2

  • GPU
  • FPGA
  • oneAPI

The supercomputing now is using different kind of accelerator very often, the "traditional" way of using them is by OpenCL. Intel now introduce a new unified programming platform — oneAPI, the platform provided the runtime and library to program different accelerator, including host code. That's a great contribition to heterogeneous computing, and now I'm trying to use it to program both GPU and FPGA.

Guo Zhixuan

Guo Zhixuan M1

  • GPU

来年4月からM1になるGuo ZhiXuanです。 私の研究はコードをGPU化し、処理速度を高速化させることです。 研究室には優れた教員がおり、充実したリソースと設備も整っています。 HPCの知識を豊富に学ぶことができます。

堀之内 航

堀之内 航 B4

  • GPU

今年度からArchitectureチームに配属となりました。 GPUを使ったアプリケーションの高速化の研究のための勉強をしています。 HPCに興味のある方はぜひお越しください。

白井 拓翔

白井 拓翔 B4

阿部 崇人

阿部 崇人 B4

吉田 智

吉田 智 B4

近年の成果

  • OpenACC Unified Programming Environment for Multi-hybrid Acceleration with GPU and FPGA
    • Boku Taisuke
    • Tsunashima Ryuta
    • Kobayashi Ryohei
    • Fujita Norihisa
    • Lee Seyong
    • Vetter Jeffrey S
    • Murai Hitoshi
    • Nakao Masahiro
    • Tsuji Miwako
    • Sato Mitsuhisa
    Boku, T. et al. (2023). OpenACC Unified Programming Environment for Multi-hybrid Acceleration with GPU and FPGA. In: Bienz, A., Weiland, M., Baboulin, M., Kruse, C. (eds) High Performance Computing. ISC High Performance 2023. Lecture Notes in Computer Science, vol 13999. Springer, Cham. https://doi.org/10.1007/978-3-031-40843-4_49
  • SYCLに基づく複数の演算加速装置を統一的に扱えるプログラミング手法の提案
    • 藤田 典久
    • 小林 諒平
    • Beau Johnston
    • Narasinga Rao Miniskar
    • Seyong Lee
    • Keita Teranishi
    • Jeffrer S. Vetter
    • 朴 泰祐
    藤田 典久, 小林 諒平, Beau Johnston, Narasinga Rao Miniskar, Seyong Lee, Keita Teranishi, Jeffrer S. Vetter, 朴 泰祐: “SYCLに基づく複数の演算加速装置を統一的に扱えるプログラミング手法の提案,” 情報処理学会 第190回HPC研究発表会, Vol. 2023-HPC-190, No. 1, Jul 2023.
  • NVIDIA H100 GPUにおけるグラフニューラルネットワークの学習精度と実行性能評価
    • 小林 諒平
    • 藤田 典久
    • 朴 泰祐
    • 天笠 俊之
    小林 諒平, 藤田 典久, 朴 泰祐, 天笠 俊之: “NVIDIA H100 GPUにおけるグラフニューラルネットワークの学習精度と実行性能評価,” 情報処理学会 第190回HPC研究発表会, Vol. 2023-HPC-190, No. 17, Jul 2023
  • Implementation and Performance Evaluation of Memory System Using Addressable Cache for HPC Applications on HBM2 Equipped FPGAs
    • Fujita Norihisa
    • Kobayashi Ryohei
    • Yamaguchi Yoshiki
    • Boku Taisuke
    Fujita, N., Kobayashi, R., Yamaguchi, Y., Boku, T. (2023). Implementation and Performance Evaluation of Memory System Using Addressable Cache for HPC Applications on HBM2 Equipped FPGAs. In: Singer, J., Elkhatib, Y., Blanco Heras, D., Diehl, P., Brown, N., Ilic, A. (eds) Euro-Par 2022: Parallel Processing Workshops. Euro-Par 2022. Lecture Notes in Computer Science, vol 13835. Springer, Cham. https://doi.org/10.1007/978-3-031-31209-0_9
  • HPC利用に向けたFPGA間シリアル通信コントローラKyokkoのIntel FPGAへの実装
    • 北爪 開人
    • 藤田 典久
    • 小林 諒平
    • 朴 泰祐
    北爪 開人, 藤田 典久, 小林 諒平, 朴 泰祐: “HPC利用に向けたFPGA間シリアル通信コントローラKyokkoのIntel FPGAへの実装,” 情報処理学会 第189回HPC研究発表会, Vol. 2023-HPC-189, No. 4, May 2023.
  • Accelerating Radiative Transfer Simulation on NVIDIA GPUs with OpenACC
    • Kobayashi Ryohei
    • Fujita Norihisa
    • Yamaguchi Yoshiki
    • Boku Taisuke
    • Yoshikawa Kohji
    • Abe Makito
    • Umemura Masayuki
    PDCAT 2022: Parallel and Distributed Computing, Applications and Technologies, 13798 344-358, Apr, 2023
  • FPGA高位合成における演算性能向上のための空間並列性記述に関する研究
    • 佐野 由佳
    • 小林 諒平
    • 藤田 典久
    • 朴 泰祐
    • 佐藤 三久
    佐野 由佳, 小林 諒平, 藤田 典久, 朴 泰祐, 佐藤 三久: ”FPGA高位合成における演算性能向上のための空間並列性記述に関する研究,” 情報処理学会第188回HPC研究報告会, Vol. 2023-HPC-188, No. 22, Jul 2023.
  • Implementation and Performance Evaluation of Collective Communications Using CIRCUS on Multiple FPGAs
    • Kikuchi Kohei
    • Fujita Norihisa
    • Kobayashi Ryohei
    • Boku Taisuke
    Kohei Kikuchi, Norihisa Fujita, Ryohei Kobayashi, and Taisuke Boku. 2023. Implementation and Performance Evaluation of Collective Communications Using CIRCUS on Multiple FPGAs. In Proceedings of the HPC Asia 2023 Workshops (HPCAsia '23 Workshops). Association for Computing Machinery, New York, NY, USA, 15–23. https://doi.org/10.1145/3581576.3581602
  • GPU-FPGA-accelerated Radiative Transfer Simulation with Inter-FPGA Communication
    • Kobayashi Ryohei
    • Fujita Norihisa
    • Yamaguchi Yoshiki
    • Boku Taisuke
    • Yoshikawa Kohji
    • Abe Makito
    • Umemura Masayuki
    Ryohei Kobayashi, Norihisa Fujita, Yoshiki Yamaguchi, Taisuke Boku, Kohji Yoshikawa, Makito Abe, and Masayuki Umemura. 2023. GPU–FPGA-accelerated Radiative Transfer Simulation with Inter-FPGA Communication. In Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region (HPCAsia '23). Association for Computing Machinery, New York, NY, USA, 117–125. https://doi.org/10.1145/3578178.3578231
  • Cygnus - World First Multihybrid Accelerated Cluster with GPU and FPGA Coupling
    • Boku Taisuke
    • Fujita Norihisa
    • Kobayashi Ryohei
    • Tatebe Osamu
    Taisuke Boku, Norihisa Fujita, Ryohei Kobayashi, and Osamu Tatebe. 2023. Cygnus - World First Multihybrid Accelerated Cluster with GPU and FPGA Coupling. In Workshop Proceedings of the 51st International Conference on Parallel Processing (ICPP Workshops '22). Association for Computing Machinery, New York, NY, USA, Article 8, 1–8. https://doi.org/10.1145/3547276.3548629
  • 並列FPGA環境における通信システムCIRCUSを用いた集団通信の実装と性能評価
    • 菊池 航平
    • 藤田 典久
    • 小林 諒平
    • 朴 泰祐
    菊池 航平, 藤田 典久, 小林 諒平, 朴 泰祐: ”並列FPGA環境における通信システムCIRCUSを用いた集団通信の実装と性能評価, ” 情報処理学会第187回HPC研究報告会, Vol. 2022-HPC-187, No. 7, Dec 2023.
  • An Open-source FPGA Library for Data Sorting
    • Kobayashi Ryohei
    • Miura Kento
    • Fujita Norihisa
    • Boku Taisuke
    • Amagasa Toshiyuki
    Ryohei Kobayashi, Kento Miura, Norihisa Fujita, Taisuke Boku, Toshiyuki Amagasa, An Open-source FPGA Library for Data Sorting, Journal of Information Processing, 2022, 30 巻, p. 766-777, 公開日 2022/10/15, Online ISSN 1882-6652, https://doi.org/10.2197/ipsjjip.30.766, https://www.jstage.jst.go.jp/article/ipsjjip/30/0/30_766/_article/-char/ja, 抄録:
  • GPU・FPGA複合型演算加速クラスタを用いた宇宙輻射輸送コードARGOTの多ノード並列化
    • 小林 諒平
    • 藤田 典久
    • 山口 佳樹
    • 朴 泰祐
    • 吉川 耕司
    • 安部 牧人
    • 梅村 雅之
    小林 諒平, 藤田 典久, 山口 佳樹, 朴 泰祐, 吉川 耕司, 安部 牧人, 梅村 雅之: ”GPU・FPGA複合型演算加速クラスタを用いた宇宙輻射輸送コードARGOTの多ノード並列化,” 情報処理学会第185回HPC研究報告会, Vol. 2022-HPC-185, No. 1, Jul 2022
  • Performance Evaluation on GPU-FPGA Accelerated Computing Considering Interconnections between Accelerators
    • Sano Yuka
    • Kobayashi Ryohei
    • Fujita Norihisa
    • Boku Taisuke
    Yuka Sano, Ryohei Kobayashi, Norihisa Fujita, and Taisuke Boku. 2022. Performance Evaluation on GPU-FPGA Accelerated Computing Considering Interconnections between Accelerators. In Proceedings of the 12th International Symposium on Highly-Efficient Accelerators and Reconfigurable Technologies (HEART '22). Association for Computing Machinery, New York, NY, USA, 10–16. https://doi.org/10.1145/3535044.3535046
  • ノードを跨いだGPU・FPGA複合型演算加速による宇宙物理シミュレーションの実装と評価
    • 佐野 由佳
    • 小林 諒平
    • 藤田 典久
    • 朴 泰祐
    佐野 由佳, 小林 諒平, 藤田 典久, 朴 泰祐: ”ノードを跨いだGPU・FPGA複合型演算加速による宇宙物理シミュレーションの実装と評価,” 情報処理学会第184回HPC研究報告会, Vol. 2022-HPC-184, No. 5
  • HBM2 搭載 FPGA のための Addressable Cache を用いた HPC 向けメモリシステムの性能評価
    • 藤田 典久
    • 小林 諒平
    • 山口 佳樹
    • 朴 泰祐
    藤田 典久, 小林 諒平, 山口 佳樹, 朴 泰祐: ”HBM2 搭載 FPGA のための Addressable Cache を用いた HPC 向けメモリシステムの性能評価,” 情報処理学会第183回HPC研究報告会, Vol. 2022-HPC-183, No. 9, Mar 2022.
  • OpenACCによる宇宙物理シミュレーションのGPU+FPGA協調計算の実装
    • 綱島 隆太
    • 小林 諒平
    • 藤田 典久
    • 朴 泰祐
    • Lee Seyong
    • Vetter Jeffrey S
    • 村井 均
    • 中尾 昌広
    • 辻 美和子
    • 佐藤 三久
    綱島 隆太, 小林 諒平, 藤田 典久, 朴 泰祐, Lee Seyong, Vetter Jeffrey S, 村井 均, 中尾 昌広, 辻 美和子, 佐藤 三久: ”OpenACCによる宇宙物理シミュレーションのGPU+FPGA協調計算の実装,” 情報処理学会第183回HPC研究報告会, Vol. 2022-HPC-183, No. 11, Mar 2022.
  • oneAPIを用いたGPU・FPGA混載ノードにおける宇宙物理シミュレーションコードARGOTの実装
    • 柏野 隆太
    • 小林 諒平
    • 藤田 典久
    • 朴 泰祐
    柏野 隆太, 小林 諒平, 藤田 典久, 朴 泰祐: ”oneAPIを用いたGPU・FPGA混載ノードにおける宇宙物理シミュレーションコードARGOTの実装,” 情報処理学会第183回HPC研究報告会, Vol. 2022-HPC-183, No. 12, Mar 2022.
  • GPUクラスタを用いた宇宙輻射輸送コードARGOTのOpenACC実装と性能評価
    • 小林 諒平
    • 藤田 典久
    • 山口 佳樹
    • 朴 泰祐
    • 吉川 耕司
    • 安部 牧人
    • 梅村 雅之
    小林 諒平, 藤田 典久, 山口 佳樹, 朴 泰祐, 吉川 耕司, 安部 牧人, 梅村 雅之: ”GPUクラスタを用いた宇宙輻射輸送コードARGOTのOpenACC実装と性能評価,” 情報処理学会第183回HPC研究報告会, Vol. 2022-HPC-183, No. 17, Mar 2022.
  • High resolution of city-level climate simulation by GPU with multi-physical phenomena
    • Watanabe Koei
    • Kikuchi Kohei
    • Boku Taisuke
    • Sato Takuto
    • Kusaka Hiroyuki
    Koei Watanabe, Kohei Kikuchi, Taisuke Boku, Takuto Sato, and Hiroyuki Kusaka. 2021. High Resolution of City-Level Climate Simulation by GPU with Multi-physical Phenomena. In Network and Parallel Computing: 18th IFIP WG 10.3 International Conference, NPC 2021, Paris, France, November 3–5, 2021, Proceedings. Springer-Verlag, Berlin, Heidelberg, 3–15. https://doi.org/10.1007/978-3-030-93571-9_1
  • Multi-hetero Acceleration by GPU and FPGA for Astrophysics Simulation on oneAPI Environment
    • Kashino Ryuta
    • Kobayashi Ryohei
    • Fujita Norihisa
    • Boku Taisuke
    Ryuta Kashino, Ryohei Kobayashi, Norihisa Fujita, and Taisuke Boku. 2022. Multi-hetero Acceleration by GPU and FPGA for Astrophysics Simulation on oneAPI Environment. In International Conference on High Performance Computing in Asia-Pacific Region (HPCAsia '22). Association for Computing Machinery, New York, NY, USA, 84–93. https://doi.org/10.1145/3492805.3492817