Archチームの集合写真

Architecture team

研究内容

アーキテクチャチームでは、GPUやFPGA等の演算加速装置をより有効に大規模並列処理に活用する手法や、超高性能並列処理向けネットワーク、さらにこれらを活用する高性能並列コンパイラの研究をしています。 さらに、近年注目を集める量子コンピュータも、将来的には特定の計算用途のアクセラレータとなりえると考え、このためのプログラムの開発環境や実行環境を研究しています。 産業総合研究所の量子・AI融合技術ビジネス開発グローバル研究センター(G-QuAT)と筑波大学の連携協定に基づき、G-QuATの最先端の量子コンピュータを利用した研究も可能です。 そして、GPUやFPGAといった演算加速装置を高性能計算に適用する研究も行っています、科学技術計算アプリケーションの高速化や、その開発環境に興味のある人を募集しています。 高度な開発手法や開発環境(コンパイラ,ランタイム)に関する研究も行っています。 現在の主な研究テーマは以下の通りです。なお、辻及び藤田の2名が共同で適宜指導を行います。辻教授、藤田助教の共同募集で募集人数は4名です。

  • 筑波大学の運営するスーパーコンピュータと量子コンピュータの連携ソフトウエア
  • スーパーコンピュータ上での量子コンピュータシミュレータの最適化
  • さまざまなスーパーコンピュータと量子コンピュータを相互利用するためのワークフロー
  • FPGAを用いた演算オフローディングと高速通信の融合に関する研究
  • GPUを用いた実アプリケーションの最適化に関する研究
  • 複数GPUベンダーに対応できるアプリケーション開発手法に関する研究
  • GPU-FPGAクラスタに向けた並列プログラミング言語に関する研究

以下に,所属している学生達が行っている研究テーマについて紹介します.

複数の圧縮ストリームのシリアライズを行うハードウェアの実装

近年、計算機の持つメモリバンド幅や通信バンド幅に対する計算速度の比率はますます大きくなっています。 これにより、多くの科学技術計算では計算に必要なデータの供給が追いつかず、メモリの読み書きやデータ通信が性能の ボトルネックとなることが多くなっています。これに対処する一つの方法として、データの圧縮による実質的なバンド幅の向上などが挙げられます。
この研究では、圧縮前のデータサイズを考慮した割合で各圧縮データストリームを通信路に流すことで、データの供給先の間での供給データ量の不均衡を解消するようなハードウェアをFPGA(Field Programmable Gate Array) により実装します。 これにより、複数のデータストリームに依存した計算を行う際のデータ到着待ち(ストール)の時間を減らすことができます。
この研究は適応型圧縮ハードウェアに関する理化学研究所との共同研究の一環として行われています。

朴 泰祐 教授 (2025年度退任予定)

  • GPU 等の 演算加速装置 を含む並列処理アーキテクチャ及びネットワークに関する研究
  • これらのシステムを効率的に利用するための 並列処理言語 及び コンパイラ に関する研究
  • 実応用プログラム開発者との共同研究による 超並列アプリケーション の性能向上に関する研究

GPUやメニーコアプロセッサ等の演算加速装置をより有効に大規模並列処理に活用する手法や超高性能並列処理向けネットワーク,さらにこれらを活用する高性能並列コンパイラの研究をしています.我々が提案しているTCA (Tightly Coupled Accelerators) というコンセプトでは,演算加速装置間を従来技術より高速に接続し、 効率的な並列処理を行う基盤技術開発を行っています. また,本学計算科学研究センターの研究者との実用的大規模アプリケーション, さらに連携大学院の佐藤三久教授との共同研究の下, 理化学研究所で進められている次世代超並列計算機(ポスト「京」)プロジェクトとの共同研究も行い, ネットワークシミュレーション,独自開発の並列処理言語・コンパイラ等の研究を進めています.

個人ページ

辻 美和子 教授

  • 量子コンピュータとスーパーコンピュータの 協調計算のためのミドルウェア の研究
  • 量子コンピュータとスーパーコンピュータの 協調計算のためのプログラミング環境 の研究

量子コンピュータはこれまでの計算機とは異なる量子力学に基づく原理で動作し、これまでのコンピュータが苦手としていた問題を解決できる可能性のある計算機です。スーパーコンピュータは第三の科学であるシミュレーションを強力に推進するインフラストラクチャです。新たな計算の可能性を追求するために、これらを組み合わせて利用するために必要なソフトウェアをさまざまな側面から研究・開発します。

藤田 典久 助教

  • GPU / FPGA 等の演算加速装置に関する研究,アプリケーションの高速化
  • 高性能計算における 高速ネットワーク に関する研究
  • 上記の要素を活用するための プログラミング環境 に関する研究

GPU/FPGA等の演算加速装置を高性能計算で活用することに関する研究を行っています.演算加速装置を用いた科学技術計算アプリケーションの高速化だけでなく,計算機を相互接続する高性能ネットワークに関する研究,FPGA間直接通信に関する研究を進めています.また,これらの研究要素を活用するためのプログラミング環境に関する研究など,システムソフトウェアに関する研究も行っています.

世界的な活動

朴教授は以下の国際会議にて、議長やプログラム委員長を務めるなど、世界的に活躍しています。

  • Steering Committee Chair: HPC Asia
  • Steering Committee: IEEE Cluster
  • Steering Committee: ICPP
  • International Advisory Committee: HANAMI Europe-Japan Collaboration
  • Chair: 2023 ACM Gordon Bell Prize Committee
  • Committee Member (2021-2024): ACM Gordon Bell Prize Committee
  • General Co-Chair: IEEE Cluster 2025, Edinburgh
  • General Vice Co-Chair: IEEE Cluster 2024, Kobe
  • General Co-Chair: IEEE Cluster 2020, virtual
  • General Chair: ICPP2019, Kyoto

辻教授も複数の国際会議で副議長等の重要な役割をつとめるほか、高性能計算の重要な会議の多くで毎年プログラム委員を務めています。

  • IEEE International Conference on Cluster Computing (CLUSTER2022), General Vice Chair
  • IEEE International Conference on Cluster Computing (CLUSTER2024), General Deupty Chair
  • The International Conference on High Performance Computing in Asia-Pacific Region (HPCAsia2022), General Vice Chair
  • The International Conference for High Performance Computing, Networking, Storage, and Analysis (SC25, 24, 23, 22, etc), Technical Program Committee member
  • IEEE/ACM International Symposium on Cluster, Cloud and Internet Computing Program Committee member (CCGRID25, 24, 23, 22, etc)
  • ISC High Performance (ISC25, 24, 23, 22, etc)
  • IEEE International Parallel and Distributed Processing Symposium (IPDPS25, 22)
  • International Conference on Parallel Processing (ICPP25, 24, 23, 22, etc)

藤田助教も複数の国際会議でプログラム委員の経験があります。

  • Special Session Chair, Performance Optimization and Auto-Tuning of Software on Multicore/Manycore Systems 2024
  • Member, ISC 2024 Workshop Committee
  • Publicity Chair, HPC Asia 2024 Organizing Committee

他チームとの協力

FPGAチームと協力しFPGAの基礎評価や並列アプリケーションの実装などを行っています.

メンバー

朴 泰祐

朴 泰祐 教授

  • アクセラレータ
  • ネットワーク

大規模科学技術計算(計算科学)は,最先端のサイエンスを支える重要な研究であり, 我々は本学の計算科学研究センターを始めとする国内外の研究者との共同研究によってこれを実施しています. GPU,FPGA等の計算リソースは今後の同分野の研究推進に重要な要素であり, これらを積極的に用いた大規模計算科学の実質的な成果を目指した研究を日夜進めています. ぜひみなさんの若い力を貸して下さい!

辻 美和子

辻 美和子 教授

  • 量子HPC連携

量子コンピュータはこれまでの計算機とは全く異なる原理で動作するコンピュータで、 スーパーコンピュータと連携させることで、これまでは不可能だった計算が可能になることが期待されます。 量子コンピュータとスーパーコンピュータをつなぐためのソフトウェアや、 連携のためのプログラミングモデルについて研究しています。世界トップクラスのスーパーコンピュータと 最先端の量子コンピュータをつかって、ぜひいっしょに研究しましょう。

藤田 典久

藤田 典久 助教

  • GPU
  • FPGA
  • アクセラレータ

大規模な科学技術計算にFPGAを適用する研究をしています。 FPGA向けのアプリケーション最適化に関する研究だけでなく、 FPGAが持つ高速な外部通信機構を用いて複数のFPGA間で通信し、 大規模な問題を複数のFPGAで並列に計算をする研究も行っています。 現在のFPGAは開発コストが高く、なかなか一筋縄にはいきませんが、 CPUや他のアクセラレータでは実現できない処理がFPGAでは可能であり、 将来性のあるデバイスであると考えています。そして何よりも、研究成果が出たときの達成感と喜びは格別です。 最近ではフランクフルトで開催された国際会議でHPC in ASIA poster awardを受賞しました。 これ以外にも本研究室の研究内容は世界的に評価されているので, 「何か凄いことをして世界中の注目を集めてみたい!」とこっそり思っている人にとって本研究室はまさに理想的な環境です。 1ミリでも興味を持ったら是非遊びに来て下さい!

阿部 崇人

阿部 崇人 M1

  • GPU

私は、GPUを用いた科学技術計算アプリケーションについての研究を行うため、NvidiaのGPUについて勉強しています。 研究室では、OpenMPやOpenMPIを通して並列計算の基礎について教えていただいたり、ほぼ毎週あるミーティングで自分の疑問を教授に直接相談することができるため、高性能計算の研究をする上で必要な並列計算や計算加速デバイスへの深い理解が得られます。そう言った分野に興味がある方は、ぜひ一度説明会に足を運んで見てください。

白井 拓翔

白井 拓翔 M1

吉田 智

吉田 智 M1

宇佐美 健太

宇佐美 健太 B4

近年の成果

  • Using Intel oneAPI for Multi-hybrid Acceleration Programming with GPU and FPGA Coupling
    • Liang, Wentao
    • Fujita Norihisa
    • Kobayashi Ryohei
    • Boku Taisuke
    Liang, W., Fujita, N., Kobayashi, R., & Boku, T. (2024, January). Using Intel oneAPI for Multi-hybrid Acceleration Programming with GPU and FPGA Coupling. In Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region Workshops (pp. 69-76).
  • Improving Performance on Replica-Exchange Molecular Dynamics Simulations by Optimizing GPU Core Utilization
    • Taisuke Boku
    • Masataka Sugita
    • Ryohei Kobayashi
    • Shinnosuke Furuya
    • Takuya Fujie
    • Masahito Ohue
    • Yutaka Akiyama
    Taisuke Boku, Masataka Sugita, Ryohei Kobayashi, Shinnosuke Furuya, Takuya Fujie, Masahito Ohue, Yutaka Akiyama, “Improving Performance on Replica-Exchange Molecular Dynamics Simulations by Optimizing GPU Core Utilization”, Proc. of ICPP2024, Visby, Sweden, Aug. 15th, 2024.
  • Accelerating Radiative Transfer Simulation on NVIDIA GPUs with OpenACC
    • Ryohei Kobayashi
    • Norihisa Fujita
    • Yoshiki Yamaguchi
    • Taisuke Boku
    • Kohji Yoshikawa
    • Makito Abe
    • Masayuki Umemura
    Ryohei Kobayashi, Norihisa Fujita, Yoshiki Yamaguchi, Taisuke Boku, Kohji Yoshikawa, Makito Abe, Masayuki Umemura, "Accelerating Radiative Transfer Simulation on NVIDIA GPUs with OpenACC", PDCAT 2022: Parallel and Distributed Computing, Applications and Technologies, Volume 13798, pp.344 – 358, 2023 年 4 月
  • OpenACC 単一記述による GPU+ FPGA 複合デバイス処理システム
    • 綱島 隆太
    • 小林 諒平
    • 藤田 典久
    • 朴 泰祐
    • Lee Seyong
    • Vetter Jeffrey S.
    • 村井 均
    • 中尾 昌広
    • 辻 美和子
    • 佐藤 三久
    綱島隆太, 小林諒平, 藤田典久, 朴泰祐, 村井均, 中尾昌広, ... & 佐藤三久. (2023). OpenACC単一記述によるGPU+FPGA複合デバイス処理システム. 情報処理学会論文誌コンピューティングシステム (ACS), 16(2), 1-15.
  • CHARM-SYCL: New Unified Programming Environment for Multiple Accelerator Types
    • Norihisa Fujita
    • Beau Johnston
    • Ryohei Kobayashi
    • Keita Teranishi
    • Seyong Lee
    • Taisuke Boku
    • Jeffrey S. Vetter
    Norihisa Fujita, Beau Johnston, Ryohei Kobayashi, Keita Teranishi, Seyong Lee, Taisuke Boku, and Jeffrey S. Vetter, “CHARM-SYCL: New Unified Programming Environment for Multiple Accelerator Types,” In Proceedings of the SC '23 Workshops of The International Conference on High Performance Computing, Network, Storage, and Analysis (SC-W '23). Association for Computing Machinery, New York, NY, USA, pp. 1651–1661, Nov. 2023. doi: doi.org/10.1145/3624062.3624244
  • OpenACC Unified Programming Environment for Multi-hybrid Acceleration with GPU and FPGA
    • Boku Taisuke
    • Tsunashima Ryuta
    • Kobayashi Ryohei
    • Fujita Norihisa
    • Lee Seyong
    • Vetter Jeffrey S
    • Murai Hitoshi
    • Nakao Masahiro
    • Tsuji Miwako
    • Sato Mitsuhisa
    Boku, T. et al. (2023). OpenACC Unified Programming Environment for Multi-hybrid Acceleration with GPU and FPGA. In: Bienz, A., Weiland, M., Baboulin, M., Kruse, C. (eds) High Performance Computing. ISC High Performance 2023. Lecture Notes in Computer Science, vol 13999. Springer, Cham. https://doi.org/10.1007/978-3-031-40843-4_49
  • Implementation and Performance Evaluation of Memory System Using Addressable Cache for HPC Applications on HBM2 Equipped FPGAs
    • Fujita Norihisa
    • Kobayashi Ryohei
    • Yamaguchi Yoshiki
    • Boku Taisuke
    Fujita, N., Kobayashi, R., Yamaguchi, Y., Boku, T. (2023). Implementation and Performance Evaluation of Memory System Using Addressable Cache for HPC Applications on HBM2 Equipped FPGAs. In: Singer, J., Elkhatib, Y., Blanco Heras, D., Diehl, P., Brown, N., Ilic, A. (eds) Euro-Par 2022: Parallel Processing Workshops. Euro-Par 2022. Lecture Notes in Computer Science, vol 13835. Springer, Cham. https://doi.org/10.1007/978-3-031-31209-0_9
  • Accelerating Radiative Transfer Simulation on NVIDIA GPUs with OpenACC
    • Kobayashi Ryohei
    • Fujita Norihisa
    • Yamaguchi Yoshiki
    • Boku Taisuke
    • Yoshikawa Kohji
    • Abe Makito
    • Umemura Masayuki
    PDCAT 2022: Parallel and Distributed Computing, Applications and Technologies, 13798 344-358, Apr, 2023
  • FPGA高位合成における演算性能向上のための空間並列性記述に関する研究
    • 佐野 由佳
    • 小林 諒平
    • 藤田 典久
    • 朴 泰祐
    • 佐藤 三久
    佐野 由佳, 小林 諒平, 藤田 典久, 朴 泰祐, 佐藤 三久: ”FPGA高位合成における演算性能向上のための空間並列性記述に関する研究,” 情報処理学会第188回HPC研究報告会, Vol. 2023-HPC-188, No. 22, Jul 2023.
  • Implementation and Performance Evaluation of Collective Communications Using CIRCUS on Multiple FPGAs
    • Kikuchi Kohei
    • Fujita Norihisa
    • Kobayashi Ryohei
    • Boku Taisuke
    Kohei Kikuchi, Norihisa Fujita, Ryohei Kobayashi, and Taisuke Boku. 2023. Implementation and Performance Evaluation of Collective Communications Using CIRCUS on Multiple FPGAs. In Proceedings of the HPC Asia 2023 Workshops (HPCAsia '23 Workshops). Association for Computing Machinery, New York, NY, USA, 15–23. https://doi.org/10.1145/3581576.3581602
  • GPU-FPGA-accelerated Radiative Transfer Simulation with Inter-FPGA Communication
    • Kobayashi Ryohei
    • Fujita Norihisa
    • Yamaguchi Yoshiki
    • Boku Taisuke
    • Yoshikawa Kohji
    • Abe Makito
    • Umemura Masayuki
    Ryohei Kobayashi, Norihisa Fujita, Yoshiki Yamaguchi, Taisuke Boku, Kohji Yoshikawa, Makito Abe, and Masayuki Umemura. 2023. GPU–FPGA-accelerated Radiative Transfer Simulation with Inter-FPGA Communication. In Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region (HPCAsia '23). Association for Computing Machinery, New York, NY, USA, 117–125. https://doi.org/10.1145/3578178.3578231
  • Cygnus - World First Multihybrid Accelerated Cluster with GPU and FPGA Coupling
    • Boku Taisuke
    • Fujita Norihisa
    • Kobayashi Ryohei
    • Tatebe Osamu
    Taisuke Boku, Norihisa Fujita, Ryohei Kobayashi, and Osamu Tatebe. 2023. Cygnus - World First Multihybrid Accelerated Cluster with GPU and FPGA Coupling. In Workshop Proceedings of the 51st International Conference on Parallel Processing (ICPP Workshops '22). Association for Computing Machinery, New York, NY, USA, Article 8, 1–8. https://doi.org/10.1145/3547276.3548629
  • An Open-source FPGA Library for Data Sorting
    • Kobayashi Ryohei
    • Miura Kento
    • Fujita Norihisa
    • Boku Taisuke
    • Amagasa Toshiyuki
    Ryohei Kobayashi, Kento Miura, Norihisa Fujita, Taisuke Boku, Toshiyuki Amagasa, An Open-source FPGA Library for Data Sorting, Journal of Information Processing, 2022, 30 巻, p. 766-777, 公開日 2022/10/15, Online ISSN 1882-6652, https://doi.org/10.2197/ipsjjip.30.766, https://www.jstage.jst.go.jp/article/ipsjjip/30/0/30_766/_article/-char/ja, 抄録: