AI×製造

粒子追跡AIが推論速度38倍、加速器の実時間処理に道

米欧の研究チームが開発した粒子追跡用AIアーキテクチャ「HEPTv2」が、従来手法比で推論速度を最大52倍に高めつつ精度を向上させた。次世代大型ハドロン衝突型加速器の実時間データ処理を可能にし、科学計算基盤と半導体設計の両分野に波及効果をもたらす。

粒子追跡AIが推論速度38倍、加速器の実時間処理に道
広告

米カーネギーメロン大学、パデュー大学、カリフォルニア大学サンディエゴ校などの共同研究チームは、高エネルギー物理実験における荷電粒子の軌跡再構成を単一の学習可能なパイプラインで実現するトランスフォーマーモデル「HEPTv2」を発表した。標準的なベンチマーク「TrackML」において追跡効率98.6%、誤検出率0.8%を達成しつつ、NVIDIAのA100 GPUで1イベントあたり推論時間約15ミリ秒、ピークメモリ使用量0.4GBという性能を示した。

粒子追跡とは、加速器内の衝突実験で生じる数万から数十万点の検出器ヒットデータから、各粒子の飛跡を復元する作業である。従来はグラフニューラルネットワーク(GNN)が主流だったが、グラフの構築と処理に膨大な計算コストがかかる上、トランスフォーマーを用いた手法も補助的な前処理段階が必要で、一貫した最適化ができなかった。HEPTv2は局所性鋭敏型ハッシュ(LSH)を活用した点エンコーダーと、グラフ構築を排したトラックデコーダーを統合し、エンドツーエンドで学習できる構造を実現した。処理速度は最強の既存トランスフォーマー比で7倍、最適化済みGNNパイプライン比で38〜52倍に向上している。

この技術革新が直接的に影響するのは、2020年代後半の稼働が見込まれる高輝度大型ハドロン衝突型加速器(HL-LHC)向けのリアルタイムデータ処理基盤である。HL-LHCでは衝突密度が現行比で5〜7倍に増加するため、既存のトリガーシステムでは物理的に処理が追いつかないとされてきた。HEPTv2の線形スケーリング特性は、ヒット数が50万点に達する環境でも安定した推論を可能にすると論文は示しており、CERNや各国の実験施設が直面する計算コスト削減という経営課題に直接応える成果といえる。

ビジネスへの波及効果は科学計算の領域にとどまらない。第一に、医療画像診断の分野では、PET(陽電子放射断層撮影)やSPECT装置が検出器ヒットデータから粒子の飛跡を復元するプロセスと、粒子追跡の数理構造は本質的に類似している。装置メーカーの画像処理部門やアルゴリズム開発チームにとって、HEPTv2のアーキテクチャは画質向上と処理速度の両立を図る際の有力な参照モデルとなり得る。スキャン1件あたりの再構成時間(レイテンシKPI)やスループットの改善に直結する可能性がある。

第二に、自動運転・ロボティクス向けの点群処理技術との親和性が高い。LiDARセンサーが出力する三次元点群データの高速解析は自律走行車の安全性に関わるKPIであり、局所的な幾何学情報を保持しながら効率的なアテンション計算を行うHEPTv2のエンコーダー設計は、車載AIチップの演算効率改善に応用できる可能性がある。Tier1サプライヤーや半導体設計企業のR&D部門が注目すべき知見である。

第三に、クラウドコンピューティングおよびHPCサービス事業者にとっては、AIワークロードのGPUメモリ効率化という観点で意義がある。HEPTv2はA100で0.4GBという低メモリフットプリントを実現しており、同一GPUで並列処理できるジョブ数の増加、すなわちGPU稼働率(利用効率KPI)の向上につながる設計思想を示している。データセンター運用コストの最適化を検討するインフラ部門にとって、実装上の参考事例となる。

今後の課題としては、実際の加速器環境における磁場変動やセンサーノイズへの対応、およびFPGAやASICへの実装最適化が挙げられる。研究チームは今後、CERNの実験トリガーシステムへの統合を念頭に置いた検証を進めるとしており、2020年代後半の実用展開に向けた産学連携が加速するとみられる。

出典: HEPTv2: End-to-End Efficient Point Transformer for Charged Particle Reconstruction, Siqi Miao, Shitij Govil, Jack P. Rodgers, Mia Liu, Javier Duarte, Shih-Chieh Hsu, Yuan-Tang Chou, Pan Li, arXiv:2606.20437v1

本記事はAIにより執筆され、Affectosphere Group が監修しています。

広告