AI×マーケティング

3Dトリックアート、AIが5分で自動生成

米台の研究チームが、視点によって異なる意味を持つ3Dオブジェクトをテキスト指示のみで3〜5分以内に生成するAIフレームワーク「JanusMesh」を発表した。従来比で大幅な時間短縮を実現し、広告・小売・エンターテインメント産業に実用的な応用が見込まれる。

3Dトリックアート、AIが5分で自動生成
広告

国立陽明交通大学などの研究チームが開発した「JanusMesh」は、一つの3Dメッシュオブジェクトが複数の視点から全く異なる意味に見える「3Dビジュアルイリュージョン」を、テキスト入力だけで3〜5分以内に自動生成する手法である。論文は画像認識・コンピュータビジョン分野の査読前論文として公開された。

従来の最適化ベースの手法では同様のコンテンツ生成に数時間を要し、色彩の過飽和という品質上の問題も抱えていた。一方、複数の3Dモデルを単純に貼り合わせる手法は、幾何学的な整合性を欠くため、境界部に不自然な継ぎ目が生じるという課題があった。JanusMeshはこの二つの課題を同時に解決するため、生成プロセスを二段階に分離している。

第一段階では「クロス空間デュアルブランチ・デノイジング」と呼ばれる処理を行う。これは3次元の潜在表現をボクセル空間に動的に変換し、CLIPと呼ばれる画像言語モデルによって各視点の向きを整合させながら、符号付き距離場(SDF)を用いて複数の形状を継ぎ目なく融合するものである。第二段階では、融合した形状に対して視点条件付きのテクスチャ合成モジュールが2次元の拡散モデルの事前知識を投影・集約し、各方向から見た際の外観を高品質に仕上げる。いずれの段階も追加の学習データを必要としない「ゼロショット」設計となっている。

この技術が最も直接的な商業応用をもたらすのは、広告・マーケティング領域である。屋外広告や店頭什器において、通行者の移動方向によって異なるブランドメッセージやキャンペーン情報を表示するインスタレーションを、従来の数分の一のコストと期間で制作できる可能性がある。広告代理店やブランドのクリエイティブ部門にとっては、企画から入稿までのリードタイムという重要KPIの改善に直結する。

小売業においては、店舗ディスプレイや商品パッケージへの応用が考えられる。消費者が商品を手に取り角度を変えるたびに異なる情報やビジュアルが現れる設計は、購買体験の差別化につながる。特に、店頭でのエンゲージメント時間や購買転換率(コンバージョンレート)を重視するFMCG(日用消費財)メーカーや高級品ブランドにとって有効な手段となりうる。

ゲーム・エンターテインメント産業では、謎解きや演出を伴う3Dアセットの制作コスト削減が期待される。ゲーム開発スタジオにおけるアートチームは、視点によって異なる秘密や仕掛けを持つ環境オブジェクトを短時間で量産できるようになり、コンテンツ制作のスループット向上に寄与する。また、テーマパークやイベント会社では物理的なインスタレーションの設計補助ツールとしての活用も見込まれる。

建築・空間デザイン分野においても、プレゼンテーション用モデルとして複数の用途シナリオを一つの模型で表現するといった応用が考えられる。設計事務所やゼネコンの企画提案部門では、提案資料の説得力向上というKPIへの貢献が期待される。

現時点では学術論文の段階であり、商用製品としてのAPIやツール展開は未発表である。生成される形状の複雑さや、三つ以上の視点への対応についても今後の研究課題として残っている。しかし、生成AIが2D画像・動画から3D空間へと拡張する潮流の中で、同技術はデザイン制作の民主化を加速する可能性を持つ。各産業のデジタルコンテンツ部門は、同技術の動向を注視すべき局面にある。

出典: JanusMesh: Fast and Zero-Shot 3D Visual Illusion Generation via Cross-Space Denoising, Siang-Ling Zhang, Huai-Hsun Cheng, Tsung-Ju Yang, Yu-Lun Liu, arXiv:2606.20563v1

本記事はAIにより執筆され、Affectosphere Group が監修しています。

広告