プレスリリース

東京大学AIセンターとの共同研究論文「拡散モデルの潜在表現を用いた画像編集技術」が国際的な学会「WACV 2025」のワークショップに採択

2025.02.27

株式会社電通デジタル（本社：東京都港区　代表取締役社長執行役員：瀧本恒　以下、電通デジタル）は、アドバンストクリエイティブセンター所属の村田秀樹らが東京大学AIセンター（センター長：國吉康夫　研究者：Wu Zilong）と共同研究を行っている「LatentPS: Image Editing Using Latent Representations in Diffusion Models」（拡散モデルの潜在表現を用いた画像編集技術）に関する論文が、国際的なコンピュータービジョンに関する学会「IEEE/CVF Winter Conference on Applications of Computer Vision 2025（以下、WACV 2025）」におけるワークショップに採択されたことをお知らせします。

近年、画像生成AIの技術は飛躍的に進歩し、テキスト入力により高精細な画像生成が可能となりました。しかし、オブジェクトの正確な位置やサイズをテキスト入力のみで制御することは依然として困難な状況です。

このたびの共同研究において電通デジタルと東京大学AIセンターは、画像生成の過程で画像にノイズを与え生成する手法である拡散モデルにおいて、低次元化した画像である潜在表現を直接操作する新たな画像編集手法「LatentPS」を開発し、高速かつ高品質な画像編集を可能にする技術を確立しました。

「LatentPS」の主な特長は以下の通りです。

追加学習や微調整が不要
新たなデータセットや再学習を必要とせず、既存の画像生成AIを活用して編集可能。
高速かつ高品質な画像編集
低次元化した画像である潜在表現を直接操作するため、計算コストが低く高速での画像編集と自然で高品質な編集結果の生成が可能。
簡便な画像編集
オブジェクトの移動・サイズ変更・貼り付けなど、さまざまな要望に簡便に対応可能。

本研究の内容の独創性と有用性が認められ「WACV 2025」ワークショップでの採択に至りました。

電通デジタルでは、AIを活用した企業のマーケティング活動において、Kaggle Grandmaster称号を保有する社員^※1を含むAIのスペシャリストが総合的に支援を行っています。AIを活用したマーケティングソリューションブランド「∞AI^🄬（ムゲンエーアイ）^※2」に本研究内容を基にした機能追加をするなど、今後も最先端の画像生成AI技術を用いた企業の課題解決に寄与する取り組みをさらに加速していきます。引き続き大学やプラットフォーマーとの連携を深めより高度なAI技術を活用した支援を行い、新たな価値の創造を推進してまいります。

※1：電通デジタル社員、国際的AIコンペティション「NBME - Score Clinical Patient Notes」(Kaggle)で優勝、金メダルを受賞（2022年5月18日発表）

※2：∞AI^🄬について

以上

このリリースに関するお問い合わせはこちら

お問い合わせ

東京大学AIセンターとの共同研究論文「拡散モデルの潜在表現を用いた画像編集技術」が国際的な学会「WACV 2025」のワークショップに採択

資料ダウンロード

ニュースレター登録

お問い合わせ