スペクトル拡散後方サンプリングを用いた多材料分解

スペクトル拡散後続サンプリングに基づく多材料分解に関する研究 背景紹介 医用画像分野では、CT(コンピュータ断層撮影)技術が疾患診断や治療計画に広く利用されています。近年、スペクトルCT(spectral CT)はエネルギー依存の減衰情報を提供できることから注目を集めています。スペクトルCTは複数のエネルギーチャネルの投影データを使用して、異なる材料の密度分布を再構成します。このプロセスは材料分解(material decomposition)と呼ばれます。しかし、材料分解は高度に非線形な逆問題であり、従来の分解方法である解析的分解(analytical decomposition)や反復モデル分解(iterative/model-based decomposition)には計算効率の低さ、...

TryOn-Adapter:高忠実度バーチャルトライオン向けの効率的な細粒度衣類識別適応

TryOn-Adapter:高忠実度バーチャルトライオン向けの効率的な細粒度衣類識別適応

TryOn-Adapter——高効率な細粒度衣装アイデンティティ適応の高忠実度仮想試着 研究背景と課題 近年、仮想試着(Virtual Try-On)技術が広く注目を集めています。その核心的な目標は、与えられた衣服を特定の人物にシームレスに調整し、同時に衣服のパターンやテクスチャを歪めないようにすることです。しかし、現在の拡散モデル(Diffusion Model)に基づいた方法は、衣服のアイデンティティの一貫性を維持する点で顕著な限界があり、全パラメータの微調整を行っても完全に制御するのは困難です。さらに、これらの方法は通常、高いトレーニングコストを必要とするため、その幅広い応用が制限されています。 これらの問題を解決するために、本研究では新しいフレームワーク「TryOn-Adapter」...

スパイキング拡散モデル

脳インスパイア型低エネルギー生成モデル——Spiking Diffusion Models研究評述 背景概説 近年、人工知能分野で多くの先端技術が登場しており、その中でも深層生成モデル(Deep Generative Models, DGMs)は画像やテキストなどのデータ生成において顕著な能力を示しています。しかし、これらの生成モデルは人工ニューラルネットワーク(Artificial Neural Networks, ANNs)を骨格ネットワークとして依存しており、計算リソースとメモリ消費に高度に依存する特性が大規模応用における消費エネルギー問題を顕著化させています。一方で、約20ワットの消費電力で動作する人間の脳と比較して、ANNsのエネルギー効率は明らかに及びません。この点がより高エネル...

LDTrack: 拡散モデルを用いたサービスロボットによる動的人物追跡

拡散モデルを用いたサービスロボットによる動的人物追跡 学術的背景 複雑で混雑した人間中心の環境における動的人物の追跡は、ロボット技術における重要な課題です。特に、遮蔽、姿勢の変化、照明の変化などのクラス内変動が存在する場合、従来の追跡手法では正確な識別と追跡が困難です。既存のロボット追跡手法は、独立した検出と追跡システムに依存しており、計算効率とリアルタイム性の面で課題があります。特に、クラス内変動が大きい場合、検出器の失敗が追跡の中断を引き起こす可能性があります。 これらの問題を解決するため、本論文では、条件付き潜在拡散モデル(Conditional Latent Diffusion Models)に基づく新しいディープラーニングアーキテクチャ——潜在拡散追跡(Latent Diffusi...

AutoStory:最小限の人的努力で多様なストーリーテリング画像を生成する

AutoStory:最小限の人的努力で多様なストーリーテリング画像を生成する

学術的背景と問題提起 ストーリービジュアライゼーション(Story Visualization)は、テキストで記述されたストーリーから一連の視覚的に一貫した画像を生成することを目的としたタスクです。このタスクでは、生成された画像が高品質であるだけでなく、テキストの記述と一致し、異なる画像間でキャラクターのアイデンティティやシーンが一貫している必要があります。ストーリービジュアライゼーションは、芸術創作、児童教育、文化継承などの分野で幅広い応用が期待されていますが、その複雑さから、既存の手法は特定のキャラクターやシーンのみを考慮したり、ユーザーに画像ごとの制御条件(スケッチなど)を提供することを要求したりすることで問題を大幅に簡略化しています。これらの簡略化により、既存の手法は実際のアプリケー...