適応的に適切でない領域を特定および改善して正確なステレオマッチングを実現する

適応的に適切でない領域を特定および改善して正確なステレオマッチングを実現する

不良領域を適応的に識別および最適化して正確なステレオマッチングを実現 研究の背景と動機 コンピュータービジョン技術の急速な発展に伴い、ステレオマッチング技術はその高い精度、コスト効率、および非侵入性から、ロボティクス、宇宙、自動運転、産業製造など多くの分野で重要な役割を果たしています。しかし、オクルージョン領域やぼやけた領域を処理する際、ピクセル間の一致制約が信頼できなくなり、対応関係の探索が困難になります。そのため、畳み込みニューラルネットワーク(CNN)やトランスフォーマーベースの研究が急速に進展しているにもかかわらず、多くの方法が不良領域の処理において性能のボトルネックに直面しています。この課題に対処するため、研究チームはエラー領域特徴最適化メカニズムを導入して文脈特徴を提供し、不良領...

非独立同分布データを用いた多中心疾患診断のためのモデル投影による連合学習

非独立同分布データを用いた多中心疾患診断のためのモデル投影による連合学習

モデルプロジェクションを使用したフェデレーテッドラーニングによる多センター疾病診断 背景紹介 医療画像技術の急速な発展に伴い、自動化診断方法の研究は単一センターデータセットで良好な性能を示しています。しかし、これらの方法は実際の応用では他の医療機関のデータに一般化しにくいことが多いです。主な理由は、これらの方法が異なる医療センターのデータを独立同分布(IID)と仮定しているが、実際には異なるセンターが異なるスキャナーや画像パラメータを使用しているため、データ分布が非独立同分布(Non-IID)であることです。さらに、異なるセンターで診断される患者の数や種類にも大きな差があります。したがって、多センターのデータは異質性を持ち、集中化学習(Centralized Learning)では効果的に解...

制約付き非ゼロ和ゲームのための適応サンプリング人工-実際制御

制約システムの非ゼロ和ゲームにおける適応サンプリング人工・実際制御の応用 背景 現代の工業および研究分野におけるスマート技術と制御システムの急速な発展により、従来の制御方法がシステムの安定性を保証し、エネルギー消費を最小化するという厳しい要求を満たすことが困難になっています。実際のシステムは通常非常に複雑で、少なくとも2つの制御ユニットを含んでおり、コンポーネント間には複雑な競争と協力の関係があります。このような状況では、設計された制御スキームは単一のコントローラーの利益最大化だけでなく、全体の最適化も実現する必要があります。このような問題は通常、非ゼロ和ゲーム(Non-Zero-Sum Games,NZSG)とみなされ、多物理入力の制約条件下でシステムのカップリングダイナミクスを処理するこ...

テキスト認識型クロスモーダルコントラストデザンタングリングによるマルチグレインビジュアルピボットガイドのマルチモーダルニューラルマシントランスレーション

テキスト認識型クロスモーダルコントラストデザンタングリングによるマルチグレインビジュアルピボットガイドのマルチモーダルニューラルマシントランスレーション

多尺度視覚中枢ガイドの多モーダル神経機械翻訳:テキスト認識のクロスモーダル対比デカップリング 学術背景 多モーダル神経機械翻訳(Multi-Modal Neural Machine Translation, MNMT)は、言語に依存しない視覚情報をテキストに導入して機械翻訳の性能を向上させることを目指しています。しかし、画像とテキストはモーダル間で顕著な差異があるため、両者間では避けられない意味の不一致が発生します。これらの問題を解決するための目標は、分解された多尺度視覚情報をクロスランゲージ中枢として使用することにより、異なる言語間のアライメントを向上させ、MNMTのパフォーマンスを改善することです。 論文情報 この論文は朱俊俊、蘇瑞および葉俊杰などの研究者によって執筆され、著者はそれぞれ...

自律型ドローンのための完全ニューロモルフィックビジョンおよび制御

自律型ドローンのための完全ニューロモルフィックビジョンおよび制御

完全なニューロモルフィックビジョンとコントロールを持つ自律飛行体 背景と研究動機 過去10年間で、ディープニューラルネットワーク(ANNs)は人工知能分野で大きな進展を遂げ、とりわけ視覚処理において顕著な成果を上げました。しかし、これらの高度な視覚処理技術は高精度を実現する一方で、多大な計算リソースとエネルギーを消費するため、小型飛行ロボットなどリソースが限られた場合には応用が難しいです。 この問題に対処するために、ニューロモルフィックハードウェアは生物の脳のスパースで非同期的な特性を模倣することで、より効率的な認識と処理能力を実現しました。ロボット分野では、ニューロモルフィックハードウェアに含まれるイベント駆動カメラとスパイキングニューラルネットワーク(SNNs)が低遅延・低エネルギー消費...

深層強化学習による二足歩行ロボットの敏捷なサッカースキルの学習

深層強化学習による二足歩行ロボットの敏捷なサッカースキルの学習

深層強化学習で二足ロボットに敏捷なサッカースキルを付与 背景説明 エージェントが物理世界で敏捷性、柔軟性、理解力を示すことは、人工知能(Artificial Intelligence, AI)研究の長年の目標の一つです。しかし、動物や人間は複雑な身体の動きを流暢にこなすだけでなく、環境を感知し理解し、身体を使って世界で複雑な目標を達成することができます。歴史的に、複雑な運動能力を持つ知的な身体エージェントを作ろうとする試みは長く続いており、それはシミュレーション環境でも現実の環境でも同様です。近年の技術の急速な進歩、特に学習に基づく方法論の進展により、深層強化学習(Deep Reinforcement Learning, Deep RL)が、シミュレーションキャラクターでも物理ロボットでも、...