CANet:コンテキストを考慮したマルチビューステレオネットワークによる効率的なエッジ保存深度推定

学術的背景と問題提起 多視点ステレオビジョン(Multi-View Stereo, MVS)は、3Dコンピュータビジョンの基本的なタスクであり、複数の視点からの画像からシーンの3Dジオメトリを復元することを目的としています。この技術は、ロボティクス、シーン理解、拡張現実などの分野で広く応用されています。近年、学習ベースのMVS手法は、粗から細かい深度推定フレームワークを採用することで大きな進歩を遂げています。しかし、既存の手法は、無テクスチャ領域、物体の境界、および薄い構造領域での深度復元に依然として困難を抱えています。主な理由としては、低テクスチャ領域でのマッチング手がかりの識別性の低さ、コストボリューム正則化に使用される3D畳み込みニューラルネットワーク(3D CNN)の本質的な平滑化特...

長尾画像認識における単純性バイアスの深掘り

学術的背景と問題提起 近年、深層ニューラルネットワークは、画像認識、物体検出、セマンティックセグメンテーションなどのコンピュータビジョン分野で顕著な進展を遂げています。しかし、長尾分布(long-tailed distribution)データに直面した場合、最も先進的な深層モデルでさえも性能が低下します。長尾分布とは、データセット内の少数クラス(tail classes)のサンプル数が多数クラス(head classes)のサンプル数に比べてはるかに少ない状況を指します。このデータ不均衡問題は、パイプライン故障検出や顔認識などの多くの実用的なアプリケーションで普遍的に見られます。 長尾画像認識の主な課題は、データ不均衡問題を効果的に処理し、特に少数クラスの汎化性能を向上させることです。一般的...

関係性に基づく多機能正則化を用いた連携半教師あり学習

学術的背景と問題提起 データプライバシーの問題がますます深刻化する中、連邦学習(Federated Learning, FL)は、分散型の機械学習パラダイムとして注目を集めています。連邦学習は、複数のクライアントがデータを共有することなく、協調してグローバルモデルを訓練することを可能にし、データプライバシーを保護します。しかし、既存の連邦学習手法は、各クライアントのデータが完全にラベル付けされていることを前提としていますが、これは実際のアプリケーションでは現実的ではありません。特に、ラベル付け能力が限られている場合には、この前提は成り立ちません。この問題を解決するために、連邦半教師あり学習(Federated Semi-Supervised Learning, FSSL)が提案されました。F...

ソースフリードメイン適応のためのクラスバランス型多中心動的プロトタイプ擬似ラベリング

学術的背景と問題提起 近年、深層学習モデル(Deep Neural Networks, DNNs)はコンピュータビジョンタスクにおいて顕著な成功を収めていますが、これらのモデルの訓練には大量の注釈付きデータが必要です。しかし、モデルが新しい未注釈のターゲット領域に適用される場合、領域差(domain shift)によりモデルの汎化能力が低下することがよくあります。この問題を解決するために、ドメイン適応(Domain Adaptation, DA)技術が登場しました。ドメイン適応の目標は、ソース領域の知識を活用して、ターゲット領域でのモデルのパフォーマンスを向上させることであり、特にターゲット領域に注釈データがない場合に有効です。 しかし、従来のドメイン適応手法は通常、ソース領域の生データにア...

半教師あり医療画像セグメンテーションのための予測とマスク

半監督医療画像セグメンテーションにおけるPICKモデルの応用 学術的背景 医療画像セグメンテーションは、臨床実践において重要な意義を持ち、医師に臓器や腫瘍の体積、位置、形状などの重要な情報を提供します。近年、深層学習に基づくモデルは医療画像セグメンテーションタスクで優れた性能を示していますが、これらのモデルは通常、大量の注釈付きデータを必要とします。しかし、医療画像の注釈は専門の臨床医師が必要であり、これらの注釈データを取得するには時間とコストがかかります。そのため、限られた注釈データでモデルの性能を向上させる方法が重要な研究課題となっています。 半教師あり学習(Semi-Supervised Learning, SSL)は、限られた注釈データと大量の未注釈データを同時に活用することで、この...

ロバストなシーケンシャルディープフェイク検出

学ロバストなシーケンシャルディープフェイク検出 学術的背景 深層生成モデル(GANなど)の急速な発展により、リアルな顔画像を生成することが非常に容易になりました。しかし、この技術の悪用は深刻なセキュリティ問題を引き起こしています。特に、ディープフェイク(Deepfake)技術は、偽の情報を拡散したり、偽のニュースを作成するために使用される可能性があります。この問題に対処するため、研究者たちはさまざまなディープフェイク検出手法を提案してきました。しかし、既存の手法は主に単一の顔操作を検出することに焦点を当てており、簡単に利用できる顔編集アプリケーションの普及により、人々は複数の操作を順番に行うことで顔を改ざんできるようになりました。この新しい脅威に対処するため、一連の顔操作を検出することが重要...