カリキュラム予測を備えたメモリ支援型知識転送フレームワークを用いた弱教師ありオンライン活動検出

研究背景と研究意義 近年、ビデオ理解分野における弱教師ありオンライン活動検出(Weakly Supervised Online Activity Detection, WS-OAD)は、高度なビデオ理解の重要な課題として広く注目されています。この課題の主な目標は、安価なビデオレベルのアノテーションのみを利用して、ストリーミングビデオ内で進行中の活動をフレーム単位で検出することです。このタスクは、自動運転、公共安全監視、ロボットナビゲーション、拡張現実など、多くの実用的な応用分野で重要な価値を持っています。 完全教師あり手法(Fully Supervised Methods)はオンライン活動検出(OAD)で顕著な進展を遂げましたが、フレームレベルの密なアノテーション(Frame-level A...

低フレームレート動画における多目的トラッキングのための変位不確実性に基づく手法

低フレームレート多目標追跡研究に関する学術報告 序論と研究背景 近年、多目標追跡(MOT:Multi-Object Tracking)技術は、スマートビデオ監視、自動運転、ロボットビジョン分野で広く利用されています。しかし、従来のMOT手法は主に高フレームレートビデオを対象に設計されており、低フレームレートのビデオシナリオでは顕著な課題に直面しています。低フレームレートでは、隣接フレーム間での物体の移動量が増加し、物体の外観や可視性の変化がより激しくなり、検出結果の関連付けやトラックの維持に対してより高い要求が求められます。エッジデバイスは通常、計算、記憶、および伝送帯域幅に制約があるため、低フレームレートビデオは効率的なソリューションとして重要ですが、その技術的課題を解決することが急務です...

少数の注釈付きピクセルとポイントクラウドに基づく運転シーンの弱教師ありセマンティックセグメンテーション

少量のピクセルラベルと点群データを用いた自動車運転シーンの弱教師ありセマンティックセグメンテーション 背景と研究課題 セマンティックセグメンテーションは、コンピュータビジョンにおける重要な課題の一つであり、自動運転などの分野で広く応用されています。しかし、従来の完全教師ありセグメンテーション手法では、大量のピクセル単位のアノテーションが必要であり、そのコストは非常に高いです。 弱教師ありセグメンテーション(Weakly Supervised Semantic Segmentation、WSSS)は、ラベル付きデータが少ない状況で高精度なセグメンテーションを実現することを目的とし、画像ラベルやバウンディングボックス、点レベルのラベルなどの粗いアノテーションを利用して、ピクセル単位のセグメンテー...

バイオメトリクスデータの誤り訂正のための現代的な深層学習技術の再考

現代のディープラーニング技術における生体データのエラー訂正に関する再考 背景 情報技術の発展に伴い、生体データは認証や安全なデータ保管のための重要な要素として利用されています。従来の暗号技術は、均一分布で再現可能なランダム文字列に依存していましたが、指紋や虹彩スキャンのような生体データはそのような特性を備えておらず、生成・保管・取得に課題を抱えています。こうした課題に対処するため、生体データを暗号鍵の生成元として利用する生体認証暗号システム(biometric cryptosystems)が注目されています。しかし、生体データの変動性や外部要因(センサーのノイズなど)により、暗号鍵の正確な復元が困難となり、エラー訂正メカニズムが重要となります。 近年、ディープラーニング(DL)の進展により、...

可視光と赤外線の人物再識別のための適応的中間モダリティ整合学習

可視光と赤外線の人物再識別のための適応的中間モダリティ整合学習

可視光と赤外線を用いたクロスモダリティ学習に基づくAdaptive Middle-Modality Alignment Learning手法の研究 研究背景と課題 スマート監視システムの需要に伴い、可視光と赤外線を利用した人物再識別(Visible-Infrared Person Re-identification, VIReID)は注目を集める研究分野となっています。本課題は、異なるスペクトルモダリティ(可視光と赤外線)に基づいた人物画像をマッチングさせ、24時間対応の人物識別を実現することを目的としています。可視光画像と赤外線画像は異なる光スペクトルから生成されるため、照明、テクスチャ、色などに大きなモダリティ差が存在し、このクロスモダリティマッチングが大きな課題となっています。 従来の...