情報科学-学科-FmRead学術フロンティア

研究背景と研究意義近年、ビデオ理解分野における弱教師ありオンライン活動検出（Weakly Supervised Online Activity Detection, WS-OAD）は、高度なビデオ理解の重要な課題として広く注目されています。この課題の主な目標は、安価なビデオレベルのアノテーションのみを利用して、ストリーミングビデオ内で進行中の活動をフレーム単位で検出することです。このタスクは、自動運転、公共安全監視、ロボットナビゲーション、拡張現実など、多くの実用的な応用分野で重要な価値を持っています。完全教師あり手法（Fully Supervised Methods）はオンライン活動検出（OAD）で顕著な進展を遂げましたが、フレームレベルの密なアノテーション（Frame-level A...

動的注意機構を持つ視覚言語Transformerネットワークを用いた歩行者再識別に関する研究報告近年、マルチモーダルベースの歩行者再識別（Person Re-Identification、以下ReID）はコンピュータビジョンの分野で注目を集めています。ReIDは、異なるカメラの視点間で特定の歩行者を識別することを目的としており、行方不明者の捜索や犯罪者の追跡といったセキュリティ・監視アプリケーションにおいて重要な役割を果たします。しかし、マルチモーダルReID技術では、視覚情報とテキスト情報を統合する際に大きな課題が存在し、特に特徴統合の偏りや、モデル性能に影響を与えるドメインギャップ（分布の違い）が問題となっています。本研究は、江西財経大学コンピュータと人工知能学院およびニューカッスル...

StyleAdapter: 統一的なスタイル化画像生成モデル近年、テキストから画像生成（Text-to-Image, T2I）技術および深層学習モデルの急速な発展により、人工知能による画像生成分野での研究が大きく進展しました。しかし、参照画像の特定のスタイルをテキスト生成された高品質画像に統合することは、いまだに大きな課題です。この課題に対応するため、Zhouxia Wangらは「StyleAdapter」と呼ばれる統一的なスタイル化画像生成モデルを提案しました。本論文は、International Journal of Computer Vision に発表され、香港大学、Tencent ARC Lab、マカオ大学、および上海人工知能研究所の研究者たちによって共同執筆されました。研究背...

深層顔認識におけるモデル盗用検出と保護：サンプル相関に基づく革新研究背景と研究課題近年、深層学習技術の急速な発展により、顔認識分野は飛躍的な進歩を遂げています。しかし、同時に商用顔認識モデルは知的財産権の侵害リスクに直面しています。モデル盗用攻撃は、モデルのブラックボックスまたはホワイトボックスアクセスを通じて、同等の機能を持つモデルを複製することを可能にし、モデル所有者の検出を回避します。このような攻撃は、知的財産権の侵害だけでなく、商業利益やプライバシーの安全性にも深刻な脅威をもたらします。この課題に対応するために、モデル指紋法が重要な盗用検出手段として注目されています。従来の方法は主に可搬性のある対抗サンプルを利用してモデル指紋を生成しますが、これらの方法は対抗学習や転移学習に対...

低フレームレート多目標追跡研究に関する学術報告序論と研究背景近年、多目標追跡（MOT：Multi-Object Tracking）技術は、スマートビデオ監視、自動運転、ロボットビジョン分野で広く利用されています。しかし、従来のMOT手法は主に高フレームレートビデオを対象に設計されており、低フレームレートのビデオシナリオでは顕著な課題に直面しています。低フレームレートでは、隣接フレーム間での物体の移動量が増加し、物体の外観や可視性の変化がより激しくなり、検出結果の関連付けやトラックの維持に対してより高い要求が求められます。エッジデバイスは通常、計算、記憶、および伝送帯域幅に制約があるため、低フレームレートビデオは効率的なソリューションとして重要ですが、その技術的課題を解決することが急務です...

深度偽造と顔プライバシー保護に関する研究: Anti-Fake Vaccine の新しいアプローチ背景と研究動機近年、ディープフェイク（Deepfake）技術の進展は、個人のプライバシーおよび社会的安全に対する重大な脅威をもたらしています。ディープフェイク技術の代表的な応用として顔の置き換え技術があり、映画制作やコンピュータゲームなどで広く活用されていますが、その潜在的リスクが次第に顕著になっています。顔の置き換え技術は、元の顔（ソース顔）のアイデンティティ情報をターゲット顔に埋め込むことで、説得力がありながらも欺瞞的な合成画像やビデオを生成します。この技術が普及するにつれて、不正行為者が未承諾のフェイクコンテンツを簡単に作成できるようになり、被害者の名誉や安全が深刻に脅かされています。...

カリキュラム予測を備えたメモリ支援型知識転送フレームワークを用いた弱教師ありオンライン活動検出

人物再識別のための動的注意ビジョン・言語トランスフォーマーネットワーク

StyleAdapter：統一されたスタイライズド画像生成モデル

深層顔認識のためのサンプル相関指紋技術

低フレームレート動画における多目的トラッキングのための変位不確実性に基づく手法

アンチフェイクワクチン：視覚と意味の二重劣化を通じて顔の交換からプライバシーを守る