AV-FOS:自閉症児童のためのFOS-R-III改訂家族観察スケジュールを用いた音声・映像マルチモーダル変換器によるインタラクションスタイル認識

1. 背景紹介:自閉症児童行動モニタリングにおける臨床的困難と技術的展望 自閉症スペクトラム障害(Autism Spectrum Disorder, ASD、以下自閉症)は、生涯にわたる神経発達障害です。近年、米国における自閉症の発症率は急速に上昇しており、疫学データによれば、平均して36人の子供のうち1人が自閉症患者となっています。自閉症の主な特徴は、他者とのコミュニケーションや社会的交流の困難、興味や活動の制限、そして反復的・固執的な行動です。これらの中心的症状は、家庭・学校・社会における日常活動や社会的機能に直接影響を及ぼします。さらに、自閉症に関連する「チャレンジングな行動」(Challenging Behaviors, CBs)—自傷、攻撃、妨害行動など—にも、重大な臨床的関心が寄...

スケーラブルなマルチモーダル表現学習ネットワーク

学術的背景 人工知能の分野において、多モーダル表現学習(Multi-modal Representation Learning, MMRL)は、異なるモーダルからの入力を共有の表現空間にマッピングする強力なパラダイムです。例えば、ソーシャルネットワークでは、ユーザーは画像とテキスト情報を同時に共有することがよくあります。多モーダル表現学習を通じて、モデルはテキスト中の特定の単語や概念と画像中の視覚的パターンとの関係をよりよく理解することができます。このパラダイムは、医療、感情認識などさまざまな分野で広く応用されており、データが通常複数の形式で存在し、多モーダル情報の融合がシステム全体の理解と意思決定能力を向上させることができるためです。 しかし、既存の多モーダル表現学習手法は、高次情報の保持...

ロバストなシーケンシャルディープフェイク検出

学ロバストなシーケンシャルディープフェイク検出 学術的背景 深層生成モデル(GANなど)の急速な発展により、リアルな顔画像を生成することが非常に容易になりました。しかし、この技術の悪用は深刻なセキュリティ問題を引き起こしています。特に、ディープフェイク(Deepfake)技術は、偽の情報を拡散したり、偽のニュースを作成するために使用される可能性があります。この問題に対処するため、研究者たちはさまざまなディープフェイク検出手法を提案してきました。しかし、既存の手法は主に単一の顔操作を検出することに焦点を当てており、簡単に利用できる顔編集アプリケーションの普及により、人々は複数の操作を順番に行うことで顔を改ざんできるようになりました。この新しい脅威に対処するため、一連の顔操作を検出することが重要...