エピソードメモリダブルアクタークリティックツインディレイドディープデターミニスティックポリシーグラディエント

学術的背景 深層強化学習(Deep Reinforcement Learning, DRL)は、ゲーム、ロボット、ナビゲーション、コンピュータビジョン、金融など、さまざまな分野で顕著な成果を上げています。しかし、既存のDRLアルゴリズムは、一般的にサンプル効率が低いという問題を抱えています。つまり、理想的な性能を達成するためには、大量のデータとトレーニングステップが必要です。特に連続動作タスクでは、状態-アクション空間の高次元性により、従来のDRLアルゴリズムはエピソード記憶(Episodic Memory)を効果的に活用してアクション選択を導くことが難しく、サンプル効率がさらに低下します。 エピソード記憶は、非パラメトリック制御手法の一つであり、高報酬の履歴経験を記憶することでサンプル効率...

監視ビデオにおける異常行動検出のための確率的メモリオートエンコーディングネットワーク

監視ビデオにおける異常行動検出のための確率的メモリオートエンコーディングネットワーク

確率メモリオートエンコーディングネットワークを用いた監視カメラ映像の異常行動検出研究 学術的背景 インテリジェント監視システムにおいて、異常行動検出は、テロ対策、社会の安定維持、公共の安全確保など、極めて重要な機能です。しかし、異常行動検出には核心的な課題があります。それは、通常の行動データと異常行動データの極端な不均衡です。通常の行動データは大量に入手可能ですが、異常行動データは少なく、予測が困難です。この不均衡により、従来の教師あり学習手法では効果的なモデルの訓練が難しくなっています。そのため、大量の通常行動データを活用して通常行動の分布をモデル化し、それに基づいて異常行動を検出する方法の研究が重要な方向性となっています。 近年、深層学習に基づく手法が異常行動検出において顕著な進展を遂げ...

制限付きボルツマンマシンにおけるデータセットフリーの重み初期化

統計力学的分析に基づく制限付きボルツマンマシンの重み初期化手法の研究 学術的背景 深層学習において、ニューラルネットワークの重み初期化はモデルの学習効果に大きな影響を与えます。特に、フィードフォワードニューラルネットワーク(feed-forward neural networks)では、LeCun、Xavier(またはGlorot)、He初期化など、データセットに依存しない重み初期化手法が提案されています。これらの手法は、特定の分布(例えばガウス分布や一様分布)に基づいて重みパラメータの初期値をランダムに決定し、トレーニングデータセットを使用しません。しかし、制限付きボルツマンマシン(Restricted Boltzmann Machine, RBM)では、同様の重み初期化手法はまだ開発され...

視覚と言語の統合によるゼロショット人-物相互作用検出に向けて

視覚と言語の統合によるゼロショット人-物相互作用検出に向けて

視覚-言語統合に基づくゼロショット人間-物体相互作用検出研究 学術的背景 人間-物体相互作用(Human-Object Interaction, HOI)検出は、コンピュータビジョン分野における重要な研究テーマであり、画像内の人間と物体の間の相互作用を識別することを目的としています。従来のHOI検出手法は主に教師あり学習に依存しており、大量の人手によるアノテーションデータを用いてモデルを訓練する必要があります。しかし、この手法は未見の物体カテゴリに対して汎化能力が限られています。さらに、現実世界における人間-物体相互作用は多様で複雑であり、すべての可能な相互作用カテゴリを手動でアノテーションすることは時間と労力がかかります。 近年、視覚-言語モデル(Vision-Language Model...

PrivCore:効率的なプライベート推論のための乗算-活性化共約

深層ニューラルネットワークにおける効率的なプライバシー推論:PrivCoreフレームワークの画期的研究 背景紹介 深層学習技術の急速な発展に伴い、深層ニューラルネットワーク(Deep Neural Networks, DNNs)は画像認識、自然言語処理、医療診断などの分野でますます広く応用されています。しかし、データプライバシーとモデル保護のニーズが高まる中、ユーザーのプライバシーを保護しながら効率的なモデル推論を行う方法が重要な研究課題となっています。従来のプライバシー保護推論手法、例えば安全な多者間計算(Secure Multi-Party Computation, MPC)に基づくプライバシー推論(Private Inference, PI)は、プライバシー保護の面では優れているものの...

低ランクテンソル空間におけるグローバルプロンプトの学習と異種フェデレーテッドラーニング

学術的背景 人工知能(AI)モデルの複雑化とデータプライバシー保護の必要性が高まる中、連邦学習(Federated Learning, FL)は分散型機械学習のパラダイムとして研究の焦点となっています。連邦学習は、複数のクライアントがローカルデータを共有することなく、グローバルモデルを協調的に訓練することを可能にし、データプライバシーを保護しながらモデルの汎化能力を向上させます。しかし、連邦学習は実際の応用において以下の3つの課題に直面しています:1)モデルパラメータが多すぎるために通信負荷が大きい、2)非独立同分布(Non-IID)データによりグローバルモデルの性能が低下する、3)モデルの異質性により従来の連邦集約方法が機能しない。 これらの問題を解決するため、本論文ではFedGPTという...