ロジスティック分布を用いたベルマン誤差のモデリングと強化学習への応用

論文の背景と研究目的 強化学習(Reinforcement Learning, RL)は近年、人工知能分野で非常に活発かつ変革的な分野となっており、その目的はエージェントと環境との相互作用を通じて累積報酬を最大化する能力を実現することです。しかし、実際にRLを応用する際にはベルマン誤差(Bellman Error)の最適化という課題が直面しています。この誤差は深層Q学習などの関連アルゴリズムで特に重要で、従来の方法は主に平均二乗ベルマン誤差(Mean-Squared Bellman Error, MSELoss)を標準の損失関数として使用しています。ただし、ベルマン誤差が正規分布に従うという仮定は、RL応用における複雑な特性を過度に単純化している可能性があります。したがって、本論文はRL訓練...

構造強化型原型整列による教師なしクロスドメインノード分類

構造強化の原型アライメントによる教師なしドメイン適応ノード分類 序論 現代情報技術の発展に伴い、グラフニューラルネットワーク(Graph Neural Networks、GNNs)は複雑なネットワークのノード分類タスクにおいて顕著な成功を収めています。しかし、その一つの大きな課題は大量の高品質なラベルデータを必要とすることです。これはグラフ構造データに対して取得コストが高く、時間もかかります。したがって、豊富なラベルがあるグラフ(ソースドメイン)から知識を完全にラベルのないグラフ(ターゲットドメイン)に移す方法が重要な問題となっています。 研究背景と目的 著者のチームは浙江大学計算機科学学院、浙江省サービスロボット重点実験室、およびシンガポール国立大学計算機科学学院から来ています。彼らは構造...

二段階のカテゴリ整合に基づく教師なしドメイン適応セグメンテーションアルゴリズム

二段階のカテゴリ整合に基づく教師なしドメイン適応セグメンテーションアルゴリズム

语義セグメンテーションは画像内の各ピクセルに対してクラスラベルを予測することを目的としており(Liu et al., 2021; Wang et al., 2021)、シーンの理解、医療画像解析、自動運転、地理情報システム、拡張現実などに広く応用されています(Strudel et al., 2021; Sun et al., 2023)。深層神経ネットワークの発展により、セグメンテーションタスクの性能が大幅に向上しましたが(Chen et al., 2014; Guan et al., 2021; Zhao et al., 2017)、これらの進歩はモデルの訓練に大量のピクセルレベルのアノテーションデータを必要とし、これらのデータの取得は現実の場面では高コストです(Jiang et al.,...

プロトタイプベースのサンプル加重蒸留統一フレームワークが欠落モダリティ感情分析に適応

プロトタイプベースのサンプル加重蒸留統一フレームワークが欠落モダリティ感情分析に適応

プロトタイプに基づくサンプル加重ディスティレーション統一フレームワークの欠損モダリティ感情分析への応用 研究背景 感情分析は自然言語処理(NLP)における重要な分野であり、ソーシャルメディアプラットフォームの発展と共に、人々は短いビデオクリップを通じて感情を表現する傾向が強まっています。これによりマルチモーダルデータが急速に増加しています。しかし、現実生活ではモダリティ欠損の状況がよく発生します。たとえば、音声が失われたり、カメラが遮られたり、音声の転記ミスなどが原因です。このような状況では、欠損モダリティの感情分析が重要であり、かつ困難な課題となります。マルチモーダルの異質性は、すべてのモダリティをマルチモーダルネットワーク上で同じ目標に最適化しようとするときに、特にモダリティ欠損の場合に...

効率的なテンソル分解に基づくフィルタプルーニング

背景介紹 ネットワークプルーニング(Network Pruning)は、効率的な畳み込みニューラルネットワーク(CNNs)モデルを設計するための重要な技術です。メモリ使用量と計算要求を削減しつつ、全体的なパフォーマンスを維持または向上させることで、リソース制限のあるデバイス(携帯電話や組み込みシステムなど)でのCNNsの展開が実現可能になります。現在の仮定は、多くのモデルパラメータが過剰であり、大量の不必要または冗長なパラメータを含んでいるというもので、これらの冗長パラメータを削除することで、より小さくて効率的なモデルを生成できます。これはリソース制限のあるデバイスにだけでなく、場合によってはモデルの汎化能力を向上させることもあります。 既存のプルーニング手法の中で、フィルタープルーニング(...

複数の変数時系列異常検出のための二重メモリーモジュールを備えた堅牢なマルチスケール特徴抽出フレームワーク

複数の変数時系列異常検出のための二重メモリーモジュールを備えた堅牢なマルチスケール特徴抽出フレームワーク

深層学習技術の急速な発展に伴い、データマイニングと人工知能トレーニング技術の実際のアプリケーションにおける重要性が日々増しています。特に多変量時系列異常検出の分野では、既存の手法は優れた性能を示していますが、ノイズや汚染されたデータに直面した際には、依然として顕著な問題が存在します。これに基づき、本論文では、上記の課題を解決するための二重メモリモジュールを持つマルチスケール特徴抽出フレームワークを提案しています。 研究背景 多変量時系列(Multivariate Time Series, MTS)データは通常、IoT(モノのインターネット)アプリケーションにおける複数のセンサーのリアルタイムの動作状態を含みます。これらのデータを効果的に分析することで、隠れた情報を明らかにし、異常状況を予測し...