人工知能-学科-FmRead学術フロンティア

ハイパースペクトルおよびマルチスペクトル画像融合の進展：情報認識トランスフォーマーに基づく展開ネットワーク

情報認識に基づくTransformer展開ネットワークの高次元・多次元画像融合の促進背景紹介高次元画像（Hyperspectral Image, HSI）は、多くの波長帯のスペクトル情報を含むため、物質識別、画像分類、ターゲット検出、環境モニタリングなどのリモートセンシング用途で重要な役割を果たしています。しかし、センサーのハードウェアの制約により、実際のイメージングプロセスでは空間分解能とスペクトル分解能の間のトレードオフが存在します。具体的には、イメージングセンサーは豊富なスペクトル情報を提供する画像（低分解能のHSI、LR-HSI）か、空間分解能が高くスペクトル情報が少ない画像（高分解能の多次元画像、HR-MSI）のいずれかしか提供できません。高分解能のHSI（HR-HSI）を得る...

グラフニューラルネットワークに基づくグラフ最適化問題解決フレームワーク背景と研究動機制約充足問題（CSPs）および組み合わせ最適化問題（COPs）を解決する際、バックトラック法と分枝ヒューリスティックの組み合わせが一般的です。特定の問題に対して設計された分枝ヒューリスティックは理論上効率的ですが、その複雑さと実装の難しさのために実用化が制限されています。一方で、汎用的な分枝ヒューリスティックは適用範囲が広いものの、通常は最適性能を示しません。本稿の著者は、分枝ヒューリスティックにシャノンエントロピー（Shannon Entropy）を導入することで、汎用性と特定性のバランスを取る新しい解決フレームワークを提案しました。具体的には、グラフニューラルネットワーク（GNN）モデルを使用して、確...

代替二重教師自己調整学習による弱監督セマンティック画像分割実現背景紹介コンピュータビジョンの分野の発展に伴い、セマンティック分割はその中で重要かつ活発な研究方向の一つとなっています。従来のセマンティック分割方法は手動でラベリングされたピクセルレベルのラベルに依存していますが、これらの精密なアノテーションの取得には通常多大な人力と時間コストがかかります。この問題を解決するために、近年、弱監督セマンティック分割（Weakly Supervised Semantic Segmentation, WSSS）が提案され、これは人工アノテーションを最小限に抑えつつ、弱いアノテーション情報（画像ラベル、バウンディングボックス、塗りつぶしなど）を利用して効率的なセマンティック分割を実現することを目指して...

背景紹介近年、強化学習（Reinforcement Learning, RL）はさまざまな複雑なタスクの解決においてその有効性を示してきた。しかし、多くの現実世界の意思決定と制御の問題は、複数の相互に対立する目標を含む。これらの目標の相対的な重要性（選好）は、異なる状況でバランスを取る必要がある。パレート最適解（Pareto optimal）の解決策は理想的とされるが、環境の不確実性（例えば、環境の変化や観察ノイズ）は、エージェントが次善の戦略を取ることを引き起こす可能性がある。この問題に対処するために、Xiangkun He、Jianye Haoなどは、《Robust Multiobjective Reinforcement Learning Considering Environme...

GMConv:神経ネットワークの畳み込みカーネルの有効受容野の調整を実現はじめに畳み込みニューラルネットワーク（Convolutional Neural Networks、以下CNN）は、畳み込みカーネルの使用により画像分類や物体検出などのコンピュータービジョンタスクで顕著な成功を収めてきました。しかし、近年ではビジョントランスフォーマー（Vision Transformers、以下ViT）が注目を浴びており、これらは視覚認識タスクで優れた性能を発揮し、時にはCNNを超えることもあります。それにもかかわらず、CNNの改善に向けた取り組みは止まることなく、多くの研究が新しいCNNアーキテクチャの設計に取り組んでいます。特に大きな畳み込みカーネルを使用するCNNは、最新のViTに匹敵する性能...

大脳皮質発話表現に基づくバイリンガル音声神経義肢背景神経義肢の発展の過程では、脳活動から言語をデコードする研究が単一言語のデコードに集中してきました。そのため、バイリンガルによる言語生成が異なる言語の独自または共有された皮質活動にどの程度依存するかはまだ不明です。本研究は、電皮質図（electrocorticography, ECoG）と深層学習および統計的自然言語モデルを組み合わせ、西スペイン語-英語バイリンガル患者の発話運動皮質活動を記録およびデコードし、二つの言語の文に変換します。この研究は、目標言語を手動で指定することなく発話デコードを実現するという実際の応用問題を解決することを目指しています。言語失声症 (anarthria)、すなわち明瞭な発話能力の喪失は、脳卒中や筋萎縮性...

ハイパースペクトルおよびマルチスペクトル画像融合の進展：情報認識トランスフォーマーに基づく展開ネットワーク

グラフ最適化問題のためのグラフニューラルネットワーク駆動ソルバーフレームワーク

代替セルフデュアル教育による弱教師ありセマンティックセグメンテーション

環境の不確実性を考慮した堅牢な多目的強化学習

畳み込みカーネルの有効受容野の変更

言語間で共有された皮質発語表象によって駆動されるバイリンガル音声神経補綴