人工知能-学科-FmRead学術フロンティア

神経集団活動の時間的ダイナミクス制約：ブレイン・コンピュータ・インターフェースが明らかにした神経計算メカニズム学術的背景脳の神経活動が時間とともにどのように進化するかは、知覚、運動、認知機能を理解する上での核心的な問題の一つです。長い間、神経ネットワークモデルでは、脳の計算プロセスがネットワーク接続によって形成される神経活動の時間的経過を含むと考えられてきました。この見方は、神経活動の時間的経過が破ることが難しいものであるべきだという重要な予測を立てています。しかし、この予測が実際の生物学的神経ネットワークにおいて成立するかどうかは、まだ直接検証されていません。この問題に答えるために、研究チームはブレイン・コンピュータ・インターフェース（Brain-Computer Interface,...

神経メカニズムと関係学習：ニューラルネットワークにおける迅速な知識再構築背景紹介人間や動物は、限られた経験から項目間の関係（刺激、物体、イベントなど）を学ぶ驚異的な能力を持っており、構造化された一般化と迅速な情報統合を可能にします。この関係学習の基本となるのが順序学習で、推移的推論（例えば、a > b かつ b > c ならば a > c）やリストリンク（例えば、a > b > c と d > e > f が c > d を知ることで a > b > c > d > e > f に迅速に再構築される）を可能にします。この分野は長年研究されてきましたが、推移的推論と迅速な知識再構築の神経生物学的メカニズムは未だ不明確です。本論文では、神経変調を備えたシナプス可塑性（自己指向学習を可能にする...

豊富な帰納的バイアスを用いた視覚と言語モデルの学習研究背景と問題提起近年、視覚と言語モデル（Vision-Language Models, VLMs）は、コンピュータビジョンおよび自然言語処理の分野で顕著な進展を遂げています。これらのモデルは大規模な画像-テキストペアに基づいて事前学習され、統一されたマルチモーダル表現空間を構築し、多様な下流タスクで優れたパフォーマンスを発揮します。しかし、少数ショット学習（few-shot learning）のシナリオでは、特定のタスクに適応させつつ良好な汎化能力を維持するためには、これらのモデルを効果的に調整する方法が依然として解決すべき課題となっています。既存の手法は通常、プロンプトエンジニアリング（prompt engineering）やパラメ...

一般的な哺乳動物の姿勢推定に関する研究の進展研究背景と問題提起コンピュータビジョンの分野では、姿勢推定は基礎的かつ重要なタスクであり、その目標は画像内の対象オブジェクトのキーポイント位置を特定することです。近年、人間の姿勢推定において顕著な進展が見られましたが、動物の姿勢推定（Animal Pose Estimation）の研究はまだ初期段階にあります。人間の姿勢推定と比較して、動物の姿勢推定は主に以下の点で大きな課題を抱えています。種の多様性：異なる種間での外観や姿勢の違いが非常に大きい。例えば、ネコ科動物の中でもヒョウと家猫は形状、サイズ、色において顕著な違いがあります。データの希少性：既存の動物姿勢データセットの規模は、人間の姿勢データセットよりもはるかに小さい。例えば、最大の...

SEAFormer++——モバイルビジョン認識のための効率的なTransformerアーキテクチャ研究背景と問題提起近年、コンピュータビジョン分野では、畳み込みニューラルネットワーク（CNN）からTransformerベースの手法への大きな変革が起こりました。しかし、Vision Transformerは多くのタスクで優れたグローバルコンテキストモデリング能力を示す一方で、その高い計算コストとメモリ要件により、特に高解像度画像を扱う場合、モバイルデバイスへの展開が困難です。低遅延と高効率を求めるモバイルデバイスに対応するため、研究者たちは局所注意機構、軸方向注意（Axial Attention）、動的グラフメッセージパッシングなどの軽量化手法を提案してきました。しかし、これらの方法でも高...

統一レイアウト生成研究の新突破：より小さくても強力な大規模言語モデル研究背景と問題提起レイアウト生成（Layout Generation）は、コンピュータビジョンおよびヒューマンコンピュータインタラクション分野において重要な研究テーマであり、特定のニーズに適合するグラフィカルインターフェースやページレイアウトをアルゴリズムによって自動生成することを目指しています。例えば、科学論文、アプリケーションインターフェース（App UI）、雑誌ページ、スライドのデザインには、効率的かつ柔軟なレイアウト生成手法が必要です。しかし、従来の手法は通常、単一タスクまたは単一領域に最適化されており、タスク間や領域間での汎用性に欠けています。深層学習技術の発展に伴い、Transformerアーキテクチャに基づ...

神経集団活動の動的制約

可塑的な神経ネットワークにおける関係学習と迅速な知識再編成の神経メカニズム

豊富な帰納バイアスを用いた視覚言語モデルの学習

キーポイントインタラクティブトランスフォーマーを用いた構造支援依存関係の学習による一般哺乳動物のポーズ推定

Seaformer++：モバイル視覚認識のためのスクイーズ強化軸変換器

より小さいがより良い：より小さい大規模言語モデルによるレイアウト生成の統一