損失関数最適化を用いた改良型生成敵対ネットワークによる雨痕除去

学術的背景 コンピュータビジョン分野において、雨筋(rain streaks)は特に屋外監視、自動運転、インテリジェント交通システムにおいて一般的な干渉要因です。雨筋は画像品質を著しく低下させ、視覚システムの識別および分析能力に影響を与えます。従来の雨筋除去手法は通常、単一の画像に依存して処理を行いますが、雨筋の複雑さと多様性のため、遠距離の雨筋や複雑なシーンを処理する際に効果が限られています。近年、深層学習技術、特に生成敵対ネットワーク(Generative Adversarial Networks, GANs)は画像処理分野で大きな可能性を示しています。しかし、既存のGANベースの雨筋除去手法は、異なる方向、形状、透明度の雨筋を処理する際に課題が残っています。そのため、本研究は、雨筋をよ...

ユーティリティと動的ローカライゼーションプロセスに基づく3ウェイ意思決定アプローチ:円形Q-rung orthopairファジィ集合における大規模言語モデルのランキングとグレーディング

学術的背景 人工知能(AI)と自然言語処理(Natural Language Processing, NLP)の急速な発展に伴い、大規模言語モデル(Large Language Models, LLMs)は学術界と産業界で顕著な進歩を遂げています。しかし、LLMsが複数のNLPタスクで優れた性能を発揮しているにもかかわらず、すべてのタスクを同時に満たす単一のモデルはまだ存在しません。この多様なタスク要件と評価基準の複雑さにより、LLMsの評価は多基準意思決定(Multi-Criteria Decision-Making, MCDM)問題となっています。従来のMCDM手法はランキングを行うことができますが、不確実性、タスクの優先順位、データの変動性などの点で限界があり、特にバイナリデータを扱う...

ゲシュタルト理論に基づく視覚的注意のモデリング

背景紹介 コンピュータビジョン分野において、視覚的注意モデルの研究は、人間の視覚システムが画像や自然シーンから関心領域を選択する方法をシミュレートすることを目的としています。人間の脳は、視覚シーン内の顕著な領域を迅速かつ正確に識別する能力を持っており、この能力は画像処理、物体認識、画像セグメンテーションなどのタスクにおいて重要な意義を持ちます。しかし、画像内の複数の顕著な物体を効果的に検出することは依然として挑戦的な問題です。 ゲシュタルト理論(Gestalt Theory)は、現代の認知学習理論の基礎であり、「全体は部分の総和よりも大きい」と強調し、その中でも類似性(similarity)と近接性(proximity)は重要な原則です。ゲシュタルト理論は視覚知覚研究に重要な理論的基盤を提供...

区間集合の非類似度尺度と可能性度に基づく改良代替キューイング方法と多専門家多基準意思決定への応用

学術的背景と問題の導入 多専門家多基準意思決定(Multi-Expert Multi-Criteria Decision-Making, MEMCDM)の分野において、不確実性と不正確な情報を効果的に処理することは常に核心的な課題です。特に、複数の専門家と複数の意思決定基準が関わる複雑なシナリオでは、専門家の意見がしばしば対立し、意思決定プロセスを複雑化させます。この問題に対処するため、研究者たちは区間集合(Interval Sets)に基づく意思決定手法を提案してきました。区間集合は上下限の集合を通じて、不確実な定性的情報をより包括的に記述することができます。しかし、既存の区間集合に基づく意思決定手法、特に代替キューイング法(Alternative Queuing Method, AQM)...

注意機構を有する多層サブワード共同学習による中国語単語埋め込み

学術的背景 近年、中国語の単語ベクトル(Chinese Word Embedding)は自然言語処理(Natural Language Processing, NLP)の分野で注目を集めています。英語とは異なり、中国語の文字構造は複雑で多様であり、これが意味表現に独特の課題をもたらしています。従来の単語ベクトルモデル(例:Word2Vec)は中国語を処理する際、漢字内部の微妙な意味情報を十分に捉えることができず、特に異なるレベルのサブワード情報が意味に与える貢献の違いを無視しがちです。例えば、漢字は画数、部首、ピンインなどの複数のサブコンポーネントで構成されており、これらのサブコンポーネントは異なる文脈において意味理解に重要な役割を果たします。しかし、既存のモデルはこれらの情報を処理する際、...

多視点非グラフデータにおける半教師あり学習のためのグラフ畳み込みネットワークの活用

背景紹介 機械学習の分野において、半教師あり学習(Semi-Supervised Learning, SSL)は、少量のラベル付きデータと大量のラベルなしデータを活用できるため、注目を集めています。特に、データのラベル付けコストが高いシナリオでは、グラフベースの半教師あり学習手法が研究の焦点となっています。グラフ畳み込みネットワーク(Graph Convolutional Networks, GCNs)は、半教師あり学習において優れた性能を発揮し、特に引用ネットワークやソーシャルネットワークなどのグラフ構造を持つデータにおいて顕著です。しかし、GCNsを非グラフ構造のマルチビューデータ(例えば画像コレクション)に適用する際には、まだ大きなギャップが存在します。 マルチビューデータ(Multi...