YOLOv8を使用したリアルタイム密集群衆異常行動検出の強化フレームワーク

学術的背景 公共安全の需要が日増しに高まる中、特にメッカ巡礼(Hajj)のような大規模な宗教行事において、密集した群衆の中での異常行動の検出は重要な課題となっています。既存の検出方法は、遮蔽、照明の変化、統一された服装などの複雑な条件下でしばしば性能が低下し、検出精度が低下する傾向があります。これらの課題に対応するため、研究者たちは、リアルタイム監視の精度と効率を向上させるためのより先進的なコンピュータビジョン技術の開発に取り組んでいます。 本研究の核心は、改良されたYOLOv8モデルであるCrowd Anomaly Detection Framework (CADF)を提案し、Soft-NMS(非極大値抑制のソフト版)技術を統合することで、複雑な環境下での検出精度を大幅に向上させた点にあり...

ファジィラフ反復計算モデルによる単細胞RNA-seqデータの遺伝子選択

背景紹介 単細胞RNAシーケンス(single cell RNA-seq, scRNA-seq)技術は、近年、生物医学研究において広く利用されています。この技術は、単一細胞における遺伝子発現の異質性を明らかにし、細胞タイプ、細胞状態、および疾患メカニズムの理解に重要なツールを提供します。しかし、scRNA-seqデータは、サンプルサイズが小さく、高次元で、ノイズが多いという特徴を持っており、クラスタリングや分類の前に遺伝子選択を行うことが必要です。従来の統計分析や機械学習手法は、高次元データを扱う際に「次元の呪い」に直面することが多いため、膨大な遺伝子から代表的な遺伝子を効果的に選択する方法が、現在の研究の焦点の一つとなっています。 この問題を解決するため、本論文の著者らは、ファジィラフ反復...

スケーラブルなマルチモーダル表現学習ネットワーク

学術的背景 人工知能の分野において、多モーダル表現学習(Multi-modal Representation Learning, MMRL)は、異なるモーダルからの入力を共有の表現空間にマッピングする強力なパラダイムです。例えば、ソーシャルネットワークでは、ユーザーは画像とテキスト情報を同時に共有することがよくあります。多モーダル表現学習を通じて、モデルはテキスト中の特定の単語や概念と画像中の視覚的パターンとの関係をよりよく理解することができます。このパラダイムは、医療、感情認識などさまざまな分野で広く応用されており、データが通常複数の形式で存在し、多モーダル情報の融合がシステム全体の理解と意思決定能力を向上させることができるためです。 しかし、既存の多モーダル表現学習手法は、高次情報の保持...

マルチビューデータのワンステップクラスタリングのための二重表現学習

現実世界のアプリケーションにおいて、マルチビューデータ(multi-view data)は広く存在しています。マルチビューデータとは、複数のソースや複数の表現方法を通じて収集されたデータを指します。例えば、同じニュースストーリーの異なる言語版や、異なる医学検査手段を通じて得られた疾患データなどが挙げられます。マルチビュー学習(multi-view learning)は、マルチビューデータを掘り下げるための効果的な方法であり、その中でもマルチビュークラスタリング(multi-view clustering)はマルチビュー学習の重要な構成要素として、近年ますます注目を集めています。しかし、効果的なマルチビューデータマイニング手法を設計し、それをより特定のタスクに適応させることは、依然として挑戦的...

深層学習における損失関数と性能指標の包括的調査

ディープラーニング(Deep Learning)は、人工知能分野の重要な一分野として、近年コンピュータビジョンや自然言語処理など多くの分野で顕著な進展を遂げています。しかし、ディープラーニングの成功は、損失関数(Loss Function)と性能指標(Performance Metrics)の選択に大きく依存しています。損失関数は、モデルの予測と真の値との差異を測定し、モデルの最適化プロセスを導くために使用されます。一方、性能指標は、未見のデータに対するモデルの性能を評価するために使用されます。損失関数と性能指標はディープラーニングにおいて極めて重要ですが、多くの選択肢があるため、研究者や実務者は特定のタスクに最適な方法を決定することが難しいことがしばしばあります。 このため、本稿では、ディ...

AI駆動型クラウドコンピューティングにおけるジョブスケジューリング:包括的レビュー

学術的背景 クラウドコンピューティング技術の急速な発展に伴い、動的で異種混在のクラウド環境において効率的なジョブスケジューリングの需要が高まっています。従来のスケジューリングアルゴリズムは単純なシステムでは良好な性能を発揮しますが、現代の複雑なクラウドインフラストラクチャではその要件を満たすことができません。クラウド環境におけるリソースの異種混在性、エネルギー消費、リアルタイム適応性などの問題は、研究者に人工知能(AI)を基盤としたソリューションの探求を促しています。AI駆動のジョブスケジューリング技術は、機械学習、最適化技術、ヒューリスティック技術、およびハイブリッドAIモデルを通じて、より高い適応性、拡張性、エネルギー効率を提供します。本稿は、AI駆動のジョブスケジューリング技術を包括的...

ピタゴラス言語情報に基づくグリーンサプライヤー選択:量子グループ意思決定手法とMULTIMOORAアプローチ

世界的な環境問題が深刻化する中、企業はサプライチェーン管理においてますますグリーンで持続可能な発展を重視しています。グリーンサプライチェーン管理(Green Supply Chain Management, GSCM)は、企業の競争力を高め、持続可能な成長を実現するための重要な手段となっています。しかし、グリーンサプライヤーの選定(Green Supplier Selection, GSS)は、複数の意思決定者の異なる意見と不確実性を伴う複雑な多基準グループ意思決定問題(Multicriteria Group Decision-Making, MCGDM)です。従来のMCGDM手法は、専門家の意見の信頼性と曖昧さを扱うのに十分ではなく、現実の複雑な状況を正確に反映することが難しいです。 この...

ナノモノのインターネットにおける機械学習アプリケーションの包括的レビュー:課題と将来の方向性

学術的背景 近年、ナノテクノロジーとモノのインターネット(IoT)の急速な発展により、革命的な分野であるナノモノのインターネット(IoNT)が誕生しました。ナノモノのインターネットは、ナノスケールのデバイスをインターネットに接続し、農業、軍事、マルチメディア、医療などの分野で重要な役割を果たすことができます。しかし、ナノモノのインターネットと機械学習(ML)の両方が著しい進歩を遂げているにもかかわらず、これらをどのように組み合わせるかに関する包括的な研究は比較的不足しています。既存の研究は主にナノモノのインターネットのアーキテクチャ、通信方法、特定の分野への応用に焦点を当てており、機械学習がデータ処理、異常検出、セキュリティにおいて持つ可能性を見落としています。したがって、本論文はこの空白を...

人工知能を用いた会話中の音声感情認識:系統的レビューとメタ分析

学術的背景 感情認識(Emotion Recognition)は、人工知能(AI)と感情コンピューティング(Affective Computing)分野における重要な研究テーマであり、特に医療、教育、ヒューマンコンピュータインタラクション(HCI)などの分野で広範な応用が期待されています。音声は感情表現の重要な媒体であり、声のトーン、話す速度、音量などの特徴を通じて豊かな感情情報を伝えることができます。しかし、会話シーンにおける音声感情認識(Speech Emotion Recognition, SER)は、感情の動態性、マルチモーダルデータの融合、感情アノテーションの正確性など、多くの課題に直面しています。 AIが会話中の音声感情を認識する(Speech Emotion Recogniti...

WoTにおけるセキュリティ脅威の検出における課題:系統的文献レビュー

インターネット・オブ・シングス(Internet of Things, IoT)とWeb of Things(Wot)の急速な発展に伴い、セキュリティ問題が顕在化しています。特に、サービス拒否攻撃(Denial of Service, DoS)の頻発により、Wotシステムの安全性は緊急の課題となっています。Wotは、IoTデバイスをWeb技術と統合することで、デバイスとインターネットのシームレスな接続を実現していますが、これにより新たなセキュリティ上の課題も生じています。Wotデバイスの異種性と開放性のため、従来のセキュリティメカニズムでは複雑な攻撃シナリオに対応することが困難です。したがって、本論文では、システマティック・レビュー(Systematic Literature Review,...