画像分類のためのクロススケール共起局所二値パターン

クロススケール共起局所バイナリパターンを用いた画像分類法の研究 画像分類技術はコンピュータビジョン分野で重要な位置を占めており、画像特徴抽出はこの分野の核心的研究対象です。近年、局所バイナリパターン(Local Binary Pattern, LBP)は、その効率性と優れた記述能力により、テクスチャ分類や顔認識などの視覚タスクで広く利用されています。しかし、従来のLBP手法は幾何変換(回転やスケーリング)や画像ノイズに対して制約があり、その記述能力が劣化しやすいという課題がありました。これらの課題に対処するため、重慶郵電大学の肖斌らの研究チームは、学術誌「International Journal of Computer Vision」に「CS-COLBP: Cross-Scale Co-O...

StyleGANを用いた画像編集のための残差変形

GAN反転と画像編集の新手法:StyleGANを用いたWarping the Residualsによる画像編集 背景と研究課題 生成的敵対ネットワーク(Generative Adversarial Networks, GAN)は、画像生成分野で著しい進展を遂げ、高品質な画像の生成および編集を可能にしました。特に、StyleGANモデルは、その意味的に解釈可能な潜在空間構造を活用し、従来の画像翻訳手法を超える編集能力を示しています。しかし、GANの実用化において直面する主要な課題は、実画像を編集する際に、画像をGANの潜在空間(GAN反転)に正確に投影し、入力画像を高忠実度で再構築しつつ、高品質な編集を実現することです。 既存の手法では、低ビットレートの潜在空間(例:StyleGANの$W^+...

オブジェクト再識別のためのトランスフォーマー:調査

オブジェクト再識別のためのTransformer: サーベイ 背景と研究の重要性 オブジェクト再識別(Object Re-Identification、以下Re-ID)は、特定のオブジェクトを異なる時間やシーンで識別する重要なコンピュータビジョンタスクです。本分野は、畳み込みニューラルネットワーク(Convolutional Neural Networks, CNNs)をベースとした深層学習技術により大きな進展を遂げました。しかし、視覚Transformerの登場により、Re-ID研究は新たな局面を迎えています。本研究では、Transformerを用いたRe-ID技術を体系的にレビューし、画像/ビデオ、少データ/少アノテーション、多モーダル、特殊な応用シナリオでの利点と課題を分析します。 研...

DataLadを用いた研究データ管理の教育:数年にわたる複数分野の取り組み

科学研究データ管理教育の多年にわたる多分野の取り組み 研究背景 現代神経科学の発展に伴い、研究データ管理(Research Data Management, RDM)は科学者にとって不可欠なスキルとなっています。しかし、研究データ管理の重要性にもかかわらず、これらの技術スキルは分野特化の大学院教育においてしばしば無視されがちです。そのため、ますます多くのコミュニティは、組織されたトレーニングの機会や自己学習材料を提供し、初期の研究者がこの知識とスキルを習得するのを支援しています。 マサチューセッツ工科大学(MIT)の「the missing semester of your cs education」は、この教育不足の一例です。さらに、現代のコンピュータとアプリケーションの高可用性は、ユーザ...

直接変調されたワット級フォトニッククリスタル面発光レーザーによる高速高出力自由空間光通信

直接変調されたワット級フォトニッククリスタル面発光レーザーによる高速高出力自由空間光通信

高速大功率自由空间光通信:瓦特级光子晶体表面发射激光器の直接変調 背景紹介 半導体レーザーは、光通信の重要な光源として、小型、低コスト、長寿命、高効率などの特徴から広く応用されています。例えば、垂直共振器面発光レーザー(VCSELs)は、その低消費電力と広帯域直接変調能力のため、データセンターの短距離光インターコネクションに適しています。一方、分布帰還(DFB)レーザーはその単一モード動作特性により、長距離光ファイバ通信で広く用いられています。近年、半導体レーザーを利用した自由空間光通信(FSO)が長距離で高速に伝送でき、光ファイバを必要としないため、注目を集めています。FSO技術は、5Gと未来の6G通信におけるバックホールおよびフロントホールネットワーク、衛星間通信、深宇宙通信などに潜在的...