複雑な形質に関与する原因遺伝子セットの生成的予測

生成型ディープラーニングによる複雑形質の原因遺伝子セット予測:PNAS注目新手法の解説 1. 学術的背景と研究動機 複雑形質のジレンマ 遺伝子型と表現型の関係は、生物学や遺伝学分野で最も核心的な課題の一つです。特に生物体レベルの複雑形質(complex traits)の研究において、この問題は顕著に表れます。いわゆる複雑形質とは、複数の遺伝子(あるいは複数の遺伝子座、loci)の協調的な作用によって調節される表現型のことで、喘息、炎症性腸疾患、糖尿病、癌転移などがその代表例です。これらの形質は通常、遺伝的背景、エピジェネティクス、環境要因など複数の要素に影響されるため、遺伝子型から表現型を予測するのが極めて困難となっています。 現代の遺伝学研究は主に全ゲノム関連研究(GWAS, genome...

アミノ酸主鎖のコンフォメーションが翻訳された同義コドンに依存することは統計的に有意ではない

同義コドンがタンパク質主鎖コンフォメーションに与える影響の再評価 —— 厳密な統計検定による構造生物学パラダイムの再考 一、学術的背景と研究動機 分子生物学と構造生物学の分野では、コドン(codon)とタンパク質構造との関係が常に注目されてきました。伝統的な考え方では、タンパク質の一次構造(すなわちアミノ酸配列)がその立体構造(フォールディング)を決定し、遺伝暗号の「縮重性」により同じアミノ酸が複数の「同義コドン(synonymous codons)」でコードされることが可能です。1990年代末以降、同義コドンの使用傾向がmRNAスプライシング、翻訳速度制御、タンパク質の折り畳みダイナミクスなど、様々な生物学的プロセスと密接に関わることが多くの文献で確認されています。これらの知見は、分子生物...

事前学習DNA言語モデルを用いた植物ゲノムの単一ヌクレオチド分解能での種間モデリング

植物ゲノムの種間モデリングにおけるマイルストーン:PlantCaduceus DNA言語モデルの創出と画期的応用 1. 学術的背景と研究動機 過去20年間、ハイスループットシーケンシング技術の急速な発展とともに、1000種を超える植物ゲノムが公開されており、今後もこの数は急増し続けると予想されています。しかし、これら膨大なゲノムの機能要素注釈、それらの転写と翻訳レベルにおける発現調節の理解、さらに異なる遺伝変異が個体の適応性や形質に及ぼす影響の解析は、植物ゲノム学および作物改良分野で解決が求められる「ボトルネック」課題です。 動物やヒトと比較して、植物ゲノムはより複雑な構造を持ち、ゲノムサイズは巨大で、反復配列の割合が非常に高く、種間多様性が極めて大きいだけでなく、同属・同種内部でも著しいバ...

ネットワーク生物学におけるリンク予測アルゴリズムのバイアス認識型学習と評価

ネットワーク生物学における連結予測アルゴリズムの“富ノード”バイアスの解明と新たな対応戦略 ーー “Bias-aware Training and Evaluation of Link Prediction Algorithms in Network Biology”を読み解く 1. 学術的背景と研究の発端 過去10年間、生物ネットワーク(network biology)は、生体分子間の関連や機能の解明においてますます重要な役割を担ってきました。タンパク質–タンパク質相互作用(protein–protein interaction, PPI)や疾患と遺伝子の関係など、大規模なネットワークデータが豊富になるにつれて、グラフ機械学習に基づく連結予測(link prediction、連結とはネット...

健康寿命のプロテオミクス指標の開発と検証

1. 学術的背景:寿命の延長から健康寿命の促進へ 20世紀以降、世界的な医療と社会経済の発展により、人類全体の寿命(Lifespan)は著しく延び、特に発展途上国で顕著です。しかし、健康寿命(Healthspan)――すなわち重大な慢性疾患や機能障害がなく、全体的な健康状態を維持して生活する年数――は寿命と同じペースで伸びていません。これが世界的な「健康寿命ギャップ」(healthspan-lifespan gap)を生み出し、多くの人が寿命こそ延びても高齢期に慢性疾患や障害、機能低下を抱えて過ごすことが増え、社会・経済・医療へ大きな負担となっています。 こうした課題に対応するため、抗老化生物学の分野では「ジェロサイエンス」(Geroscience)という研究パラダイムが現れました。従来のよ...