Développement et validation d'une signature protéomique de la longévité en bonne santé
I. Contexte académique : de l’allongement de l’espérance de vie à l’extension de l’espérance de vie en bonne santé
Avec l’amélioration du niveau médical et socio-économique mondial depuis le XXe siècle, l’espérance de vie humaine (Lifespan) a considérablement augmenté, en particulier dans les pays en développement. Cependant, l’espérance de vie en bonne santé (Healthspan) — c’est-à-dire le nombre d’années vécues en bonne santé sans maladies chroniques majeures ni handicaps fonctionnels — n’a pas suivi la même progression que la durée de vie. Cela a entraîné à l’échelle mondiale un « écart entre l’espérance de vie en bonne santé et l’espérance de vie » (healthspan-lifespan gap), ce qui fait que de plus en plus de personnes vivent plus longtemps mais passent leurs dernières années avec des maladies chroniques, des handicaps et une perte de fonctions, entraînant d’énormes charges sociales, économiques et médicales.
Face à ce défi, le champ de la biologie anti-âge a vu émerger le paradigme de recherche de la « géro-science » (Geroscience). Contrairement aux approches classiques centrées sur la prévention ou le traitement d’une seule maladie, la géro-science met l’accent sur des interventions ciblant simultanément des mécanismes biologiques clés qui influencent le processus de vieillissement (comme l’inflammation, le déséquilibre immunitaire, les anomalies métaboliques, la dysfonction cellulaire — soit les « marques du vieillissement » ou hallmarks of aging), dans l’espoir de retarder la survenue de multiples maladies chroniques à l’échelle de l’organisme et, ainsi, d’allonger l’espérance de vie en bonne santé dès la source.
Portée par ces recherches, divers biomarqueurs de vieillissement ont été proposés. Ils servent à mesurer l’état de vieillissement, voire prédire le risque de maladies ou de mortalité, incluant des paramètres physiologiques cliniques, des indices biochimiques sanguins, des marqueurs « omiques » (épigénomiques, protéomiques, métabolomiques, etc.) et des modèles de scores composites. Mais aujourd’hui, le monde académique et médical s’est surtout focalisé sur les biomarqueurs de longévité ou les facteurs prédictifs de mortalité ; il existe encore peu de biomarqueurs reflétant directement l’espérance de vie en bonne santé. Cela tient notamment à l’absence de norme consensuelle pour définir la healthspan, et au fait que le développement de tels marqueurs requiert un suivi à long terme avec de grands échantillons de personnes saines, afin de collecter des données exhaustives jusqu’aux différents événements de santé — ce qui est bien plus difficile que de prévoir la longévité ou une maladie unique.
Dans ce contexte, la question de savoir comment, sur la base de la définition de « healthspan », développer des biomarqueurs capables de prédire avec précision les changements de l’état de santé individuels — utilisables entre populations, maladies et interventions — est devenue un défi clé et un axe de pointe pour les recherches de traduction clinique et en interventions anti-âge.
II. Source de l’article et contexte des auteurs
Cet article est une étude originale intitulée « A proteomic signature of healthspan », publiée dans les Proceedings of the National Academy of Sciences (PNAS) des États-Unis, volume 122, numéro 23, 2025. Les auteurs de l’étude sont Chia-Ling Kuo (premier auteur et auteur correspondant, University of Connecticut Health Center), Peiran Liu, Gabin Drouard, Eero Vuoksimaa, Jaakko Kaprio, Miina Ollikainen, Zhiduo Chen, Luke C. Pilling, Janice L. Atkins, Richard H. Fortinsky, George A. Kuchel et Breno S. Diniz, regroupant des institutions de premier plan telles que l’Université du Connecticut (États-Unis), l’Université d’Helsinki (Finlande) et l’Université d’Exeter (Royaume-Uni).
L’article a été rendu public le 6 juin 2025, en tant que soumission directe PNAS, édité par l’experte internationale Ana Maria Cuervo. Les données primaires proviennent de la Biobanque britannique (UK Biobank) et de la cohorte finlandaise des jumeaux (Finnish Twin Cohort). Les mesures protéomiques sont réalisées avec la plateforme haut débit Olink Explore 3072, conférant à l’étude un design rigoureux, un échantillon massif, une approche technologique innovante, une grande valeur académique et des perspectives de translation étendues.
III. Design expérimental et méthodologie détaillée
1. Objectif de la recherche et conception générale
L’objectif de cette étude est de développer un biomarqueur à large échelle fondé sur la protéomique — le score protéomique d’espérance de vie en bonne santé (Healthspan Proteomic Score, HPS) — afin de prédire précisément, chez l’individu, l’espérance de vie en bonne santé (c’est-à-dire le nombre d’années avant l’apparition de grands événements de santé comme le cancer, le diabète, l’insuffisance cardiaque, l’infarctus, l’AVC, la BPCO, la démence ou le décès), et de valider systématiquement sa performance prédictive dans divers groupes, différents critères de santé et diverses mesures.
La conception comprend :
- Développement du modèle HPS basé sur la vaste cohorte UK Biobank Pharma Proteomics Project (PPP) ;
- Validation croisée/interne sur sous-échantillon indépendant, et validation externe sur la cohorte « Essential Hypertension Epigenetics Study » (Finlande) ;
- Exploitation de données transversales et longitudinales, comparaisons multi-niveaux avec divers modèles de scores calculés à partir de protéines, d’épigénétique et de l’âge biologique ;
- Corrélation des niveaux protéiques avec les indices cliniques de santé et de multiples événements majeurs, explorant les mécanismes biologiques sous-jacents.
2. Principaux processus expérimentaux et étapes
(1) Origine des échantillons et caractéristiques de base
- Cohorte UKB PPP : Sélection et inclusion de 53 018 participants actifs d’UKB (recrutés 2006-2010, 40-70 ans), parmi lesquels 43 119 non atteints au départ d’aucune maladie incluse dans la définition de l’espérance de vie en bonne santé. Ces derniers constituent la population d’étude principale, répartie aléatoirement en 70 % d’ensemble d’entraînement (30 184 individus) et 30 % d’ensemble test (12 935 individus).
- Analyse protéomique : Mesure de l’expression de 2 923 protéines plasmatiques à l’aide de la plateforme Olink Explore 3072, couvrant de multiples systèmes fonctionnels (cardiovasculaire, inflammation, neurologie, oncologie) ; normalisation stricte des données, imputation des valeurs manquantes par K plus proches voisins (K=10).
(2) Développement et modélisation du HPS
Définition de l’espérance de vie en bonne santé
En se référant aux études récentes, la healthspan est définie comme la période de la naissance à la première survenue de l’une des maladies suivantes : tumeur maligne (hors carcinome basocellulaire), diabète (type 1/2/lié à la malnutrition), insuffisance cardiaque, infarctus du myocarde, AVC, BPCO, démence ou mort.Sélection des variables et modélisation
- D’abord, un modèle Cox LASSO (least absolute shrinkage and selection operator) sert à filtrer, parmi 2 920 protéines et l’âge, les variables les plus prédictives, tout en contrôlant la complexité du modèle et en conservant finalement 86 protéines et l’âge, avec une performance proche de l’optimum.
- Ces variables alimentent ensuite un modèle de survie de Gompertz pour calculer la probabilité (risque Rh) de survenue d’un premier événement dans les dix ans à venir. Le HPS est défini comme 1–Rh : plus il est bas, plus le risque est élevé.
Validation croisée entraînement-test
- Le modèle est développé sur l’ensemble d’entraînement puis testé indépendamment sur l’ensemble test, comparé à divers scores d’âge biologique (PAC, PhenoAge, BioAge, Protage-EN, etc.) et à des marqueurs phénotypiques, pour évaluer la puissance/prédictivité pour diverses maladies, la mortalité et la généralisabilité.
(3) Principales analyses statistiques et méthodologies
- Utilisation de la corrélation de Spearman, du test de Wilcoxon, du modèle additif de risques d’Aalen, de la statistique C de Harrell, etc.
- Ajustement supplémentaire sur le BMI, le tabac, l’hypertension, l’hypercholestérolémie, le niveau socio-économique, la composition de la cohorte, au-delà de l’âge, du sexe et de l’origine ethnique, afin de limiter les biais de confusion.
- Correction du risque d’erreur de type I par contrôle rigoureux du FDR (Benjamini-Hochberg).
- Toutes les données protéiques sont normalisées (transformation inverse normale), et l’analyse bioinformatique (enrichissement fonctionnel, annotation) s’appuie sur FUMA et d’autres outils.
(4) Validation externe
- Utilisation des données de l’étude finlandaise Essential Hypertension Epigenetics Study, intégrant 401 individus de la cohorte des jumeaux finlandais (phénotype tension artérielle, mortalité, suivi longitudinal, données protéomiques et épigénétiques), pour tester la transférabilité du HPS dans une autre population européenne ainsi que sa comparaison directe avec la méthylation de l’ADN, les marqueurs métabolomiques et autres scores d’âge biologique.
3. Résultats principaux et logique de démonstration
(1) Résultats sur l’espérance de vie en bonne santé et phénotypes d’échantillon
- Au sein de la cohorte UKB PPP (entraînement+test), ~28,8 % des individus exempts de maladies majeures à l’inclusion développent un des critères de healthspan sur les 13,5 ans de suivi ; cancer, infarctus, diabète, et BPCO étant les causes initiales dominantes, l’âge moyen au premier diagnostic étant ~66,7 ans.
- Selon le HPS, les patients atteints de maladies chroniques ou à risque (hommes, personnes âgées, fumeurs, obèses, hypertendus/hypercholestérolémiques) présentent des scores HPS nettement plus bas à l’inclusion, illustrant la capacité du score à discriminer les types d’âges biologiques et la sensibilité aux perturbations précoces.
(2) Associations entre HPS, âge biologique et résultats cliniques
- Le HPS est modérément corrélé négativement à l’âge chronologique (r = -0,73), fortement corrélé aux clocks protéomiques (PAC r = -0,87), aux scores d’âge phénotypique (PhenoAge, BioAge r = -0,79, -0,74), faible corrélation négative avec l’indice de fragilité.
- Les analyses multivariées et de survie montrent : plus le HPS est bas, plus le risque d’avoir un premier événement majeur/mortalité dans les 10 ans est élevé — chaque baisse de 0,1 point du score correspond à 1 600 nouveaux cas par 100 000 personnes-années. Les groupes à faible HPS montrent une survie significativement inférieure (courbes de Kaplan-Meier, HR : chaque baisse de 0,1 unité augmente le risque de décès de 55 %).
(3) Logique et soutien biologique du HPS via la protéomique
- Au total, 1 398 protéines modifiées de manière significative (après correction de Bonferroni) dans les personnes à faible HPS, s’enrichissent dans 26 voies clés des « hallmarks of aging » : réponse immunitaire, inflammation, signalisation cellulaire, régulation métabolique, reliant la signature protéomique aux processus du vieillissement.
- Comparé aux clocks classiques (PAC), HPS présente une capacité de discrimination égale ou supérieure pour diverses maladies organo-spécifiques, la mortalité et d’autres résultats, et leur combinaison améliore encore la pertinence prédictive et l’applicabilité générale.
(4) Validation externe et généralisabilité
- Dans la cohorte finlandaise EH-EPI, le HPS est significativement associé à la mortalité, au diabète, à des biomarqueurs métaboliques favorables ; les faibles HPS présentent une mortalité accrue. Comparé aux scores épigénétiques et autres clocks, il démontre une valeur prédictive prospective identique ou meilleure, ce qui montre sa transférabilité.
(5) Analyse conjointe et effets d’interaction
- L’approfondissement révèle que les individus au HPS faible et PAC élevé forment le groupe de vieillissement biologique « le moins favorable », se situant entre les sujets sains (HPS élevé, PAC faible) et ceux déviés sur un seul critère. La double stratification permet de cibler des individus toujours cliniquement sains mais présentant déjà des altérations biologiques importantes, ce qui est utile pour les interventions gériatriques préventives.
IV. Conclusions, valeur scientifique et perspectives
1. Conclusions principales
- En tant que score protéomique de l’espérance de vie en bonne santé, le HPS prédit avec précision le risque de chronicité ou de décès à moyen terme chez l’adulte jeune à âgé, avec de bonnes capacités de stratification pour différentes sous-populations (âge, sexe, tabac, obésité, comorbidités de départ).
- HPS reflète l’état du vieillissement biologique systémique global (systemic biological aging) et capture la dynamique des altérations fonctionnelles liées au vieillissement, au-delà des risques organo-spécifiques ou des événements isolés.
- HPS est associé mais non redondant par rapport aux scores protéomiques et épigénétiques classiques « clocks » : il apporte une dimension supplémentaire et indépendante de stratification des risques ; la combinaison de scores multiplie les capacités de prédiction et de médecine personnalisée.
- Son usage pourrait grandement accélérer le dépistage populationnel, l’évaluation précoce de l’effet de thérapies anti-âge, l’utilisation du HPS comme critère de substitution dans les essais cliniques, et soutenir la translation de la géro-science pour transformer la médecine du vieillissement et la construction d’une société de vieillissement sain.
2. Signification scientifique et applicative
- Valeur scientifique : Comble le vide des biomarqueurs objectifs de l’espérance de vie en bonne santé, fournit de nouveaux outils précis pour la prévention des maladies chroniques sur l’ensemble du cycle de vie, et catalyse la convergence de la protéomique et de la gériatrie.
- Perspectives d’application : En tant que nouvel outil de mesure de l’âge biologique, le HPS est utilisable pour la stratification du risque, le dépistage des groupes à risque, la surveillance des interventions, le développement de médicaments, l’assurance et la politique publique, présentant un fort potentiel clinique et industriel.
V. Points forts et innovations de l’étude
- Première structuration d’un score protéomique d’espérance de vie en bonne santé à partir d’un suivi longitudinal de grande cohorte, avec une définition rigoureuse des critères biologiques, combler un manque majeur à l’international.
- Le modèle intègre un vaste spectre de signaux protéomiques qui s’enrichissent dans les voies inflammatoires, immunitaires et de signalisation associées au vieillissement, révélant les mécanismes communs à de multiples maladies chroniques.
- Échantillon massif, données multidimensionnelles, échantillons d’origines britannique et finlandaise : excellente généralisabilité et potentialité d’extension.
- Comparaison directe aux clocks protéomiques et épigénétiques de pointe, avec analyse fine avantages/inconvénients, assurant solidité technique et grande fiabilité.
- La stratification combinée multiplie la précision de la classification biologique, fournissant des bases réelles pour l’intervention et la prévention personnalisées dans l’anti-vieillissement.
VI. Autres informations et perspectives
- Code du modèle et workflow analytique librement accessibles sur GitHub pour la communauté scientifique.
- Équipes de recherche réunies autour d’experts internationaux en gériatrie, protéomique et cohortes populationnelles, financements scientifiques majeurs du Royaume-Uni, de la Finlande et des USA, crédibilité élevée.
- L’étude discute également les limites de la définition healthspan, admettant que les dossiers médicaux électroniques ne recensent pas toutes les affections chroniques mais le modèle prédit avec efficacité les issues de santé courantes — forte adaptabilité pratique.
- Des validations élargies sur des populations d’origines ethniques, d’âges et de systèmes de santé plus variés seront nécessaires pour asseoir la valeur translationnelle du HPS et guider les politiques internationales de santé du vieillissement et de médecine de la précision.
VII. Conclusion
Cette étude, marquante dans la recherche protéomique sur l’espérance de vie en bonne santé, fait progresser la stratification fine de l’âge biologique et la translation clinique « du laboratoire au lit du patient ». Elle offre à la société vieillissante mondiale des outils scientifiques de base solides pour l’objectif d’« augmenter la healthspan ». HPS et ses combinaisons innovantes devraient orienter l’avenir de la prévention anti-âge, des politiques de santé et de la gestion de la santé personnalisée, posant les fondations théoriques et techniques d’une nouvelle ère de la gestion précise du vieillissement.