Actuellement, un domaine en recherche progresse à une vitesse phénoménale : le design de protéines par ordinateur, mis récemment en avant par le prix Nobel de chimie 2024. La capacité de concevoir des protéines totalement nouvelles, ouvre des possibilités révolutionnaires dans le domaine de la santé et de l’environnement.
En fonction du type et du nombre d’acides aminés, la protéine acquiert une forme spécifique dans l’espace. Ce phénome de « repliement » détermine la fonction de la protéine, comme le transport de molécules dans le sang, la digestion enzymatique, la réception et transmission de signaux. Au final, notre organisme rassemble près de 20 000 types de protéines différents. Le passage d’une séquence d’acides aminés à une forme 3D constitue un enjeu de recherche important, notamment pour mieux étudier certaines maladies causées par un mauvais repliement des protéines, dont des maladies neurodégénératives comme Alzheimer et Parkinson.
L’INRAE, au travers d’une collaboration durable entre chercheurs en intelligence artificielle et modélisateurs moléculaires, a contribué à ces avancées au travers de méthodes de design basées sur une intelligence artificielle hybride, mêlant apprentissage et raisonnement, déjà mise en œuvre pour concevoir différentes nouvelles protéines, fonctionnelles, et caractérisées expérimentalement. Les méthodes développées par les chercheurs d’INRAE combinent pour cela 2 familles d’outils IA : l’apprentissage profond et le raisonnement automatique.
L’apprentissage profond est utilisé pour extraire les règles qui régissent la conception de protéines, en exploitant les séquences et structures de protéines naturelles, accumulées depuis des décennies par les biophysiciens dans la Protein Data Bank. Le raisonnement automatique est utilisé pour sa capacité à combiner ces règles apprises avec des lois fondamentales de la physique ou des directives du concepteur, pour identifier, très rapidement, les différentes protéines qui répondent à ces exigences parmi l’univers exponentiel des protéines possibles.
L’ensemble forme une IA générative, dite neuro-symbolique, capable de concevoir des protéines respectant précisément les consignes des designers. Les chercheurs ont montré que cette architecture est aussi capable d’apprendre à jouer parfaitement à des jeux logiques, tels que le sudoku, sans qu’on en explicite les règles, juste en observant des grilles résolues.
Source : INRAE