Aller directement au contenu

LabGenius accélère le développement de médicaments grâce à Graphcore

Graphcore a annoncé que LabGenius, pionnier de l’utilisation de l’apprentissage automatique pour l’ingénierie des protéines, utilise ses systèmes de calcul d’intelligence artificielle, pour accélérer le développement de médicaments. Alors même que LabGenius s’attache principalement à accélérer le développement de traitements avancés contre le cancer et les maladies inflammatoires, les principes fondamentaux de ses recherches peuvent s’appliquer à de nombreux …

LabGenius accélère le développement de médicaments grâce à Graphcore
Graphcore a annoncé que LabGenius, pionnier de l’utilisation de l’apprentissage automatique pour l’ingénierie des protéines, utilise ses systèmes de calcul d’intelligence artificielle, pour accélérer le développement de médicaments.

Graphcore a annoncé que LabGenius, pionnier de l’utilisation de l’apprentissage automatique pour l’ingénierie des protéines, utilise ses systèmes de calcul d’intelligence artificielle, pour accélérer le développement de médicaments.

Alors même que LabGenius s’attache principalement à accélérer le développement de traitements avancés contre le cancer et les maladies inflammatoires, les principes fondamentaux de ses recherches peuvent s’appliquer à de nombreux domaines. En alliant intelligence artificielle (IA), biologie synthétique et automatisation en laboratoire, cette société de biotechnologie londonienne cherche à développer des thérapies à anticorps nouvelle génération. Les techniques et technologies impliquées n’ont que récemment atteint le niveau de maturité nécessaire à une telle entreprise.

Lorsque les systèmes IPU ont permis de réduire de moitié les délais d’entraînement de modèles d’IA, les chercheurs de LabGenius ont réalisé qu’ils avaient désormais à leur disposition un nouvel outil puissant pour les aider à innover. Ils ont utilisé une version PyTorch prête à l’emploi du modèle de transformeur BERT avec le code en libre accès sur le site GitHub de Graphcore.

«Alors qu’auparavant, nous avions recours à des processeurs GPU, qui prenaient un mois à entraîner un modèle comprenant toutes les protéines requises, aujourd’hui avec Graphcore, nous avons réduit ce délai à deux semaines, ce qui nous permet de réaliser beaucoup plus d’expériences et d’obtenir bien plus de résultats », selon le Dr. Katya Putintseva, Consultante en Machine Learning chez LabGenius.

Le problème des protéines

Trouver ou concevoir des protéines présentant les caractéristiques requises pour traiter des maladies spécifiques est une tâche particulièrement complexe. C’est seulement au cours des quelques dernières années que des molécules conçues à l’aide de l’IA ont commencé à faire l’objet de tests cliniques sérieux, ouvrant ainsi la porte à une nouvelle ère de la recherche.

Même avec des technologies de conception spécifiques pour protéines, il est extrêmement difficile d’ajuster avec précision et de manière optimale les amino-acides d’une protéine. Seules les nouvelles avancées en intelligence artificielle le permettent, les capacités de calcul traditionnelles n’en étant pas capables.

Pour tirer parti de cette technologie, LabGenius a créé un système en boucle fermée pour gérer l’itération expérimentale et les allers-retours entre l’expérimentation biologique et la prise de décision basée sur l’apprentissage automatique. Les protéines sont séquencées, analysées de manière intelligente, modifiées et resynthétisées jusqu’à ce que la protéine parfaitement adaptée ait été trouvée.

Des données de haute qualité

Les laboratoires de LabGenius font une grande place à la partie physique du processus : les machines de manipulation des liquides remplissent les échantillons, qui sont récupérés par des bras robotiques et transférés à l’étape suivante de du processus. C’est à ce niveau que la science des données vient renforcer la recherche en laboratoire. «Le problème majeur à surmonter pour l’IA, si l’on compare au traitement automatique des langues ou à la reconnaissance d’images, est la rareté des données de haute qualité correspondant aux caractéristiques recherchées», explique le Dr. Putintseva. «Des données, il y en a beaucoup. Mais le diable est dans les détails. Comment un tel ensemble de données a-t-il été généré ? Quels biais contient-il ? Dans quelles mesures le signal qui en a été extrait peut-il être extrapolé au sein de la séquence ? ».

La plateforme robotique de LabGenius produit et classifie les données d’une façon adéquate, et  au niveau de qualité requis pour les modèles d’apprentissage automatique. Selon le Dr. Putintseva, « le temps est venu de générer des ensembles de données de très haute qualité en biologie ».

Optimiser et conseiller

À l’aide d’ensembles de données haute qualité et soigneusement sélectionnés, LabGenius est en mesure de tirer parti de l’intelligence artificielle pour résoudre deux des plus grands problèmes liés au développement de nouvelles thérapies basées sur protéines. La première est connue du monde de l’IA : comment optimiser un grand nombre de variables au sein de systèmes très complexes ? «Nous appelons cela co-optimisation ou optimisation à objectifs multiples », dit Tom Ashworth, à la tête de l’équipe Technologie de LabGenius. “Si vous essayez d’optimiser la force des molécules, il convient également de préserver leur intégrité ou d’autres caractéristiques, comme leur stabilité». L’IA influence également la manière qu’a LabGenius de mener ses expériences. «Le système permet d’identifier divers aspects de la molécule qu’il est possible d’améliorer : mutations ponctuelles de constructions simples, composition globale, ou encore topologie de protéines multi-modules. Tout ceci en nous conseillant sur les étapes d’optimisation suivantes, ce processus nous apprend à identifier les changements et à les mettre en œuvre », explique M. Ashworth.

Le modèle BERT biologique

LabGenius utilise les IPU Graphcore IPU au sein du cloud Cirrascale IPU pour accélérer l’entraînement BERT, un modèle de transformeur bien connu pour le traitement automatique des langues, dont les applications n’ont de cesse de se diversifier, y compris dans le domaine de la biotechnologie.

Les chercheurs de LabGenius prennent un ensemble conséquent de protéines connues et demandent au modèle BERT de prédire les amino-acides dissimulés au sein des données d’entraînement, de sorte qu’il découvre la biophysique desdites protéines, selon le Dr. Putintseva : « Pour cette raison, les valeurs cachées de ce modèle nous permettent de générer une représentation pertinente des protéines que nous utilisons ensuite pour planifier nos recherches. » Les chercheurs de LabGenius ont utilisé les implémentations PyTorch standard de Graphcore pour le modèle BERT, disponibles sur GitHub. Requérant peu de modifications au niveau du code, elles permettent de se concentrer sur l’essentiel, à savoir s’assurer que l’ensemble de données est parfaitement adapté à la tâche. Le fait que les IPU Graphcore aient pu réduire le temps d’apprentissage de façon aussi spectaculaire, sur un modèle qui doit être ré-entraîné à plusieurs reprises, donne à LabGenius un avantage substantiel dans un secteur concurrentiel, selon Tom Ashworth.

«Graphcore a transformé nos opérations, réduisant la durée d’entraînement des modèles de plusieurs semaines à quelques jours Il s’agit d’une révolution pour nos data scientists. Ils peuvent accomplir bien plus, et bien plus rapidement. C’est un avantage indéniable pour nous », confirme M. Ashworth. «En tant que start-up, notre capacité à accélérer les processus est vitale».

LabGenius souhaite désormais étendre son utilisation des modèles BERT entraînés par Graphcore, y compris lors de la phase de développement de médicaments, et aussi pour comprendre la capacité de développement de ses molécules. L’entreprise commence également à explorer la création de nouveaux modèles d’IA sur les systèmes Graphcore, et notamment sur les réseaux de neurones graphiques au sein desquels l’IPU bénéficie d’un important avantage architectural.

ParLa rédaction
Dossiers Thématiques
Dossiers d’Analyse
En vidéo
Send this to a friend