Identifier des protéines individuelles à l’aide de nanopores et de superordinateurs

La quantité et les types de protéines que nos cellules produisent nous donnent des détails importants sur notre santé et sur le fonctionnement de notre corps. Mais les méthodes dont nous disposons pour identifier et quantifier les protéines individuelles sont inadéquates à la tâche. Non seulement la diversité des protéines est inconnue, mais souvent, les acides aminés sont modifiés après la synthèse par des modifications post-traductionnelles.
Ces dernières années, de nombreux progrès ont été réalisés dans la lecture de l’ADN à l’aide de nanopores – de minuscules membranes suffisamment grandes pour laisser passer un brin d’ADN non enroulé, mais à peine. En mesurant soigneusement la tension ionique du nanopore lorsque l’ADN se croise, les biologistes ont pu identifier rapidement l’ordre des paires de bases dans la séquence. En fait, cette année, les nanopores ont été utilisés pour enfin séquencer l’intégralité du génome humain, ce qui n’était pas possible auparavant avec d’autres technologies.
Dans de nouvelles recherches dans La science magazine, des chercheurs de l’Université de technologie de Delft aux Pays-Bas et de l’Université de l’Illinois à Urbana-Champaign (UIUC) aux États-Unis ont étendu ces succès de nanopores d’ADN et fourni une preuve de concept que la même méthode est possible pour l’identification d’une seule protéine , caractérisant les protéines avec une résolution d’un seul acide aminé et des marges d’erreur extrêmement petites (10^-6 ou 1 sur un million).
“Ce lecteur de peptides nanopores fournit des informations spécifiques au site sur la séquence primaire du peptide qui peuvent trouver des applications dans l’empreinte protéique à molécule unique et l’identification des variantes”, ont écrit les auteurs.
Chevaux de bataille de nos cellules, les protéines sont de longues chaînes peptidiques composées de 20 types différents d’acides aminés. Les chercheurs ont utilisé une enzyme appelée hélicase Hel308 qui peut se fixer aux hybrides ADN-peptide et les tirer, de manière contrôlée, à travers un nanopore biologique connu sous le nom de MspA (mycobacterium smegmatis porine A). Ils ont choisi l’hélicase d’ADN Hel308 car elle peut tirer des peptides à travers le pore en étapes observables d’un demi-nucléotide, qui correspondent étroitement à des acides aminés simples.
Chaque étape à travers la porte étroite produit théoriquement un signal de courant unique car l’acide aminé bloque partiellement un courant électrique transporté par des ions à travers le nanopore.
L’auteur principal Henry Brinkerhoff, qui a lancé ce travail en tant que post-doctorant dans le laboratoire du physicien Cees Dekker, compare la protéine à un collier avec des perles de différentes tailles. “Imaginez que vous ouvrez le robinet alors que vous déplacez lentement ce collier dans le drain, qui dans ce cas est le nanopore”, a-t-il déclaré. “Si une grosse perle bloque le drain, l’eau qui s’écoule ne sera qu’un filet; si vous avez des perles plus petites dans le collier juste au niveau du drain, plus d’eau peut s’écouler.”
Avec leur technique, les chercheurs peuvent mesurer très précisément la quantité de courant ionique, mais pas exactement, car le passage par étapes à travers le pore est irrégulier. Cependant, en chargeant le milieu liquide avec des hélicases, les chercheurs peuvent obtenir de nombreuses lectures séparées et se chevauchant de la même molécule, ou selon leurs termes, ils peuvent “rembobiner” la protéine et relire sa séquence d’acides aminés. Ce faisant, réduit les erreurs de 13% à pratiquement zéro.
Leur approche a permis aux chercheurs de discriminer les variants peptidiques qui ne différaient que par un seul acide aminé, ce qu’ils ont prouvé en créant des peptides synthétiques avec un seul acide aminé modifié et en montrant que le système pouvait les discriminer.
Mais pour lire les acides aminés individuels, ils devaient d’abord savoir quel type de signal chacun produit lorsqu’il traverse le pore. Certains de ces signaux peuvent être contre-intuitifs, ont découvert les chercheurs.
Par exemple, lorsque l’acide aminé tryptophane volumineux traversait la constriction, le courant ionique a d’abord diminué puis, contre toute attente, augmenté par rapport aux variants de petite et moyenne taille.
Pour comprendre l’origine de ces modèles, l’équipe s’est appuyée sur des simulations de superordinateurs par le biologiste computationnel Aleksei Aksimentiev (UIUC), réalisées sur plusieurs des superordinateurs les plus rapides disponibles pour les chercheurs universitaires au monde : Frontera, au Texas Advanced Computing Center ; Blue Waters, au National Center for Supercomputing Applications ; et Expanse, au San Diego Supercomputer Center.
L’équipe d’Aksimentiev a utilisé une méthode appelée simulation de dynamique moléculaire pour recréer le comportement du nanopore, des protéines et du milieu environnant, avec une résolution atomique. De telles simulations ne peuvent pas capturer pleinement la véritable échelle de temps de l’activité des nanopores, qui s’étend à quelques secondes. Mais en générant 40 à 50 états initiaux à différentes positions, puis en exécutant 70 simulations en parallèle, l’équipe a pu dériver des statistiques pour différentes confirmations de peptides. À partir de ceux-ci, ils ont calculé le courant et l’ont comparé aux expériences. Ce travail informatique a été dirigé par Jingqian Liu, un étudiant diplômé en biophysique du laboratoire d’Aksimentiev.
Les simulations comprenaient 30 000 atomes interagissant sur 200 à 500 nanosecondes et ont pu correspondre aux résultats expérimentaux. Plus important encore, ils ont montré pourquoi certains acides aminés produisent des signaux contre-intuitifs lorsqu’ils traversent le nanopore. Dans le cas de la variante tryptophane, le signal pourrait être attribué à une liaison de la chaîne latérale peptidique à la surface du nanopore au-dessus de la constriction.
“Pour chaque conformation spécifique, nous avons pu voir ce qui est arrivé à la chaîne latérale, si elle interagit avec la surface ou reste à l’intérieur du pore”, a déclaré Aksimentiev, professeur de physique à l’UIUC. “Ensuite, nous pourrions établir directement que la liaison de la chaîne latérale a amélioré le courant.”
Les simulations ont pris des semaines à générer sur Frontera, actuellement le 10e supercalculateur le plus rapide au monde et le plus puissant de toutes les universités. Mais cela aurait pris des années avec le type de cluster informatique disponible sur la plupart des campus. La recherche sur l’identification d’une seule protéine – pour laquelle il y a une course mondiale au succès – a été publiée en ligne par La science en tant que “première version” le 4 novembre 2021. La recherche a été soutenue par le Conseil néerlandais de la recherche, les Instituts nationaux de la santé des États-Unis et la Fondation nationale des sciences des États-Unis, entre autres.
“Il existe d’énormes opportunités pour développer des diagnostics en lisant des protéines individuelles à l’aide de cette approche nanopore”, a déclaré Aksimentiev. “Le calcul jouera un grand rôle dans le développement de ces technologies. Il est étonnant qu’avec des modèles informatiques, nous puissions reproduire des expériences et dire quel type d’interactions se produisent à l’échelle nanométrique.”
De plus, les modèles informatiques offrent une modalité de conception différente, permettant aux chercheurs de tester des nanopores de différentes tailles ou avec des résidus stratégiquement placés qui peuvent produire des signaux améliorés.
Des travaux supplémentaires sont nécessaires pour effectuer des lectures de plus de 20 acides aminés et pour identifier les acides aminés chargés de manière hétérogène, mais Aksimentiev pense que dans trois à cinq ans, il pourrait être possible de développer un modèle de travail.
“Nous pensons que notre nouvelle approche nous permettra de détecter les changements post-traductionnels”, a déclaré Dekker, “et ainsi de faire la lumière sur les protéines que nous transportons avec nous.”