Mediante
Un sistema de inteligencia artificial desarrollado por la empresa británica DeepMind ha logrado el objetivo largamente buscado de predecir con precisión la forma de las proteínas solo a partir de su secuencia, un elemento clave para comprender cómo funciona la maquinaria del cuerpo humano. vida. En una competencia, AlphaFold pudo igualar dos tercios de los resultados obtenidos por humanos al realizar experimentos de laboratorio costosos y que requieren mucho tiempo.
"Me quedé realmente impresionado cuando lo vi", dijo John Moult de la Universidad de Maryland, uno de los organizadores de la competencia. "Esta es la primera vez que nos acercamos a la utilidad experimental, que es bastante extraordinaria".
La proteína es vital para la vida. Las células están llenas de máquinas, desde turbinas que generan energía hasta transportadores que caminan por vías tirando de mercancías, que están construidas a partir de proteínas, y las formas de esas máquinas son cruciales. Por ejemplo, el coronavirus puede ingresar e infectar células porque la proteína de punta en su superficie se inserta en un receptor en las células humanas, como una llave en una cerradura.
Publicidad
Estas formas dependen de la secuencia de 20 aminoácidos diferentes que se unen para formar proteínas. Es fácil determinar la secuencia de cualquier proteína porque está determinada por el ADN que la codifica. Pero a pesar de medio siglo de esfuerzo, los biólogos aún tienen que determinar la forma de una proteína a partir de su secuencia únicamente.
En su lugar, tuvieron que confiar en métodos experimentales como la cristalografía de rayos X, que implica analizar el patrón de difracción formado cuando un haz de rayos X atraviesa un cristal de proteína.
"Es extremadamente difícil", dice John Jumper, quien lidera el equipo AlphaFold en DeepMind. Hacer cristales de algunas proteínas es difícil e interpretar los patrones de difracción puede ser complicado.
El cálculo de fuerza bruta basado únicamente en la física no es una opción, ya que las proteínas son demasiado complejas. En cambio, muchos grupos de todo el mundo han recurrido al aprendizaje automático, donde los sistemas de IA se entrenan utilizando conjuntos de datos de estructuras proteicas conocidas.
Para cada proteína objetivo, los grupos que incluyen DeepMind buscan variantes encontradas en especies relacionadas y alimentan su secuencia y estructura en el sistema IA, así como la secuencia de la proteína objetivo. La idea es que el sistema aprenda a determinar la forma de la proteína objetivo examinando patrones que unen secuencia y estructura.
En 1994, Moult y un colega establecieron la competencia CASP (Evaluación crítica de la predicción de la estructura de proteínas) para juzgar el rendimiento de las predicciones por computadora. Cualquier grupo que desee ingresar recibe las secuencias de proteínas cuya estructura ha sido determinada experimentalmente pero aún no publicada.
Las formas pronosticadas se puntúan sobre 100 en función de lo cerca que esté cada aminoácido de la posición determinada por el experimento. Una puntuación superior a 90 se considera equivalente a los resultados obtenidos mediante experimentos.
En la competición de 2016, el mejor equipo logró una puntuación media de alrededor de 40 en la categoría más difícil. En 2018, la primera versión de AlphaFold logró una puntuación media de casi 60 en esta categoría. Este año, un AlphaFold rediseñado logró una puntuación media de 87 en la categoría más difícil. En todas las categorías, obtuvo una puntuación superior a 90 para dos tercios de la proteína.
Si bien este resultado es asombroso, ha habido fallas obvias, dice Moult. Por ejemplo, AlphaFold no funcionó bien con una proteína cuya estructura está influenciada por interacciones con otras proteínas a su alrededor.
Esa variabilidad podría ser un problema, pero AlphaFold también proporciona una medida de cuán confiables son sus predicciones, para que los científicos sepan en quién confiar, dice Jumper. "Es enorme."
Independientemente de la competencia, Andrei Lupas del Instituto Max Planck de Biología del Desarrollo en Alemania había estado tratando de trabajar en la estructura de una proteína en particular durante una década hasta que DeepMind se ofreció a ayudar. . Se necesitaron algunos ajustes para mejorar la precisión, pero el equipo de Lupas tenía la estructura final dentro de la media hora de recibir la predicción de AlphaFold. “Es asombroso”, dijo. "Es realmente increíble."
Lupas cree que durante los próximos años, los investigadores aún tendrán que hacer trabajo experimental para verificar las predicciones de forma, pero eventualmente podrán confiar únicamente en el cálculo. Hará una gran diferencia, dice, pero la verdadera revolución vendrá al poder usar computadoras para predecir cómo las proteínas interactúan con otras moléculas.
“Cambiará por completo el rostro de la medicina”, dice Lupas. Por ejemplo, AlphaFold pudo predecir las formas de varias proteínas del coronavirus poco después de la secuencia inicial del virus en enero, dice. Aún mejor sería tener la capacidad de predecir cuál de los miles de medicamentos existentes se une a estas proteínas y podría tener un efecto terapéutico, sin tener que hacer experimentos costosos.
DeepMind ha revelado algunos detalles sobre AlphaFold hasta ahora, pero dice que pronto publicará una publicación. La compañía no ha podido comentar cómo los científicos podrán acceder a la tecnología, pero quieren que esté ampliamente disponible. "Queremos asegurarnos de que esto tenga el mayor impacto", dice Pushmeet Kohli de DeepMind.
Obtenga más información sobre estos temas:
Deja un comentario