La IA de DeepMind descubre la estructura del 98,5% de las proteínas humanas


Por

Imagen predeterminada del nuevo científico

La determinación de los pliegues de proteínas delicadas tradicionalmente lleva años, pero DeepMind AI lo acelera

Mente profunda

Se necesitaron décadas de minuciosa investigación para mapear la estructura de solo el 17% de las proteínas utilizadas en el cuerpo humano, pero menos de un año para que la empresa británica de inteligencia artificial DeepMind llevara esa cifra al 98,5%. La compañía está poniendo todos estos datos a disposición de forma gratuita, lo que podría conducir a rápidos avances en el desarrollo de nuevos medicamentos.

Determinación de la forma compleja y arrugada de las proteínas. basado en la secuencia de aminoácidos que los componen ha sido un gran obstáculo científico. Algunos aminoácidos se sienten atraídos por otros, otros son repelidos por el agua y las cadenas forman formas complejas que son difíciles de calcular con precisión. La comprensión de estas estructuras permite el diseño de nuevos fármacos altamente dirigidos que se unen a partes específicas de proteínas.

La investigación genética ha brindado durante mucho tiempo la capacidad de determinar la secuencia de una proteína, pero una forma efectiva de encontrar la forma, crucial para comprender sus propiedades, ha resultado difícil de alcanzar. Si bien los proyectos de supercomputadoras y computación distribuida han tenido éxito, no han logrado avances significativos.

DeepMind publicó una investigación el año pasado que demostró que la IA puede solucionar el problema rápidamente. Su red neuronal AlphaFold se entrenó en secciones de formas de proteínas previamente resueltas y aprendió a inferir la estructura de nuevas secuencias.

Desde entonces, la compañía ha aplicado y refinado la tecnología a miles de proteínas, comenzando con el proteoma humano, proteínas relevantes para covid-19 y otras que beneficiarán más la investigación inmediata. Ahora difunde los resultados en una base de datos creada en colaboración con el Laboratorio Europeo de Biología Molecular.

DeepMind ha mapeado la estructura del 98,5% de las aproximadamente 20.000 proteínas del cuerpo humano. Para el 35,7% de ellos, el algoritmo dio más del 90% de confianza en la precisión en la predicción de su forma.

La compañía ha publicado más de 350.000 predicciones de la estructura de las proteínas en total, incluidas las de 20 organismos modelo adicionales que son importantes para la investigación biológica, desde Escherichia coli con levadura. El equipo espera que en cuestión de meses puedan agregar casi todas las proteínas secuenciadas conocidas por la ciencia, más de 100 millones de estructuras.

John Moult, de la Universidad de Maryland, dijo que el auge de la IA en el plegamiento de proteínas ha sido una "profunda sorpresa".

"Es revolucionario de una manera que es difícil de comprender", dice. “Si está trabajando en una enfermedad rara y nunca ha tenido una estructura, ahora podrá ver información estructural que antes era básicamente muy, muy difícil o imposible de obtener. "

Demis Hassabis, CEO y fundador de DeepMind, dice AlphaFold, que se compone de alrededor de 32 algoritmos separados y se ha hecho de código abierto, ahora resuelve formas de proteínas en minutos o, en algunos casos, segundos utilizando hardware no más sofisticado que un gráfico estándar. tarjeta.

“A (una unidad de procesamiento de gráficos) le toma unos minutos doblar una proteína, lo que, por supuesto, habría requerido años de trabajo experimental”, dice. “Simplemente vamos a hacer que este tesoro de datos esté disponible. Es un poco alucinante en cierto modo, porque pasar de romper la creación de un sistema que puede hacer eso a producir realmente todos los datos fue solo una cuestión de meses. Esperamos que se convierta en una especie de herramienta estándar que utilicen todos los biólogos del mundo. "

Hassabis cree que parte del 1,5% restante de proteína humana para la que no se pudo encontrar estructura se debe a errores en la secuencia o quizás a "algo intrínseco a la biología", como proteínas que están intrínsecamente desordenadas o impredecibles. El equipo también agregó una medida de confianza a todas las predicciones de estructura, lo que Hassabis dijo que era vital dado que los resultados serán la base de los esfuerzos de investigación.

Referencia de la revista: Naturaleza, DOI: https://www.nature.com/articles/s41586-021-03828-1

Más sobre estos temas:

Sé el primero en comentar

Deja un comentario