Insights

Las proteínas mediante IA

¿INTELIGENCIA ARTIFICIAL PARA CURAR ENFERMEDADES COMO EL PARKINSON O LA DIABETES?

Ahora es posible, la Inteligencia Artificial tiene una cantidad de usos infinitos, pero quizás no hayas oído hablar de este hito tan importante: su introducción en la biomedicina. La IA ya no es solo algo súper tecnológico reservado a la informática, sino un gran recurso en otras áreas como la salud. Desde hace 60 años, los laboratorios se rompen la cabeza tratando de comprender algo esencial, cómo se va a plegar una proteína. Y esto que quizás muchos no entendamos, es clave para evitar muchas de las enfermedades más preocupantes a día de hoy. La Inteligencia Artificial ha acelerado este proceso de manera exponencial, y en este artículo quiero contarte todos los detalles de un proyecto que nos deja un futuro muy optimista.

¿POR QUÉ SON TAN IMPORTANTES LAS PROTEÍNAS?

Las proteínas son moléculas indispensables para la vida, muy sofisticadas. Y si se pliegan mal, provocan la muerte de las células y, con ello, enfermedades incurables como el Parkinson, Alzheimer, Diabetes, Fibrosis Quística, etc. Por ejemplo, la hemoglobina transporta el oxígeno que respiramos, captando las moléculas y llevándolo a tejidos y órganos de todo el cuerpo. Si la proteína se pliega mal, puede producir un número incorrecto de glóbulos rojos, dando lugar a dolores de órganos internos y una menor esperanza de vida. A día de hoy esto se resuelve con distintos medicamentos, pero conllevan ciertos efectos secundarios.

Las proteínas están formadas por aminoácidos, que podemos representar como una cadena de letras que se van juntando. Con la concatenación de aminoácidos y la interacción entre ellos se crean formas como hélices u hojas que se van plegando y poblando a más largas escalas hasta construir un árbol tridimensional que conforma la estructura de la proteína. Existen 20 aminoácidos diferentes, y con ellos se crean más de 200 millones de proteínas. Estas proteínas pueden interactuar con otras o das señales de transcripción del ADN. De hecho, algunas de las vacunas actuales del Covid-19 están basadas en el ARN mensajero y funcionan a base de proteínas.

INTELIGENCIA ARTIFICIAL PARA PREDECIR CÓMO SE PLEGARÁ UNA PROTEÍNA

Antes de la irrupción de la IA en este ámbito, las predicciones se realizaban con métodos como la cristalografía de rayos x, la microscopia crioelectrónica o las resonancias magnéticas nucleares. Todos ellos muy costosos y lentos, pudiendo llevar semanas para conocer cómo se va a plegar una proteína. De hecho, a día de hoy de los 200 millones de proteínas existentes, tan solo está identificada la estructura de 170.000. Éstas se encuentran compartidas en BBDD públicas, para que cualquier laboratorio pueda trabajar con ellas.

Frente a estos métodos llegó la innovación de AlphaFold, un programa perteneciente a DeepMind que utiliza la IA para realizar estas predicciones. Su entrenamiento comenzó con las proteínas ya investigadas, durante semanas y utilizando el Deep Learning o aprendizaje profundo. Este programa es capaz de autoaprender, identificar partes y unirlas para obtener una solución concreta. El programa cuenta con la estructura de aminoácidos, la identifica e introduce en una red neuronal. Es decir, una base de datos que funciona de forma similar a las neuronas del cerebro, en el que la información se almacena y podemos buscarla cuando la necesitamos. Esa red neuronal es utilizada por la Inteligencia Artificial para predecir distancias y ángulos y crea una serie de gráficas, siendo capaz mediante la IA de crear una estructura 3D. Todo esto permite hacer predicciones en horas o días, en lugar de semanas, evitando los aparatos grandes y costosos.

PRECISIÓN EN LA PREDICCIÓN DEL PLIEGUE DE LAS PROTEÍNAS CON IA

AlphaFold tiene 2 versiones, y la segunda intenta mejorar la primera, suponiendo un avance abismal.

En la primera versión de AlphaFold se examinaron varias secuencias de aminoácidos de diferentes seres vivos con relación evolutiva. Cuando se observaba que un aminoácido cambiaba en la secuencia de aminoácidos, se buscaba dónde cambiaba el siguiente, pues esto significa que los aminoácidos están interactuando. Cuando existe esa interacción es porque se forman contactos en la proteína y esa información es la que se mapea con las distancias probables. En este contexto, existe una competición, CASP (Critical Assessment of Techniques for Protein Structure Prediction) para encontrar al laboratorio o grupo que mejor predice cómo se pliega una proteína. En esta competición, AlphaFold consiguió la mayor semejanza con un 58,9%.
Aun no satisfechos con este resultado, se creó la versión mejorada de AlphaFold 2, para detectar los fallos de la primera versión. Por ejemplo, pasaron de entrenar los módulos por separado a hacerlo en una única estructura, introdujeron las redes neuronales transformadoras e hicieron toda una serie de ajustes que les llevaron a un resultado excepcional. Consiguieron una semejanza del 92,4%. Un hito en la historia y un avance fundamental, ya que a partir del 90% puede empezar a considerarse una predicción como correcta. Por tanto, se trata de un modelo muy competitivo para conocer las estructuras de las proteínas, a las que se puede dar multitud de aplicaciones.

APLICACIONES DE LA PREDICCIÓN DEL PLIEGUE DE PROTEÍNAS GRACIAS A LA IA

Como ya comentábamos, conocer esta información ayudará a identificar aquellas proteínas que funcionan mal en el cuerpo y causan enfermedades. Así se podrá aumentar la esperanza de vida, encontrar tratamientos para enfermedades que a día de hoy ni siquiera se investigan o incluso crear medicamentos personalizados para evitar los efectos secundarios según las condiciones de cada persona.

Pero no solo eso. En el ámbito del medio ambiente, se han descubierto bacterias capaces de comerse los microplásticos en mares y océanos, y éstas podrían reproducirse masivamente para su limpieza. Podrán investigarse también opciones de creación de proteínas que eliminen el CO2 de la atmósfera, dando un gran paso en cuanto a sostenibilidad.

La Inteligencia Artificial abre grandes puertas a la biomedicina, al igual que lo hace en el resto de sectores. Y abre también un nuevo camino de desarrollo, investigación y creación de empleo en muchas compañías. Sin duda, avances que afectarán directamente a la calidad de vida de todos los habitantes del planeta, y que convierten a la IA en una de las tecnologías más importantes a día de hoy.

Esther Castaño Rico

Tech Consultant de Serbatic