La startup de inteligencia artificial SandboxAQ, surgida de Alphabet y respaldada por Nvidia, presentó este miércoles un conjunto masivo de datos diseñado para acelerar el desarrollo de tratamientos médicos, al facilitar que los científicos comprendan cómo interactúan los medicamentos con las proteínas.
El objetivo es permitir a los investigadores predecir si un fármaco se unirá correctamente a su objetivo dentro del cuerpo humano.
Aunque los datos se basan en experimentos reales, no provienen directamente de un laboratorio. En su lugar, SandboxAQ —que ha recaudado cerca de 1,000 millones de dólares en capital de riesgo— generó esta información utilizando chips de Nvidia.
La compañía planea emplearla para alimentar modelos de inteligencia artificial que permitan a los científicos predecir con rapidez si una molécula farmacéutica se adherirá a la proteína objetivo, un paso crítico en el desarrollo de nuevos fármacos.
Por ejemplo, si un medicamento busca inhibir un proceso biológico relacionado con una enfermedad, los investigadores pueden utilizar esta herramienta para anticipar si la molécula se enlazará con las proteínas implicadas en dicho proceso.
Esta técnica forma parte de un campo emergente que combina simulación científica con inteligencia artificial. Aunque en muchas áreas los científicos disponen de ecuaciones que predicen con precisión cómo se combinan los átomos para formar moléculas, incluso las estructuras más pequeñas presentan un número tan amplio de combinaciones que resulta inviable calcularlas manualmente, incluso con supercomputadoras.
La estrategia de SandboxAQ consistió en utilizar datos experimentales para generar aproximadamente 5.2 millones de nuevas moléculas tridimensionales sintéticas. Estas estructuras no han sido observadas directamente, pero fueron calculadas mediante ecuaciones respaldadas por datos del mundo real.
Estos datos sintéticos, que ahora están disponibles públicamente, pueden utilizarse para entrenar modelos de inteligencia artificial capaces de predecir en muy poco tiempo si una molécula puede unirse a una proteína, sin sacrificar precisión frente a los métodos tradicionales.
SandboxAQ también ofrece modelos propios desarrollados con esta base de datos como un servicio comercial, con el objetivo de replicar virtualmente los resultados que normalmente se obtienen en laboratorio.
Según Nadia Harhen, directora general de simulación con inteligencia artificial en SandboxAQ, este es un problema de larga data en biología que la industria ha intentado resolver durante años. Las estructuras generadas computacionalmente están vinculadas a datos experimentales verificables, lo que permite usarlas para entrenar modelos de IA de una forma sin precedentes.