miércoles, 31 de marzo de 2021

Deep learning y explicabilidad para el diseño de medicamentos

Algunas de las aplicaciones del deep learning son bien conocidas y están ampliamente documentadas, como todo lo que tiene que ver con clasificadores, con visión artificial o con procesamiento de lenguaje natural.

Sin embargo, las posibilidades son más amplias y algunas incluso algo sorprendentes.


Diseño de medicamentos


Avanzada ya la lectura del libro 'Explainable AI: Interpreting, Explaining and Visualizing Deep Learning' editado por Wojciech Samek, Grégoire Montavon, Andrea Vedaldi, Lars Kai Hansen y Klaus-Robert Müller, me encuentro, por ejemplo, con una aplicación, el diseño de medicamentos que, si bien ha ganado cierta visibilidad debido a la búsqueda acelerada de una vacuna contra el COVID-19, no está sin embargo entre las más presentes en la literatura técnica.

En esta fuente nos dice, de forma muy directa que, el diseño de medicamentos consiste en:


identify molecules that act beneficially on the human (or animal) system e.g. that have certain therapeutic effect against particular diseases.


Es decir, lo que buscamos son moléculas con capacidad terapéutica, unas moléculas que, sin embargo, y según se nos explica, no sabemos muy bien cómo deben ser. Es decir, no existe una guía o unas normas claras de qué estructura química deben tener. En cierto sentido, parece ser un proceso de ensayo y error (aunque asumo que guiado en alguna medida por el conocimiento y experiencia de los científicos).

Robot en HTS. Foto: Maggie Bartlett
Como parte de ese diseño es necesario realizar un largo proceso de evaluación ('screening') de moléculas candidatas y en diferentes concentraciones hasta encontrar la adecuada. 

Se trata de un proceso de experimentación esencialmente biológico y. aunque este proceso ya se encuentra muy automatizado y robotizado, mediante lo que se denomina High-Throughput Screening (HTS) de todas formas es un proceso largo y caro.


Screening virtual. Deep learning en diseño de medicamentos


Y para salvar esas dificultades surge el denominado screening virtual, que consiste en el uso de modelos computacionales para predecir esos efectos biológicos de moléculas, evitando la prueba biológica propiamente dicha. 

Y aquí es donde entra en juego el deep learning, porque usando esta tecnología se han conseguido buenos modelos capaces de predecir la actividad biológica con base en estructuras moleculares e, incluso, en un paso algo más allá, con deep learning se ha conseguido la generación automatizada de moléculas.

En el libro se nos explica que existen hoy en día dos tipos de modelos de deep learning que se emplean en estas labores de screening virtual, a saber, 'descriptor-based feed-forward neural networks' y 'graph convolutional neural networks'. 




En el caso de 'descriptor-based feed forward neural networks' una red de capas densas actúa sobre una entrada inicial consistente en ciertas características (descriptores) de la molécula. En el caso de las redes gráficas de convolución, sin embargo, la entrada a una red de naturaleza convolucional es un grafo que describe la estructura de la molécula.


Explicabilidad de los modelos e impacto en investigación


Ambos métodos han arrojado buenos resultados. Sin embargo, todavía queda una barrera: lo cierto es que los modelos consiguen esa predicción de la actividad biológica de moléculas...pero nos resulta difícil comprender el 'razonamiento que siguen', Se interpreta que, por ejemplo, en el caso de las redes basadas en descriptores, las neuronas internas de la red, de alguna forma, son detectores de características de las moléculas...pero no sabemos bien qué están detectando, cuáles son esas características relevantes.

Conocerlo, explicar el comportamiento interno de la red neuronal, implicaría entender mejor los propios procesos químicos y biológicos subyacentes y por ello se trabaja en la explicabilidad de este tipo de modelos de deep learning. En el libro citado, de hecho, hace una propuesta para ambos casos.

Se trata de una especie de curioso y muy valioso viaje de ida y vuelta. Comenzamos con un proceso químico / biológico, lo modelamos y, si conseguimos explicar su comportamiento, habremos aprendido más sobre el propio proceso biológico.

Alucinante.


No hay comentarios:

Publicar un comentario