Un nuevo enfoque de aprendizaje automático puede modelar las interacciones entre variables complejas en bacterias modificadas que de otro modo serían demasiado engorrosas para predecir. Sus algoritmos podrían aplicarse a muchos tipos de sistemas biológicos.
Los ingenieros biomédicos de la Universidad de Duke desarrollaron un nuevo estudio donde entrenaron una red neuronal para predecir los patrones circulares que crearía un circuito biológico integrado en un cultivo bacteriano. El resultado fue que el sistema funcionó 30,000 veces más rápido que el modelo computacional existente.
Pero el equipo quiso aumentar la precisión, así que ideó un método para volver a capacitar el modelo de aprendizaje automático varias veces para comparar sus respuestas. Luego demostraron que el algoritmo puede funcionar para desafíos dispares al usarlo para resolver un segundo sistema biológico que es computacionalmente exigente de una manera diferente.
“Este trabajo fue inspirado por Google que muestra que las redes neuronales pueden aprender a vencer a un humano en el juego de mesa Go”, dijo Lingchong You, profesor de ingeniería biomédica en Duke. “Aunque el juego tiene reglas simples, hay demasiadas posibilidades para que una computadora calcule la mejor opción de manera determinista. Me preguntaba si ese enfoque podría ser útil para hacer frente a ciertos aspectos de la complejidad biológica que enfrentamos”.
El desafío de You y su colega posdoctoral Shangying Wang fue determinar qué conjunto de parámetros podría producir un patrón específico en un cultivo de bacterias después de un circuito genético diseñado. Durante este estudio, el sistema constaba de 13 variables bacterianas, como las tasas de crecimiento, difusión, degradación de proteínas y movimiento celular. Tan solo calcular seis valores por parámetro le tomaría a una computadora nada menos que 600 años, pero ejecutarlo en un clúster de computadora paralelo con cientos de nodos podría reducir ese tiempo de ejecución apenas a unos meses, mientras que el aprendizaje automático lo reduce a horas.
“El modelo que utilizamos es lento porque tiene que tener en cuenta los pasos intermedios en el tiempo a una velocidad lo suficientemente pequeña como para ser exactos”, dijo You. “Pero no siempre nos interesan los pasos intermedios. Solo queremos los resultados finales para ciertas aplicaciones. Y podemos (volver a) descubrir los pasos intermedios si consideramos que los resultados finales son interesantes”.
Los algoritmos de You y Wang nunca aprenderán de la misma manera dos veces, incluso si están entrenados en el mismo conjunto de respuestas. De esa manera, los doctores descubrieron que no tenían que validar cada respuesta con el modelo computacional estándar más lento, sino que solo debía utilizar la ‘sabiduría de la multitud’.
Con el modelo de aprendizaje automático entrenado y corroborado, los investigadores se propusieron usarlo para hacer nuevos descubrimientos sobre su circuito biológico. En las 100.000 simulaciones de datos iniciales utilizadas para entrenar la red neuronal, solo una produjo una colonia bacteriana con tres anillos. Pero con la velocidad de la red neuronal, You y Wang pudieron encontrar más colonias de tres anillos y también determinar qué variables fueron cruciales para producirlos. De esa manera, la red neuronal pudo encontrar patrones e interacciones entre las variables que de otro modo hubieran sido imposibles de descubrir.