lunes, 9 de enero de 2017

Redes neuronales: quizá no tan cerca del cerebro humano

Una de las explicaciones básicas sobre las redes neuronales, y probablemente uno de sus primeros atractivos, dejando a un lado sus resultados, es que se inspiran en el cerebro humano y en el sistema nervioso.

Si ambos están constituidos por neuronas, que, reciben impulsos en las dendritas, los procesan y transmiten el resultado por los axones que se unen a otras neuronas, las redes neuronales artificiales están formados por unos nodos (que emulan a las neuronas) que reciben unos inputs a través de las conexiones de entrada (algo así como las dendritas), los procesan y transmiten el resultado por las conexiones salientes (algo así como los axones).

 Esta metáfora, es la que inspira las redes neuronales artificiales y la que parece explicar, si es que explicar es la palabra, que las redes neuronales puedan conseguir resultados más cercanos a la inteligencia y al comportamiento humanos.

Sin embargo, parece que cuando se avanza en las redes neuronales artificiales, y muy en especial, en las que se emplean en deep learning. comienzan a existir divergencias no menores.

Al menos esos es lo que se deduce leyendo a Daniel Graupe, quien, en su libro 'Deep Learning Neural Networks', nos dice:

whereas Neural Networks are supposed to follow or to approximate a general architecture based on the organization of the biological Central Nervous System (CNS), many if not most of the DLNN (Deep Learning Neural Networks) architectures have little in common with any CNS architecture. Also, our knowledge of the CNN itself is stll too weak to allow modeling of its deep learning.

Dos cosas a tener en cuenta. Por un lado, el diseño de redes neuronales para deep learning emplea otros algoritmos no conexionistas para complementar el algoritnmo básico de la red neuronal, todo ello en busca del más que comprensible objetivo de obtener mejores resultados.

Por otro lado, el reconocimiento explícito de que aún no conocemos suficientemente el sistema nervioso central como para emularlo en un algoritmo, neuronal o del tipo que sea.

La parte fea, y digo fea más que mala, es que parece que las redes neuronales de deep learning son algo menos neuronales de lo que creíamos y que se utilizan de forma menos elegante de lo que la metáfora de partida hacía suponer.

Pero también hay una lectura más que positiva. Por una parte, que se obtienen resultados... y eso es bueno en sí mismo.  Por otro es que, si somos capaces de obtener resultados positivos, e incluso sorprendentes, con un modelo burdo del sistema nervioso central ¿qué no seremos capaces de hacer cuando lo conozcamos mejor?

Queda camino, desde luego... y un camino que se presume apasionante...