Así, gozan de buen desarrollo los algoritmos de aprendizaje supervisado y no supervisado y hay buenos resultados e investigación en materia de aprendizaje por refuerzo y otras formas más o menos híbridas de aprendizaje.
En algunos aspectos, por ejemplo en la detección de patrones en los datos ocultos a la perspicacia humana, parece como si los algoritmos fuesen por delante. Sin embargo, considerado de forma general, y a pesar de los grandísimos avances, parece que el aprendizaje de las máquinas no iguala, ni de lejos, al aprendizaje humano o incluso de otros seres vivos.
Por ejemplo, los seres humanos poseemos el llamado 'sentido común' que tan difícil es que llegue a exhibir una máquina. O, también, podemos observar cómo en apariencia los seres humanos somos capaces de aprender y generalizar con muchísimos menos datos o ejemplos que los algoritmos.
¿Por qué es esto?
Bueno, si lo supiésemos con total certeza y detalle, seguramente se le podría poner remedio con relativa facilidad. Al cien por cien no lo sabemos pero sí hay cierto conocimiento y algunas ideas relevantes.
Algunas ideas sobre el aprendizaje humano
Me encuentro leyendo el libro 'Robotics, AI and Humanity', un libro, como tantos otros, escrito por multitud de autores, cual una serie de artículos o white papers reunidos en un solo volumen. En uno de los primeros capítulos de esta obra, en concreto, en uno escrito por Wolf Singer, se hacen algunas comparativas sobre el aprendizaje humano y el aprendizaje de las máquinas, que vienen al caso, e inspiran, lo que estamos hablando.
Así, cuando Singer habla del aprendizaje en lo que denomina 'sistemas naturales' (el ser humano sería un 'ser natural'), nos dice
In natural systems the model of the world is to a large extent inherited, i.e. the relevant information has been acquired by selection and adaptation during evolution, is stored in the genes and expressed in the functional anatomy of the organism and the architecture of its nervous systems. This inborn model is subsequently complemented and refined during ontogeny by experience and practice.
En este párrafo se apunta a un elemento importante que, al menos parcialmente (luego comentaré por qué digo que parcialmente), separa el aprendizaje humano del aprendizaje de máquinas: la herencia. Una herencia que en el texto aportado atribuye a la evolución y que se codifica en los genes y el diseño del sistema nervioso. Cuando nacemos, pues, y antes de que en cierto sentido comience nuestro aprendizaje, ya traemos en nuestro ser la herencia de miles o millones de años de aprendizaje evolutivo. Es decir, no partiríamos de cero (como empieza el entrenamiento de un algoritmo) sino con un nivel ya muy alto de conocimiento sobre el cual se construye el aprendizaje de cada individuo.
Sobre esta base, se añade otra que se resalta también a continuación
the necessary information is provided in part by evolution and in part by lifelong learning.
Se habla del aprendizaje continuo a lo largo de toda la vida. Aunque los algoritmos pueden ser entrenados de manera continua, en general el tiempo de entrenamiento es limitado y, una vez conseguido el ajuste deseado de parámetros y que la relación entre entradas y salidas proporcione unos resultados satisfactorios, el algoritmo deja de entrenarse (aunque las buenas prácticas de machine learning indiquen que, periódicamente, deba revisarse y considerar si se debe someter a nuevo entrenamiento para adaptarse a posibles cambios en el entorno).
Aunque no aparece en el texto que menciono, sí hay un tercer factor que me he encontrado en otras lecturas y que quisiera señalar: el factor social o cultural. Aparte de la herencia que recibamos vía genética, los seres humanos recibimos otra herencia: la cultural.
Es cierto que ésta debemos conocerla como parte de nuestro aprendizaje individual, pero también es cierto que esa cultura a la que podemos acceder, de alguna forma ya nos proporciona de una manera destilada y trabajada las conclusiones y aprendizajes obtenidos a lo largo de siglos por los seres humanos. Probablemente, aparte de servir la cultura como herencia, de alguna manera nuestra característica social hace que también durante el desarrollo de nuestra existencia, recibamos estímulos enriquecidos, pre-procesados, a partir de nuestras interacciones sociales con otras personas o con medios publicados.
El aprendizaje en algoritmos y robots
Frente a esta formas más o menos avanzadas y diferenciales del aprendizaje humano, nos encontramos, siguiendo la fuente citada, con que:
Artificial systems have no evolutionary history but are the result of a purposeful design, just as any other tool humans have designed to fulfil special functions.
En efecto, los algoritmos, los robots, no han vivido esa evolución no tienen esa herencia. Su aprendizaje con frecuencia parte de cero, es normalmente concentrado en el tiempo, orientado a una tarea concreta y basado en unos datos relativamente recientes.
Sin embargo, y por eso hablaba antes de 'parcialmente' hoy en día esto ya no es cierto al cien por cien.
Un campo que ya se utiliza y en el que se trabaja es el del transfer learning que lo que busca (y ya consigue en ciertos ámbitos como la visión artificial) es no tener que entrenar a un algoritmo (típicamente una red neuronal) desde cero, sino partir de y reutilizar redes parcialmente entrenadas y, sobre ellas hacer un ajuste final a nuestro problema concreto.
En cierto sentido, además, el hecho de que con frecuencia los algoritmos de inteligencia artificial estén proporcionados desde la nube por los hiper-escaladores (Amazon, Microsoft, Google, IBM,...) hace que el aprendizaje y mejora de los algoritmos que éstos fabricantes obtienen, se transmitan de alguna forma a todos sus clientes y usuarios.
Es decir, alguna capacidad de herencia y reutilización de conocimiento anterior ya se está implementando hoy en día, aunque parece estar muy lejos de la herencia que mencionábamos anteriormente en los seres vivos incluyendo los seres humanos.
En cuanto al aprendizaje continuo, y aunque en general los algoritmos se entrenan durante un tiempo acotado, no parece teóricamente imposible ni mucho menos (aunque pueda tener dificultades prácticas) dejar que un algoritmo continúe aprendiendo indefinidamente durante toda su vida útil.
En cuanto al factor cultural, creo que en cierto modo los robots y algoritmos se benefician parcialmente de esa herencia cultural. ¿En qué sentido? Bueno, en el sentido de que, de alguna forma, su propio diseño, los datos que les proporcionamos para el entrenamiento, la famosa ingeniería de características, se basa en el conocimiento del dominio que los humanos tenemos y que, en cierto sentido, transmitimos al algoritmo. Es decir, a través de las personas se benefician parcialmente de esa herencia cultural, aunque probablemente de manera muy limitada.
Y no se hace mucho uso, aunque no es en teoría imposible, de la interacción social como forma de aprendizaje. Los robots sociales o los agentes conversacionales están diseñados para esa interacción social. Cierto es que, todavía tienen que mejorar y que, en general, la interacción social no se usa como una fuente de aprendizaje sino como su objetivo final. Diría que no es técnicamente imposible el aprendizaje de las máquinas a partir de la interacción social, pero sí que es complejo y que no es algo que se está haciendo de forma generalizada.
Conclusión
Las conclusiones que podemos obtener no son muy sorprendentes.
Por un lado, se identifican algunos aspectos (y puede que haya más), que diferencian el aprendizaje natural (incluyendo el de los seres humanos) del aprendizaje de las máquinas, unas diferencias que, en general, ponen en mucha ventaja (aunque no siempre) a los seres humanos cuando hablamos no de tareas muy específicas, sino de adaptación general.
Pero, y como cabe imaginar, en el campo de la inteligencia artificial se intenta avanzar en mejorar ese aprendizaje de las máquinas, en unos casos emulando a los seres vivos y en otros buscando vías alternativas.
Hay muchísimo camino por delante... y muy interesante, desde luego.