lunes, 11 de mayo de 2020

¿Quién enseña a los algoritmos? Explicación, conclusión y una consecuencia ética


Los algoritmos más usados actualmente en Inteligencia Artificial hoy en día, aquellos que producen los mejores y más útiles resultados, se encuadran dentro de lo que se conoce como machine learning y, más concretamente, dentro del deep learning, una variante que usa redes neuronales profundas, es decir con varias, muchas, capas.

Es bastante conocido, o eso quiero creer, que estos algoritmos parten de un modelo básico que luego debe ser entrenado, proceso mediante el cual el algoritmos aprende, lo que se traduce en la práctica en un ajuste de parámetros hasta conseguir producir el resultado deseado.


Aprendizaje de los algoritmos


Existen, básicamente, tres tipos de aprendizaje: el supervisado, el no supervisado y el aprendizaje por refuerzo, con alguna variante como el autosupervisado.

En el aprendizaje supervisado se le proporcionan al algoritmo ejemplos (muchos ejemplos) de datos de entrada y los datos de salida esperados, es decir, se le muestra al algoritmo cuál es la respuesta correcta ante una entrada concreta. Y con base en esa información se ajustan los parámetros del algoritmo.

En el aprendizaje no supervisado, sin embargo, no se le indica al algoritmo cuál es la respuesta correcta porque lo que se pretende es que el algoritmo sea el que identifique regularidades, patrones y clusteres en los datos de entrada. Pero, a cambio se le marcan el tipo de objetivos que tiene que perseguir.

Finalmente, en el aprendizaje por refuerzo, el algoritmo aprende por ensayo y error. Intenta una solución y recibe una recompensa o castigo en función de si esa solución es adecuada o no.


¿Quién enseña a los algoritmos?


En el caso del aprendizaje supervisado, vemos muy claramente que son los humanos, los desarrolladores o científicos de datos, lo que le indican al algoritmo cuál es la respuesta correcta ante cada entrada. Es decir, son humanos los que educan al algoritmo.

Puede parecer que, sin embargo, en el caso del aprendizaje no supervisado o por refuerzo que el algoritmo aprende sólo, que es autónomo en ese aprendizaje. Sin embargo, Jordi Torres, en su libro 'Python Deep Learning: Introducción práctica con Keras y TensorFlow 2' nos advierte de que eso no es exactamente así. En concreto, afirma

Es importante notar que ambos paradigmas de aprendizaje - no supervisado y por refuerzo- requieren que el entrenamiento esté diseñado por un humano.

Nos indica el profesor Torres que, en el caso del aprendizaje no supervisado, aunque el algoritmo es el que busca los patrones, recibe indicaciones acerca de qué objetivos tiene que perseguir en esa búsqueda. Es decir, los humanos están cuando menos condicionando el aprendizaje del algoritmo.

Por su lado, en el aprendizaje por refuerzo, son los humanos los que definen las recompensas o castigos y, por tanto, indirectamente, qué es un comportamiento adecuado.

El autor concluye que:

los entrenadores humanos, aunque no intervienen directamente en el bucle del aprendizaje, sí definen los límites del aprendizaje en ambos casos.

En resumen, en todos los casos de aprendizaje vistos, los humanos, o bien instruyen directamente al algoritmo (aprendizaje supervisado), o bien diseñan claramente los límites de ese aprendizaje.


Una consecuencia ética


Como conclusión, podríamos decir que son los humanos los que enseñan a los algoritmos.

Cierto que en algunos casos, más que enseñar directamente, condicionan el aprendizaje. Y cierto que se investigan y prueban otras formas de aprendizaje que podrían resultar más autónomas. Pero hoy en día, y más teniendo en cuenta la preponderancia del aprendizaje supervisado, podemos quedarnos con esa idea básica de que son los humanos los que educan a los algoritmos.

Eso, por un lado, nos debe llevar a evitar fantasías, procedentes de la tendencia hacia la antropomorfización de la inteligencia artificial, que confieren cierta personalidad y autonomía al algoritmo como si éste pensase, dedujese y decidiese por su cuenta y riesgo, No es así, los algoritmos hacen lo que se les ha enseñado, lo que le hemos enseñado los  humanos, o al menos, lo que cae dentro de los límites que les hemos establecido durante su aprendizaje.

Por otro lado, cuando pensamos en los sesgos que se producen en los algoritmos, debemos evitar de nuevo la desviación antropomórfica de atribuírselos a alguna malicia o intención del algoritmo. No es así. Los algoritmos sólo reconocen patrones en los datos con que se les ha entrenado. Si el algoritmo produce sesgos es porque se le ha enseñado con datos que tienen sesgos.

Ni los algoritmos ni los robots controlan el proceso. Lo hacemos los humanos.

Si el algoritmo produce algún resultado éticamente cuestionable, no le echemos la culpa al algoritmo o a la inteligencia artificial. Somos nosotros los que le hemos enseñado. Es nuestra responsabilidad. Asumamosla.


No hay comentarios:

Publicar un comentario