viernes, 29 de abril de 2022

El diálogo y las máquinas: de la línea de comandos a la fantasía telepática

Desde que se han comenzado a utilizar máquinas, en concreto máquinas que manejan información, ha sido necesario establecer mecanismos de comunicación entre las personas y las máquinas, unos mecanismos que, inicialmente, servían como medio para que las personas pudiesen dar órdenes o solicitar cosas a las máquinas (típicamente los computadores) y obtener los resultados.

Lo interesante, y lo que motiva este artículo, es principalmente, el auge de las interfaces de naturaleza conversacional y el advenimiento del BCI y, fantaseando, una eventual telepatía mediada por las máquinas.

Pero vayamos por orden.


La interfaz más básica: el CLI y la línea de comandos


Los primeros mecanismos de verdadera interacción (elimino como diálogo la introducción de programas o datos vía tarjeta perforada) se realizaron mediante interfaces textuales de comando (CLI, 'Command Line Interface'). Se trataba, se trata en realidad, de una forma de comunicación en cierto modo primitiva, en que los comandos se encuentran limitados a un juego acotado de opciones y en que la expresión es puramente textual apta para su uso en pantallas monocromas y con escasas capacidades gráficas del tipo de los venerados terminales IBM 3270 o DEC VT100.

Es el tipo de interfaz usada con frecuencia en sistemas operativos UNIX o la famosísima línea de comandos del DOS.

Lo cierto es que, a pesar de su sencillez y aparente rigidez, una vez que se conocen los comandos y se adquiere cierta rapidez de digitación, es enormemente rápido, eficiente y eso explica que sea un mecanismo que todavía sobreviva en la actualidad.


Asomándonos a las ventanas


Sin embargo, esas interfaces CLI han sido sustituidas, en gran medida, por las interfaces que utilizan la metáfora de las ventanas y que se apoyan no sólo en teclado sino también en ratón u otros dispositivos apuntadores como, hoy en día, las pantallas táctiles. Una metáfora, y una interfaz visual, cuya concepción se adjudica a XEROX, pero lanzada por Apple y popularizada por Microsoft.

Se trata del tipo de interfaz dominante hoy en día y la Web no ha hecho otra cosa, creo, que adoptarla, apoyarla y reforzarla.

Es una forma de interfaz muy intuitiva y que, además, hasta cierto punto, uniformiza la interacción con todo tipo de aplicaciones, facilitando su aprendizaje, al menos de los primeros pasos.

Eso sí, aunque es rápida en cuanto a aprendizaje, hay que reconocer que de cara a interacciones masivas, y una vez se tiene experiencia, es en muchos casos más lenta e incluso 'pesada' que la interfaz CLI.


El auge de las interfaces conversacionales y de la voz


Y entramos ya en los mecanismos más modernos, los que más me interesan ahora mismo, empezando por las interfaces conversacionales. Lo característico de estas interfaces es que el diálogo no se ajusta a un conjunto predeterminado de comandos (como en CLI) o de acciones (botones, menús, etc) de las interfaces de ventanas, sino que adopta un estilo abierto y natural, próximo (muy próximo en sus mejores realizaciones) al diálogo humano.

En sus expresiones primeras, este tipo de interfaces pueden apoyarse, incluso, en una línea de comandos pero que reciba las entradas en lenguaje natural, en lugar de comandos cerrados. O también, en interfaces del tipo ventanas (con sus botones, sus iconos, sus desplegables) como se encuentran con muchísima frecuencia, en chatbots que se apoyan en la web o sistemas de mensajería instantánea.

Pero quizá, lo más llamativo, más diferencial y quizá con más futuro, sean las interfaces en lenguaje natural basadas en voz, cada vez más comunes, por cierto.

De hecho, ha sido el leer esta cita: 


there is now a new era starting, where the main focus is on the ability of humans having conversations not only with other people but also with the services they are using in the human way.


en el libro 'Microsoft Conversational AI Platform' de Stephan Bisser lo que me ha inspirado este artículo.

Porque, tal y como apunta el autor, y creo que está en lo cierto, vamos a asistir a un creciente uso de este tipo de interfaces de naturaleza conversacional, especialmente las de voz. 

En entornos profesionales o empresariales, veo esa proliferación principalmente en soluciones para gran público o en atención a cliente, o en tareas que no impliquen manejar mucha información o una interacción muy continua. Así, veo por ejemplo su uso para dar órdenes concretas a un robot o para consultas puntuales. En el caso de un trabajo continuado como el que hacemos hoy en día con el ordenador, creo que en muchos casos va a ser casi más rápido y cómodo seguir usando interfaces de tipo ventana o incluso CLI. Al menos yo, personalmente, no me veo durante horas hablándole al ordenador. 

Pero, sobre todo, veo un gran auge en los entornos domésticos y de ocio. Imagino un cada vez mayor uso de estas interfaces en todo tipo de dispositivos, dispositivos crecientemente más robóticos, como aspiradores, frigoríficos, televisores, coches, reproductores de música, accionadores domóticos, etc

Y, por supuesto, en los robots sociales que tanto me interesan y que con tanta frecuencia se asoman a este blog.


Las máquinas hablan entre sí: Internet de las Cosas


Y un breve apunte. No sólo las personas hablamos con las máquinas, cada vez más las máquinas hablan entre sí.

En realidad, casi desde el inicio de la informática, ha existido la comunicación entre máquinas, entre ordenadores.

Pero hoy día, con la omnipresencia de internet, con la eventual y esperada explosión del Internet de las Cosas, y con la existencia de más y más dispositivos y más y más inteligentes y autónomos, ese diálogo entre máquinas puede extenderse y puede ser, además, un diálogo crecientemente autónomo, sin necesidad de mucha intervención humana.


La última frontera: BCI y la fantasía telepática


Y finalizo este recorrido, con la forma quizá más moderna y desafiante de comunicación, aquella en que la interacción se produce de manera directa entre las máquinas y el cerebro o sistema nervioso humanos, sin la mediación del lenguaje hablado o escrito o de acciones físicas con las manos. Directo: del cerebro a la máquina o de la máquina al cerebro y/o sistema nervioso. Hablo del BCI ('Brain Computer Interface') una tecnología con mucha investigación detrás y con algunas realizaciones prácticas y muy inspiradoras como su empleo en rehabilitación o en alivio de síntomas de enfermedades como el Parkinson. Una tecnología popularizada, no sé si de la mejor manera, por Elon Musk y su Neuralink.

Una tecnología apasionante desde el punto de vista estrictamente científico y técnico, con aplicaciones interesantísimas, pero que hay que reconocer que intimida un poco, y que exige un uso controlado y ético.

Y un tipo de interfaz que, en cierto sentido, va del pensamiento a la máquina.

Y puestos a elucubrar, en el campo un poco de la ciencia-ficción, una tecnología que podría llegar a habilitar una especie de telepatía. 

Si la máquina fuese capaz de entender con detalle lo que está pensando una persona (hoy en día reconoce sólo algunas intenciones muy básicas, por ejemplo, de tipo motor) y fuese capaz de transmitir eso a otra persona, ya fuese directamente al cerebro o, indirectamente, mediante una expresión lingüística, estaríamos ante una suerte de telepatía, una telepatía, eso sí, no persona a persona directamente sino intermediada por máquinas.


Conclusiones


El diálogo está servido. Y las máquinas se han unido (las hemos unido, para ser más exactos) a ese diálogo.

Un diálogo entre humanos y máquinas y un diálogo entre las propias máquinas.

Un diálogo cada vez más sofisticado tecnológicamente, pero más natural desde el punto de vista humano.

Hemos recorrido un largo camino, partiendo de la muy eficiente pero algo primitiva línea de comandos, para llegar al auge de las interfaces conversacionales especialmente por voz y fantasear con la posibilidad de que el BCI conduzca algún día a una suerte de telepatía.

¿Qué nos traerá el futuro?


No hay comentarios:

Publicar un comentario