miércoles, 21 de mayo de 2025

La inteligencia artificial transversal (IV): embodied AI y el salto a la robótica e IoT

En los tres posts anteriores de esta serie, he mostrado tres formas en que creo que la inteligencia artificial está abandonando un poco la visión de inteligencia artificial débil para convertirse en una inteligencia artificial más transversal, que no general: la superación de la división discriminativa-generativa, la omnimodalidad y la inclusión de razonamiento.

En este cuarto, y casi último post (haré sólo otro artículo a modo de recapitulación y conclusiones), abordo una de las últimas grandes tendencias: la inteligencia artificial física o 'embodied AI', es decir, el salto de la inteligencia artificial al mundo físico.


Una vieja aspiración y una vieja 'tendencia'


En realidad, la conexión entre inteligencia artificial y el mundo físico, muy especialmente en la robótica, no es algo nuevo, sino algo muy antiguo y, de hecho, y aunque esto sea sólo a título anecdótico, cuando intentamos representar en una imagen la inteligencia artificial, habitualmente recurrimos a la imagen de un robot, es decir, algo plenamente físico.

Es cierto que muchas de las apariencias de 'inteligencia' presentes en los robots, se alcanza por mecanismos que nada tienen que ver con la inteligencia artificial, notablemente mediante la implementación de pares estímulo-respuesta, los denominados comportamientos ('behaviors') que simulan de manera más que exitosa los comportamientos reflejos de los seres vivos.

Pero la inteligencia artificial está presente en la robótica desde hace años o décadas. Así, capacidades cognitivas basadas en inteligencia artificial, como la visión artificial, se emplean desde hace muchos años en robótica para tareas relativamente simples, como la detección de defectos en piezas. Aunque no sea realmente robótica, formas específicas de inteligencia artificial como el OCR son comunes en los parkings para el reconocimiento de matrículas.

En los últimos años, y más orientado hacia robótica social, la inclusión de capacidades de tratamiento de voz y de lenguaje natural, son casi comunes tanto en soluciones software como en robots físicos u otro tipo de máquinas.

Y qué decir del vehículo autónomo, una forma especializada de robot, en cuyo software hay 'toneladas' de inteligencia artificial, no sólo para percepción, sino también para planificación y navegación.

En el campo más del internet de las cosas, ya desde hace años, es relativamente común el uso de modelos predictivos para soluciones como el mantenimiento predictivo en que se aplican modelos de machine learning sobre los datos del mundo físico recogidos mediante sensores. 

Si, la hermandad de la inteligencia artificial con la robótica y otras máquinas físicas viene desde muy atrás.

¿Qué hay de nuevo, entonces?


Lo que hay de nuevo


En realidad, lo nuevo es precisamente la transversalidad, la integración de esta orientación física con modelos que hacen muchas más cosas.

En todas las soluciones que he mencionado en la sección anterior se utiliza la inteligencia artificial combinada con el mundo físico en soluciones de robótica, internet de las cosas y mas, pero se hace un poco 'en el estilo' de la inteligencia artificial débil, es decir, hay módulos inteligentes que se encargan de una tarea muy específica y sólo de esa.

La novedad es que ahora, la interacción con el mundo físico se integra de manera mucho más íntima, más natural, en modelos de inteligencia artificial que valen para muchas otras cosas.


Agentes de la Agentic AI y razonamiento


Y para entenderlo, hay que recordar brevemente qué son estos nuevos agentes de que nos habla la 'Agentic AI'. Vimos en el post anterior cómo estos agentes, implementan en modelo tradicional de agente usando como mecanismo de control un modelo de los que llamamos generativos o grandes modelos de lenguaje (aunque en los artículos anteriores de esta serie, y precisamente por su transversalidad, sugiero que habría que denominarlos con otro término).

Dado que usamos modelos generativos, estamos implementando agentes con las mismas soluciones que utilizamos para procesamiento de lenguaje natural o creación de imágenes.

Pero, además, y como vimos en el post anterior, estos modelos son ya del tipo 'razonador', es decir, capaces de crear, seguir y modificar dinámicamente planes de acción, razonando a partir de lo que van encontrando y en busca de satisfacer un objetivo. El salto que esto supone para la inteligencia artificial en general y para sus posibilidades de traslación al mundo físico es, en mi opinión, enorme.

Disponemos ya hoy en día (aunque incipientes y evolucionando y mejorando) de esos modelos capaces de 'razonar' dinámicamente y 'decidir' de forma autónoma.


Agentes y herramientas


El último ingrediente, o casi último, es la inclusión de lo que se suele denominar herramientas ('tools'). Las herramientas son algo así como módulos que el modelo, o elagente, puede invocar y que extienden sus capacidades, típicamente de conexión con el mundo exterior.

En la inteligencia artificial que es puro software, las herramientas más habituales son, por ejemplo, la búsqueda en la web mediante un motor SEO, pero ya está disponible la creación y ejecución de programas python para la lectura y análisis de datos en una hoja excel o para la creación de gráficas de tipo líneas o histogramas. Y también es posible, claro, la invocación de APIs, por ejemplo de tipo REST.

En soluciones como las que ofrece Microsoft, esto se extiende de manera natural con la visión más tradicional de los conectores que permiten la interacción con todo tipo de formatos de ficheros y con todo tipo de aplicaciones (sistemas empresariales, correo electrónico, ofimática, etc) al estilo de lo que ocurre, por ejemplo, en soluciones RPA.


La 'sencilla' extensión a la inteligencia artificial física y la embodied AI.


Conseguido lo anterior, el salto al mundo físico parece evidente, casi trivial: basta con que entre esas herramientas incluyamos 'drivers' para interactuar con el mundo físico, para la lectura de sensores o para la acción sobre actuadores.

Es cierto que el mundo físico presenta dificultades propias y que, seguramente, en las implementaciones reales, aparezcan dificultades y retos, pero la integración está servida y, en el punto en que estamos, y al menos a nivel de arquitectura o esquema general, no parece complicada.

Si el salto al mundo físico ya está listo, el uso de esos modelos generativos razonadores y 'revitaminados' en soluciones de robótica o de Internet de las cosas, por ejemplo, está igualmente servido, aportando nuevas perspectivas de inteligencia y autonomía para ese tipo de soluciones y dando un nuevo salto, casi definitivo, al mundo físico.

Las perspectivas son apasionantes.


Conclusiones


En el cuarto salto en la transversalidad de la inteligencia artificial, nos encontramos con la unión natural, e integrada con otras muchos capacidades, del mundo físico, de sensores y actuadores, que nos abren enormes perspectivas en robótica e internet de las cosas.


Artículos de este blog relacionados

No hay comentarios:

Publicar un comentario