Blue chip: Hablemos de agentes (III): arquitecturas reactivas, deliberativas e híbridas

lunes, 30 de junio de 2025

Hablemos de agentes (III): arquitecturas reactivas, deliberativas e híbridas

Abordamos en este tercer artículo de la serie dedicada a los agentes, el tema de las arquitecturas de alto nivel de estos agentes.

Aunque, quizá, pueda parecer un tema algo abstracto y de alto nivel, personalmente me parece muy interesante, muy relevante y práctico, con aplicación real desde ya, y desde hace años, no ya en solo en la emergente Agentic AI, sino también en robótica.

Como en la mayor parte de los artículos de esta serie, me baso en buena medida en el libro 'Building Agentic AI systems' de Anjanava Biswas y Wrick Talukdar.

Como anuncia el título del post, vamos a revisar las tres grandes familias de arquitecturas:

Arquitecturas reactivas
Arquitecturas deliberativas
Arquitecturas híbridas

Arquitecturas reactivas

Las arquitecturas reactivas se basan en un modelo estímulo-respuesta en que, ante un estímulo, el agente proporciona, de manera inmediata, una respuesta. No disponen de una base de conocimiento y se basan en reglas sencillas que hacen corresponder a cada estímulo la respuesta adecuada.

Sus características y sus ventajas, serían:

Velocidad y capacidad de respuesta: Al acoplar directamente acciones a percepciones, sin una deliberación intermedia, consiguen muy buenos tiempos de respuesta.

Robustez y tolerancia a fallos: Por su simplicidad, son resistentes al ruido o la información incompleta y poco dadas a fallos catastróficos, ya que unos componentes tienden a compensar a otros.

Manejo de la incertidumbre: Se pueden adaptar directamente a estímulos cambiantes sin necesidad de disponer de un modelo del entorno o una base de conocimiento.

Procesamiento paralelo y distribuido: Permiten, y con frecuencia así se hace, su implementación usando módulos reactivos paralelos. Esto habilita el tratamiento de tareas más complejas y proporciona escalabilidad y modularización.

Emergencia de comportamientos complejos: A pesar de su simplicidad, los sistemas reactivos pueden presentar comportamientos emergentes complejos e inteligentes.

Este tipo de arquitecturas se utilizan en sistemas que deben funcionar en tiempo real donde la robustez y el tiempo de respuesta son fundamentales, como en sistemas de control, videojuegos o robótica, de la que luego hablaremos brevemente.

Por desgracia, también plantean algunas desventajas. Así, carecen de la capacidad de planificación a largo plazo. También presentan dificultades para tratar con tareas que necesitan de pensamiento abstracto y, además, su capacidad de aprendizaje a partir de la experiencia es muy limitada, lo que también coarta su capacidad para la adaptación en el tiempo.

Arquitecturas deliberativas

En las arquitecturas deliberativas se utilizan unas reglas explícitas de razonamiento basadas en unos conocimientos, una base de conocimiento, también explícita y habitualmente expresada mediante un lenguaje formal. Es la arquitectura propia de los sistemas simbólicos

Suelen seguir un ciclo percibir-planificar-actuar ('sense-plan-act') según el cual, primero se obtiene (percibe) información del entorno, luego se planifica la actuación con base a lo percibido y los conocimientos de la base de conocimientos y, finalmente, se ejecuta la acción. Los pasos serían:

Percepción ('sensing'): El agente adquiere información de su entorno mediante sensores o mecanismos de entrada.

Actualización del conocimiento: Con la información percibida, se actualiza la base de conocimiento, asegurando una adecuada y actualizada representación interna del entorno del agente.

Planificación y razonamiento: A partir de la base de conocimiento y aplicando los algoritmos adecuados (algoritmos de búsqueda, inferencia lógica, etc), el agente aplica técnicas de razonamiento para obtener un plan de acción

Ejecución del plan: El agente aplica las acciones definidas sobre el entorno, habitualmente modificándolo de alguna manera.

La principal ventaja de este tipo de arquitecturas es su capacidad para afrontar problemas complejos. También son capaces de enfrentarse a problemas con incertidumbre o ambigüedad usando técnicas como el razonamiento probabilista o la lógica difusa ('fuzzy logic').

Sin embargo, también adolecen de algunas debilidades. Quizá el mayor problema sea conseguir esa base de conocimiento en dominios en constante evolución o sobre temáticas difíciles de formalizar. Adicionalmente, son arquitecturas costosas computacionalmente.

Arquitecturas híbridas

Como ocurre en tantas cosas, para superar las limitaciones de modelos más o menos puros, se acude a modelos intermedios o híbridos. Y las arquitectura de agentes no son una excepción y también se plantean arquitectura híbridas que incluyen una capa reactiva para las respuestas rápidas en tiempo real y una capa deliberativa para la planificación y el razonamiento de alto nivel.

En estas arquitecturas la interacción entre las dos capas es fundamental, proporcionando la capa reactiva información en tiempo real a la deliberativa, y aportando por su parte la capa deliberativa planes de alto nivel, restricciones, etc que matizan el comportamiento reactivo.

Para conseguir comportamientos complejos, estas arquitecturas aplican técnicas como:

Descomposición de tareas: Los trabajos se descomponen en tareas realizadas por las capas. Así, las tareas de bajo nivel o críticas en el tiempo son realizadas por la capa reactiva mientras que las tareas de planificación y coordinación son gestionadas por la capa deliberativa.

Selección multiplan: La capa deliberativa puede general planes múltiples y es la capa reactiva la que, en función de la situación del entorno, elige el más adecuado.

Planificación con módulos externos: La capa deliberativa puede incorporar módulos externos para tareas complejas, como algoritmos de planificación, optimización de rutas o de asignación de recursos.

Reflexión y refinamiento: la capa deliberativa también puede 'reflexionar' sobre los resultados obtenidos en los planes ya ejecutados, aprender de la experiencia y refinar su razonamiento.

Planificación con memoria aumentada ('memory-augmented planning'): la capa deliberativa puede mantener una memoria de los planes pasados, las decisiones, los resultados, etc y apoyarse en ellos para futuros razonamientos o planificaciones.

En principio, estas arquitecturas híbridas ofrecen lo mejor de los dos mundos, pero no son tan sencillas de definir y desarrollar y actualmente es un campo en activa investigación.

El caso de la robótica

Ya hemos mencionado repetidas veces en este blog, incluso en esta serie de posts dedicados a los agentes, que una de las mejores formas de iniciar la definición de lo que es un robot, es partiendo de la idea de agente inteligente.

Y, en efecto, y como ya comentamos hace dos años en el post 'Sobre la arquitectura operativa de robots inteligentes', estas mismas arquitecturas se llevan aplicando en robótica desde hace un tiempo.

Especialmente, y en acciones docentes, suelo resaltar la importancia de la capa reactiva y los denominados comportamientos ('behaviors') que pueden conducir, a partir de una programación / configuración relativamente sencilla del robot, a comportamientos emergentes muy adaptados y en apariencia inteligentes.

El paralelismo neurológico-cognitivo

Y en ese mismo post nos hacíamos eco de algo que creo que es interesante y que quiero volver a traer a colación aquí, y es la inspiración y cierto paralelismo de estas arquitecturas con el funcionamiento de los seres vivos en general y el ser humano, el agente por excelencia, en particular.

Así, la capa reactiva se corresponde bastante bien con los comportamientos automáticos, especialmente los comportamientos reflejos del ser humano, mientras que la capa deliberativa 'mapea' bien con los procesos de razonamiento y decisión conscientes.

En cierto modo, podemos pensar que los seres humanos exhibimos una avanzada arquitectura híbrida.

Conclusiones

Vemos dos esquemas básicos de arquitectura, la reactiva y la deliberativa y una vía intermedia o, casi mejor, conjunta.

Las arquitecturas reactivas, muy implementadas y exitosas, construyen comportamientos más o menos complejos a partir de simples pares estímulos respuesta.

Por su parte, las deliberativas, más complejas y todavía con mucho desarrollo posible por delante, proporcionan planificación y razonamiento.

Como síntesis de ambas, tenemos las arquitecturas híbridas, bastante en investigación, y que proporcionan un valioso y no casual paralelismo con la actuación humana, y que, caso de conseguirse implementaciones avanzadas, podrían suponer un enorme salto cualitativo en sistemas cognitivos de todo tipo.

Blue chip

lunes, 30 de junio de 2025

Hablemos de agentes (III): arquitecturas reactivas, deliberativas e híbridas

Arquitecturas reactivas

Arquitecturas deliberativas

Arquitecturas híbridas

El caso de la robótica

El paralelismo neurológico-cognitivo

Conclusiones

Artículos de este blog relacionados

No hay comentarios:

Publicar un comentario

Acerca de mi

Identidad digital

Suscripción

Mis otros sitios en Internet

También colaboro en...

En Twitter

En Facebook

Secciones fijas

Blogroll - Gurús

Blogroll - Otros Chips

Blogroll - Chips corporativos

En mis otros blogs...

Suscriptores

Contador y estadísticas

Páginas vistas

Entradas populares

Disclaimer

Artículos por etiquetas

Archivo

Compartir