Como en la mayor parte de los artículos de esta serie, me baso en buena medida en el libro 'Building Agentic AI systems' de Anjanava Biswas y Wrick Talukdar.
Como anuncia el título del post, vamos a revisar las tres grandes familias de arquitecturas:
- Arquitecturas reactivas
- Arquitecturas deliberativas
- Arquitecturas híbridas
Arquitecturas reactivas
Las arquitecturas reactivas se basan en un modelo estímulo-respuesta en que, ante un estímulo, el agente proporciona, de manera inmediata, una respuesta. No disponen de una base de conocimiento y se basan en reglas sencillas que hacen corresponder a cada estímulo la respuesta adecuada.
Sus características y sus ventajas, serían:
- Velocidad y capacidad de respuesta: Al acoplar directamente acciones a percepciones, sin una deliberación intermedia, consiguen muy buenos tiempos de respuesta.
- Robustez y tolerancia a fallos: Por su simplicidad, son resistentes al ruido o la información incompleta y poco dadas a fallos catastróficos, ya que unos componentes tienden a compensar a otros.
- Manejo de la incertidumbre: Se pueden adaptar directamente a estímulos cambiantes sin necesidad de disponer de un modelo del entorno o una base de conocimiento.
- Procesamiento paralelo y distribuido: Permiten, y con frecuencia así se hace, su implementación usando módulos reactivos paralelos. Esto habilita el tratamiento de tareas más complejas y proporciona escalabilidad y modularización.
- Emergencia de comportamientos complejos: A pesar de su simplicidad, los sistemas reactivos pueden presentar comportamientos emergentes complejos e inteligentes.
Arquitecturas deliberativas
Suelen seguir un ciclo percibir-planificar-actuar ('sense-plan-act') según el cual, primero se obtiene (percibe) información del entorno, luego se planifica la actuación con base a lo percibido y los conocimientos de la base de conocimientos y, finalmente, se ejecuta la acción. Los pasos serían:
- Percepción ('sensing'): El agente adquiere información de su entorno mediante sensores o mecanismos de entrada.
- Actualización del conocimiento: Con la información percibida, se actualiza la base de conocimiento, asegurando una adecuada y actualizada representación interna del entorno del agente.
- Planificación y razonamiento: A partir de la base de conocimiento y aplicando los algoritmos adecuados (algoritmos de búsqueda, inferencia lógica, etc), el agente aplica técnicas de razonamiento para obtener un plan de acción
- Ejecución del plan: El agente aplica las acciones definidas sobre el entorno, habitualmente modificándolo de alguna manera.
Arquitecturas híbridas
Como ocurre en tantas cosas, para superar las limitaciones de modelos más o menos puros, se acude a modelos intermedios o híbridos. Y las arquitectura de agentes no son una excepción y también se plantean arquitectura híbridas que incluyen una capa reactiva para las respuestas rápidas en tiempo real y una capa deliberativa para la planificación y el razonamiento de alto nivel.
En estas arquitecturas la interacción entre las dos capas es fundamental, proporcionando la capa reactiva información en tiempo real a la deliberativa, y aportando por su parte la capa deliberativa planes de alto nivel, restricciones, etc que matizan el comportamiento reactivo.
Para conseguir comportamientos complejos, estas arquitecturas aplican técnicas como:
- Descomposición de tareas: Los trabajos se descomponen en tareas realizadas por las capas. Así, las tareas de bajo nivel o críticas en el tiempo son realizadas por la capa reactiva mientras que las tareas de planificación y coordinación son gestionadas por la capa deliberativa.
- Selección multiplan: La capa deliberativa puede general planes múltiples y es la capa reactiva la que, en función de la situación del entorno, elige el más adecuado.
- Planificación con módulos externos: La capa deliberativa puede incorporar módulos externos para tareas complejas, como algoritmos de planificación, optimización de rutas o de asignación de recursos.
- Reflexión y refinamiento: la capa deliberativa también puede 'reflexionar' sobre los resultados obtenidos en los planes ya ejecutados, aprender de la experiencia y refinar su razonamiento.
- Planificación con memoria aumentada ('memory-augmented planning'): la capa deliberativa puede mantener una memoria de los planes pasados, las decisiones, los resultados, etc y apoyarse en ellos para futuros razonamientos o planificaciones.
El caso de la robótica
Ya hemos mencionado repetidas veces en este blog, incluso en esta serie de posts dedicados a los agentes, que una de las mejores formas de iniciar la definición de lo que es un robot, es partiendo de la idea de agente inteligente.
Y, en efecto, y como ya comentamos hace dos años en el post 'Sobre la arquitectura operativa de robots inteligentes', estas mismas arquitecturas se llevan aplicando en robótica desde hace un tiempo.
Especialmente, y en acciones docentes, suelo resaltar la importancia de la capa reactiva y los denominados comportamientos ('behaviors') que pueden conducir, a partir de una programación / configuración relativamente sencilla del robot, a comportamientos emergentes muy adaptados y en apariencia inteligentes.
El paralelismo neurológico-cognitivo
Y en ese mismo post nos hacíamos eco de algo que creo que es interesante y que quiero volver a traer a colación aquí, y es la inspiración y cierto paralelismo de estas arquitecturas con el funcionamiento de los seres vivos en general y el ser humano, el agente por excelencia, en particular.
Así, la capa reactiva se corresponde bastante bien con los comportamientos automáticos, especialmente los comportamientos reflejos del ser humano, mientras que la capa deliberativa 'mapea' bien con los procesos de razonamiento y decisión conscientes.
En cierto modo, podemos pensar que los seres humanos exhibimos una avanzada arquitectura híbrida.
Conclusiones
Vemos dos esquemas básicos de arquitectura, la reactiva y la deliberativa y una vía intermedia o, casi mejor, conjunta.
Las arquitecturas reactivas, muy implementadas y exitosas, construyen comportamientos más o menos complejos a partir de simples pares estímulos respuesta.
Por su parte, las deliberativas, más complejas y todavía con mucho desarrollo posible por delante, proporcionan planificación y razonamiento.
Como síntesis de ambas, tenemos las arquitecturas híbridas, bastante en investigación, y que proporcionan un valioso y no casual paralelismo con la actuación humana, y que, caso de conseguirse implementaciones avanzadas, podrían suponer un enorme salto cualitativo en sistemas cognitivos de todo tipo.
No hay comentarios:
Publicar un comentario