viernes, 26 de septiembre de 2025

Cómo construir agentes de IA según Wisbas y Talukdar

En el momento de publicarse, Abril de 2025, 'Building Agentic AI Systems' probablemente sea uno de los primeros libros serios lanzados al mercado en materia de agentes basados en grandes modelos de lenguaje generativos. Se trata de un libro riguroso, que aborda, con fuerte carga conceptual, los diferentes aspectos de diseñó e implementación de agentes y sistemas basados en agentes, incluyendo los sistemas multiagente.

El libro, se compone de once capítulos agrupados en tres partes, como sigue:
  • 'PART 1: FOUNDATIONS OF GENERATIVE AI AND AGENTIC SYSTEMS': Una parte introductoria tanto a la inteligencia artificial generativa como a los propios agentes, y que se concreta en tres capítulos:

    • 'Chapter 1 - Fundamentals of generative AI:' Hace una introducción muy sencilla a lo que son los modelos generativos, explica brevemente algunos de los enfoques existentes como las redes adversarias, los autocodificadores variacionales o los transformers y repasa algunas problemáticas como la calidad de datos de entrenamiento, los sesgos, el consumo computacional y algunos otros retos de naturaleza ética.

    • 'Chapter 2 - Principles of agentic systems:' Con un enfoque de alto nivel y arquitectura, explica conceptos definitorios de un agente como el auto-gobierno, la agencia y la autonomía. Con ese mismo enfoque explica también las arquitecturas básicas, a saber, deliberativa, reactiva e híbrida, y finaliza aportando conceptos sobre sistemas multiagente.

    • 'Chapter 3 - Essential components of intelligent agents:' Se centra en explicar tres mecanismos fundamentales de los agentes: en primer lugar, la representación del conocimiento mediante redes semánticas, 'frames' o lógica; en segundo lugar los tipos de mecanismos de razonamiento: deductivo, inductivo y abductivo; y, en tercer lugar, mecanismos de planificación y toma de decisiones.

  • 'PART 2: DESIGNING AND IMPLEMENTING GENERATIVE AI-BASED AGENTS': Probablemente, la sección nuclear y más importante desde el punto de vista técnico, con la explicación de los principales elemetos arquitectónicos, de diseño y de implementación. Se divide en cuatro capítulos:

    • 'Chapter 4 - Reflection and introspection in agents:' Explica los mecansimos de reflexión e introspección. Tras aportar conceptos y justificar su importancia, describe cuatro formas de implementación: razonamiento tradicional, meta-razonamiento, auto-explicación y auto-modelado.Finalmente aporta algunos ejemplos y casos de uso.

    • 'Chapter 5 - Enabling tool use and planning in agents:' Aborda la interacción de los agentes con recursos externos mediante herramientas. Primero explica lo que son las herramientas y su papel. Sigue con una descripción de los algoritmos de planificación para luego indicar cómo se integran las herramientas en el razonamiento y la planificación. Finaliza mostrando ejemplos de implementación con los frameworks CrewAI, AutoGen y LangGraph.

    • 'Chapter 6 - Exloring the Coordinator, Worker, and Delegator approach:' Tal y como reza el título, se explica el patrón CWD ('Coordinator', 'Worker', 'Delegator') que implica el uso de varios agentes, asumiendo roles diferentes pero coordinados. Además de detallar el modelo en sí mismo, aporta ideas sobre cómo diseñar los diferentes agentes, los mecanismos de comunicación y coordinación entre ellos y finaliza con algunos consejos de implementación.

    • 'Chapter 7 - Effective agentic system design techniques:' Aborda cuantro elementos de diseño de interés: por un lado, el diseño de las instrucción ('prompts') para los agentes; por otro, el modelado del entorno y el uso de espacios de estados: a continuación, la tipología y uso de memorias; y, para finalizar, el enfoque secuencial o paralelo.

  • 'PART 3: TRUST, SAFETY, ETHICS AND APPLICATIONS': Abandona un poco el núcleo de lo que son los agentes y cómo funcionan y se diseñan para tratar algunos temas de contexto algo diversos, y lo hace con los cuatro capítulos finales:

    • 'Chapter 8 - Building trust in generative AI systems:' Habla de mecanismos que aportan confianza en los agentes desde el punto de vista tanto técnico como ético. Repasa primero algunas técnicas o problemáticas como la trasparencia y explicabilidad, la incertidumbre y los sesgos, la generación de salidas comprensibles y efectivas, el control del usuario y su consentimiento y algún avance en materia de ética y responsabilidad. Finaliza con algúnos consejos sobre cómo implementar algunas de estas técnicas.

    • 'Chapter 9 - Managing safety and ethical considerations:' No sin un cierto solape con el capítulo anterior, se tratan temas de seguridad y éticos. Así, por ejemplo, en lo relativo a seguridad se habla de ataques adversarios, de sesgos y discriminación, de alucinaciones, de violaciones de la privacidad o de riesgos relativos a propiedad intelectual. En la segunda parte del capítulo, salta ya a una visión más ética hablando del diseño centrado en el ser humano, de elementos de responsabilidad o de privacidad y de protección de datos.

    • 'Chapter 10 - Common use cases and applications:' Explica el uso de agentes en cuatro grandes campos, a saber: creación artística, procesamiento del lenguaje y conversaciones, robótica y sistemas de soporte a la decisión.

    • 'Chapter 11 - Conclusions and future outlook:' Una mirada algo más futurista, en que primero se tratan lo que los autores perciben como principales tendencias, luego se explican ideas sobre la inteligencia artificial general, AGI ('Artificial General Intelligence') para acabar con una breve identificación de riesgos y oportunidades.

'Building Agentic AI Systems' es un libro serio y riguroso sobre el emergente campo de los agentes basados en modelos generativos. Aporta una fuerte carga teórica y conceptual y un enfoque más de arquitectura y diseño que de implementación o desarrollo. No obstante, a lo largo del libro de vez en cuando se aportan pequeñas secciones de código, con frecuencia apoyadas en el 'framework' CrewAI.

Aunque quizá hubiera agradecido un poco más de código y, sobre todo, un mayor acercamiento a lo que están haciendo e implementando en materia de agentes organizaciones como OpenAI, Microsoft, Anthropic, etc. creo que se trata de un buen libro, y recomendable para personas a las que interese no sólo el paso directo a la construcción, sino también entender los conceptos que hay detrás.

Anjanava Wisbas

(Fuente: traducción asistida con IA de su Página oficial)

Anjanava Wisbas
Anjan, arquitecto sénior de soluciones especializado en Inteligencia Artificial en AWS, es líder en Inteligencia Artificial y Machine learning, y se centra en la IA generativa, visión artificial, procesamiento del lenguaje natural (NLP) y la seguridad y el alineamiento de la IA.

Con 16 años de experiencia en software y tecnología en la nube y 7 certificaciones de AWS, Anjan destaca en el desarrollo de sistemas basados en IA y la implementación estratégica. Su liderazgo combina la innovación técnica con los objetivos empresariales, ampliando con pasión los límites de la IA en la computación en la nube.

Puedes conocer más del autor visitando su perfil en LinkedIn o siguiéndole en X donde se presenta como @itsrealAJB.

Wrick Talukdar

(Fuente: traducción asistida con IA de su entrada en página oficial)

Wrick Talukdar
Wrick es un distinguido arquitecto de IA/ML y líder de productos con más de dos décadas de experiencia impulsando transformaciones tecnológicas en empresas globales. Reconocido por su experiencia en IA, aprendizaje automático y computación en la nube, ha aprovechado constantemente las tecnologías de vanguardia para ofrecer valor empresarial estratégico a clientes de todo el mundo.

A lo largo de su carrera, Wrick ha liderado iniciativas digitales que han generado importantes ahorros de costes y acelerado el tiempo de comercialización. Cuenta con una trayectoria probada en la creación de equipos de alto rendimiento que ofrecen productos y soluciones innovadores de IA.

Como pensador estratégico, Wrick destaca por alinear la tecnología con los objetivos empresariales, fomentar la colaboración interfuncional y abordar retos complejos con enfoques basados en datos. Su capacidad para unir la experiencia técnica con la visión empresarial le posiciona como un líder clave en el impulso del crecimiento sostenible y la innovación.

Wrick es un profesional certificado TOGAF® de nivel 2 y posee múltiples certificaciones de AWS y Azure en inteligencia artificial y aprendizaje automático.

Más allá de sus logros profesionales, Wrick ha tenido un impacto duradero en la comunidad científica mundial, y sus investigaciones son ampliamente referenciadas y citadas en todo el mundo. Es presidente del IEEE NIC, miembro sénior del IEEE y arquitecto jefe de IA/ML para iniciativas de IA generativa dentro del Comité de Participación Industrial (IEC) del IEEE, donde empodera a los jóvenes profesionales para que avancen en sus carreras a través de la tecnología y la IA generativa. Además, como miembro senior y asesor de la Consumer Technology Society (CTSoc), desempeña un papel clave en la configuración de los estándares tecnológicos y proporciona orientación estratégica en importantes conferencias mundiales, como la ICCE.

Puedes conocer más del autor visitando su perfil en LinkedIn.

Ficha técnica:


EDITORIAL: Packt
AÑO: 2025 
ISBN: 978-8423438402
PAGINAS: 489 

No hay comentarios:

Publicar un comentario