'Automated Machine Learning' es una visión amplia del estado del arte en AutoML, una visión amplia en cuanto a conceptos, ya que pone las ideas de AutoML siempre en el marco del Machine Learning en general, y amplia porque hace una revisión bastante extensiva de las principales soluciones existentes para implementar AutoML hoy día, desde las open source hasta las comerciales.
El libro consta de diez capítulos que se agrupan en tres secciones como sigue:
- 'SECTION 1 - INTRODUCTION TO AUTOMATED MACHINE LEARNING' Proporciona los conceptos básicos, identifica las principales soluciones y plataformas y detalla el caso de librerías y herramientas open source.
- 'Chapter 1. A Lap around Automated Machine Learning': Un primer capítulo algo ecléctico en que comenta varios aspectos introductorios sobre AutoML. Comienza hablando del ciclo de vida de AutoML y luego explica un poco la forma de funcionar de AutoML. Finalmente, y tras intentar desmontar algunos mitos alrededor de AutoML, repasa rápidamente las soluciones disponibles para hacer AutoML. Así, primero revisa las librerías y herramientas open source nombrando Microsoft NNI, auto-sklearn, Auto-Weka, Auto-Keras, TPOT, Ludwig, AutoGluon, Futuretools y H2O AutoML. Luego pasa revista las plataformas comerciales, dando paso en esta ocasión a Datarobot, Google Cloud AutoML, Amazon SageMaker Autopilot y H2O Driverless AI. Finaliza el capítulo preguntánsoe por el futuro de AutoML.
- 'Chapter 2. Automated Machine Learning, Algorithms, and Techniques': Un capítulo breve donde vuelve al tema del ciclo de vida en AutoML e identifica y explica tres campos de trabajo para AutoML: la automatización de la ingeniería de características, la optimización de hiperparámetros y la búsqueda automatizada de una arquitectura de red neuronal.
- 'Chapter 3. Automated Machine Learning with Open Source Tools and Libraries': Hace un recorrido práctico, contando algún fundamento pero, sobre todo, mostrando un ejemplo práctico, para la mayor parte de las soluciones open source mencionadas en el capítulo 1: TPOT, Futuretools, Microsoft NNI, auto-sklearn, Auto-Keras, Ludwig y AutoGluon.
- 'SECTION 2 - AUTOML WITH CLOUD PLATFORMS' Explica las capacidades de los tres grandes actores de la nube: Amazon, Microsoft y Google y lo hace con dos capítulos por cada uno de los casos, el primero dedicado a las capacidades de machine learning en general y el segundo a las de AutoML en particular.
- 'Chapter 4. Getting Started with Azure Machine Learning': Un capítulo en que presenta las ideas básicas de Azure en materia de Machine Learning: se cuenta el stack en que se apoya, cómo se realiza un modelo y cómo se despliega y prueba.
- 'Chapter 5. Automated Machine Learning with Microsoft Azure': Explica ya cómo se hace AutoML con Azure, contan las ideas básicas, explicando con bastante detalle y pantallas el funcionamidnto del Portal y desarrollando un ejemplo basado en series temporales.
- 'Chapter 6. Machine Learning with Amazon Web Services': Cambia ahora al entorno de Amazon AWS y explica cómo se trata Machine Learning en esta plataforma. Hace una especie de mapa de situación de las capacidades de Machine Learning y AutoML en el panorama de AWS y luego ya, de forma práctica y mostrando pantallas paso a paso, explica el uso de SageMaker. Al final, hace una breve referencia a SageMaker Autopilot y a Amazon Jumpstart.
- 'Chapter 7. Doing Automated Machine Learning with Amazon SageMaker Autopilot': Desarrolla las capacidades de AutoML en Amazon, basadas en SageMaker Autopilot, y lo hace de manera eminentemente práctica mostrando paso a paso y con ventanas un ejemplo concreto.
- 'Chapter 8. Machine Learning with Google Cloud Platform': Salta ahora a la tercera de las grandes plataformas: Google Cloud Platform. Primero explica la consola y las principales capacidades de Inteligencia Artificial de GCP y muestra de manera práctica, cómo crear un notebook.
- 'Chapter 9. Automated Machine Learning with GCP Cloud AutoML': Explica las capacidades de AutoML en GCP y, en concreto, habla de AutoML Tables y desarrolla un ejemplo práctico sobre ella. Luego muestra el uso combinado con BigData Query en datos disponibles públicamente. Finaliza mostrando un ejemplo para predicción de precios.
- 'SECTION 3 - APPLIED AUTO MACHINE LEARNING' Sección final, de un único capítulo, para pensar en la traslación práctica de estas herramientas al mundo empresarial.
- '10. AutoML in the Enterprise': Un último capítulo algo diferente en que trabaja, bien que de una manera algo superficial, la introducción de AutoML en el mundo de la empresa, su necesidad, sus beneficios, problemáticas o resistencias que pueden surgir y la mejor forma de hacerlo.
'Automated Machine Learning' es un libro que, sin entrar en grandes profundidades técnicas, permite adquirir una visión panorámica del estado de AutoML y cómo se resuelve en el caso de las diferentes soluciones comerciales y open source existentes en la actualidad, con especial foco en las plataformas en la nube.
Aunque nadie se convertirá en un experto en AutoML mediante la lectura de este libro, sí permite adquirir una buen mapa de situación de lo que hay, una visión creo que realista y, además, visualizado de manera práctica con ejemplos muy ilustrados y detallados y, en ese sentido, lo considero una referencia bastante útil.
Adnan Masood
(Fuente: Traducción y ligera elaboración propia de su perfil como MVP Microsoft)
Adnan Masood |
Adnan Masood es un investigador en los campos de Inteligencia Artificial y Machine Learning, arquitecto software y MVP (Most Valuable Professional) Microsoft en Inteligencia Artificial. Actualmente trabaja en UST Global como (Most Valuable Professional) de Inteligencia Artificial donde colabora con el Stanford Artificial Intelligence Lab y el MIT CSAIL en la construcción de soluciones empresariales cognitivas.
Profesor visitante en Stanford University y autor de 'Functional Programming with F#', El doctor Masood, enseña Data Science en Park University, y ha impartido cursos de Windows Communication Foundation (WCF) en la Universidad de California, en San Diego. Es conferenciante habitual en varios eventos tecnológicos y académicos (WICT, DevIntersection, IEEE-HST, IASA, and DevConnections), campus locales de codificación y grupos de usuarios. También actua como voluntario para estudiantes de escuela elemental y media en materia de robótica STEM (Science Technology, Engineering and Math).
Firme creyente en la aportación a la comunidad, el Doctor Masood es co-fundador y presidente del grupo de desarrolladores .Net de Pasadena, co-organizador del Tampa Bay Data Science Group, y el encuentro Irvine Programmer.
Puedes saber más del autor visitando su blog, revisando su perfil en LinkedIn o siguiéndole en Twitter donde se identifica como @adnanmasood.
Ficha técnica:
TITULO: Automated Machine Learning
AUTOR: Adnan Masood
EDITORIAL: Packt Publishing
AÑO: 2021
ISBN: 978-1800567689
PAGINAS: 312
No hay comentarios:
Publicar un comentario