miércoles, 30 de junio de 2021

Metodología para Machine Learning (II): Machine Learning Canvas

Es este el segundo post que dedico a metodologías para el campo del machine learning aunque, para ser sinceros, no sé si a la técnica que ocupa este artículo se la puede llamar realmente metodología pero, en cualquier caso sí se trata de una técnica que, de alguna forma, ayuda en la gestión y, sobre todo, definición de un proyecto de machine learning.

Se trata del Machine Learning Canvas, una técnica que hereda, como tantas otras, del tsumani desatado por el merecido éxito del Business Model Canvas y que, de una forma en mi opinión algo exagerada, ha encontrado réplicas de todo tipo, con mayor o menor fortuna o agudeza analítica.

En este caso, la técnica fue definida por Louis Dorard y la explicó allá por 2016 en una serie de posts en medium que se iniciaban con el titulado 'From Data to AI with the Machine Learning Canvas (Part I)'.


La idea subyacente

 

De alguna forma, como modelo subyacente, tenemos que entender que lo que se pretende es hacer un modelo de Machine Learning capaz de hacer predicciones sobre algún problema de negocio. 

Para entrenarlo necesitaremos una serie de fuentes de datos (sistemas, ficheros, social media, etc) de los que, mediante procedimientos de recolección obtendremos una serie de datos en crudo. Para alimentar el modelo seleccionaremos unas variables de entrada (características) que podrán coincidir con algunos datos en bruto o proceder de algún tipo de elaboración de estos. 

El caso es que con esos datos definimos y entrenamos el modelo. Una ves que entendemos que el modelo es correcto, es decir, realiza las predicciones esperadas, lo desplegamos en producción y, a partir de ahí, los usuarios adoptarán decisiones apoyadas en esas predicciones o, incluso, el algún caso, la decisión se podrá automatizar.   


El Machine Learning Canvas


Con esa idea en mente, el Machine Learning Canvas lo que hace es guiarnos en la toma de decisiones de negocio o diseño para responder a todas las preguntas necesarias para la definición del problema que vamos a resolver y el método para hacerlo. El aspecto del canvas es el que se muestra en la figura (creada por el propio Dorard):



De los diez apartados que se deben rellenar, el central corresponde al objetivo, los de la parte derecha a la forma de aprender, los cuatro de la izquierda la forma de generar predicciones y la parte inferior como evaluar la bondad del modelo ya en producción.

A partir de esto, y de forma simplificada, lo que se debe consignar en cada bloque, aquello a lo que el bloque debe responder, es lo siguiente:

  • OBJETIVO

    • Proposición de valor: ¿Qué es lo que estamos intentando hacer? ¿Por qué es importante? ¿Quién lo va a usar o estar impactado?

  • APRENDER

    • Fuentes de datos: ¿Qué fuentes de datos en bruto podemos utilizar?

    • Recolección de datos: ¿Cómo obtenemos nuevos datos de los que aprender? (tanto entradas como salidas)

    • Características: Entradas al modelo a conseguir a partir de las fuentes de datos en bruto

    • Construcción de modelos: ¿Cuándo creamos o actualizamos los modelos con nuevos datos de entrenamiento? ¿De cuánto tiempo disponemos?

  • PREDECIR

    • Tareas Machine Learning: Cuáles son las entradas, cuál la salida a predecir y qué tipo de algoritmo (clasificación, regresión…)

    • Decisiones: Cómo se usan las predicciones para tomar las decisiones que aportan valor

    • Hacer predicciones: Cuándo hacemos las predicciones sobre nuevas entradas y de cuánto tiempo disponemos

    • Evaluación offline: De qué métricas y predicciones disponemos para evaluar el modelo antes del paso a producción

  • EVALUAR

    • Monitorización y evaluación en vivo: De qué métricas y predicciones disponemos para evaluar el modelo ya en producción

Por supuesto, las decisiones de definición y diseño tienen algo más de complejidad y aristas de lo que la escueta descripción que antecede hacer ver, pero sirve, creo, para hacerse una idea de la forma de aplicar esta técnica.


Conclusión


El Machine Learning Canvas es, como se ve, más bien, una forma de estructurar las decisiones más importantes a tomar en la definición del problema y el diseño de una solución a ese problema, usando datos y machine learning, que una metodología propiamente dicha.

En cualquier caso, puede servir de ayuda u orientación en algún caso. 


Artículos de este blog relacionados

No hay comentarios:

Publicar un comentario