lunes, 22 de mayo de 2017

Data Science y la pregunta adecuada



Establecer claramente objetivos es muy importante. Tener clara una estrategia es fundamental.

Es una verdad válida para cualquier acción de una cierta ambición que emprendamos. Es importante para un cambio estratégico, para un proyecto clave o para una transformación digital.

Y también es importante para un trabajo en Data Science. Sólo que, cuando hablamos de Data Science, los objetivos se establecen en forma de preguntas.Vamos a bucear en datos, vamos aplicar técnicas estadísticas y machine learning pero ¿para qué?

Pues, simplemente, para contestar a una pregunta o un conjunto de preguntas que tienen sentido en el ámbito de negocio o de gestión que corresponda.

En efecto, en esa línea y al principio de su libro 'The data science handbook', Field Cady nos dice

The difference between great and mediocre data science is not about math or engineering: it is about asking the right question.

Hace unos meses, publicaba en este blog el libro 'Executive Data Science' de Brian Caffo, Roger D. Peng y Jeffrey T. Leek. En ese libro, y en el curso que realicé en Coursera y al que correspondía esa obra, se insistía también en la misma idea: la importancia de formular las preguntas adecuadas.

Si lo dicen dos autoridades y dos libros debe ser cierto ¿no?.

Lo principal para iniciar un trabajo de Data Science es saber las preguntas a que queremos contestar con el análisis.

Y, por extensión, lo principal para iniciar un gran proyecto o transformación es tener claros los objetivos.