lunes, 9 de julio de 2018

Casi prefiero que los datos no sean el nuevo petróleo


"Los datos son el nuevo petróleo".

Esta es una frase que he escuchado y leído decenas y decenas de veces, machaconamente, casi hasta el hastío, y seguramente tú, lector, también.

Una metáfora que, al menos en los contextos en que me ha sido dado el escucharla, pretendía resaltar la importancia de los datos para la nueva economía digital. De alguna forma hablaba, o eso he entendido siempre, de la hiper abundancia de datos y de los beneficios que de ellos se pueden obtener aplicando técnicas y tecnologías como el Data Science, Big Data o Machine Learning.

La primera vez que la oí me llamó la atención que es lo que, en el fondo, una frase como esa pretende. Sin embargo, posteriormente, la continua repetición de la misma sentencia ha llegado a producirme rechazo. Rechazo porque la originalidad que pudiera adornarla desaparece con la machacona repetición, con el uso insistente por parte de directivos y ponentes que buscaban, supongo, una originalidad imposible mediante una frase convertida casi en lugar común.

Luego he pensado, además, que quizá el petróleo no exhibe los valores adecuados para resaltar la importancia de los datos Por un lado, el petróleo, aunque ciertamente vital para la economía industrial, viene acompañado de efectos perversos en lo que a contaminación y medio ambiente se refiere. Los datos, por suerte, no tienen esos efectos perversos. Y el petróleo se está acabando. Los datos, por el contrario, crecen de forma desmedida, exponencial. 

Es decir, que la imagen de los datos como petróleo ni siquiera es especialmente acertada.

El remate ha venido cuando recientemente he descubierto que además, al parecer, el primer uso de la metáfora no quería resaltar, como yo siempre había imaginado, la importancia de los datos en la nueva economía digital, sino un hecho más particular, el que los datos, para poder obtener valor de ellos, para obtener información, conocimiento y los famosos 'insights',  deben someterse a un tratamiento previo, de la misma forma que el petróleo no se utiliza directamente sino que es sometido antes al proceso de refinado.

En esa línea va esta frase sacada del libro 'Economía de los datos. Riqueza 4.0' dirigida por Emilio Ontiveros:

Por esta razón, una de las metáforas más utilizadas es que los datos, más que gasolina, son el nuevo petróleo (Michael Palmer, Association of National Advertisers), por la necesidad de transformarlos (refinar) para ser convertidos en insumos de valor y utilidad.

Ese procesado de los datos incluye la normalización y la limpieza de los mismos, una labor desde luego necesaria, pero tediosa y que consume mucho tiempo, un tiempo poco enriquecedor. Una labor que lo deseable sería eliminarla o minimizarla mediante una normalización generalizada de datos y formatos, algo que ahora mismo se antoja poco realista. Es decir, ese procesamiento previo de los datos, ese refinado, seguirá siendo un peaje caro e indeseable a pagar para obtener el indudable valor que los datos atesoran. Un peaje que sin embargo, es lo que la metáfora de los datos como petróleo está destacando, según esta última interpretación.

O sea ¿qué tenemos?

"Los datos son el nuevo petróleo" es una metáfora que no es del todo afortunada si atendemos a que los datos ni desaparecen ni contaminan, dos de la connotaciones que la palabra petróleo trae siempre consigo de forma inmediata. Una metáfora que, además, destaca una tarea necesaria pero indeseable que el procesamiento previo de datos para hacerlos aprovechables. Y una metáfora, en fin, que aburre ya de tanto como es repetida.

¿Qué queréis que os diga?

Así las cosas, yo casi prefiero que los datos no sean el nuevo petróleo