viernes, 18 de abril de 2014

En busca de la tecnología en Big Data

Es, quizá, un vicio demasiado extendido en el mundo de la tecnología o, por mejor decir, en el del marketing tecnológico: hablamos de tecnología...pero sin hablar de tecnología.

Se venden los beneficios para las empresas, para el negocio o la transformación de la sociedad que una nueva tecnología puede inducir...pero no se indica cómo, no se dan pistas acerca de en qué consiste la tecnología subyacente, no se explica dónde está la raíz de la novedad. Se utilizan grandes términos generalistas, pero no se detalla.

No sé si es que se asume que el público general no está interesado realmente en la tecnología sino en sus usos y beneficios; no sé si se piensa que ese público no es capaz de entender la tecnología... o no sé si es que, en ocasiones, no hay tal novedad tecnológica y estamos hablando más de marketing que de tecnología.

Esa sensación de falta de explicación tecnológica me la he encontrado, por ejemplo, intentando entender el fenómeno de Big Data. Encuentro muy frecuentes menciones a los cambios recientes en la naturaleza de los datos, a la proliferación de tipos de datos no estructurados, a la influencia de los medios sociales con toda su información no relacional que contienen, a la generación de masivas cantidades de datos, al abaratamiento del almacenamiento... y también encuentro frecuentes menciones a los beneficios de un conocimiento profundo del cliente, a los análisis de sentimiento, a la captura de tendencias...

Todo ello lo entiendo, lo valoro y me interesa.

Pero... ¿dónde está la tecnología?

¿Que nuevas estructuras de información se precisan? ¿Qué algoritmos gestionan esos nuevos tipos de datos? ¿Qué optimizaciones se aplican para manejar de forma eficiente esas masivas cantidades de información? ¿Hay nuevo hardware en discos o memorias? ¿Nuevos modos de indexación? ¿Nuevos algoritmos o lenguajes de consulta? ¿Nuevos conceptos en transaccionalidad? ¿Qué pasa con los SGBD relacionales? ¿Cómo se integran, si es que lo hacen, en los modelos de Big Data?

Aunque, en efecto, la tecnología 'profunda' es dura, echo en falta algo de explicación que, siquiera, me permita vislumbrar el cambio tecnológico subyacente tras un fenómeno que tanto da que hablar.

En el libro 'Too big to ignore' de Phil Simon, encuentro, no una profunda explicación tecnológica pero si, al menos, algunas pistas de las que tirar.

Observo la importancia que se le concede a las nuevas bases de datos NoSQL que, entiendo, agrupan realmente un conjunto de nuevos (en algunos casos no tan nuevos) tipos de bases de datos. También observo la emergencia del concepto de las bases de datos columnares... y me quedo con la preponderancia de Hadoop como plataforma real con su sistema de archivos HDFS (Hadoop Distributed File System) que sí parace tener algo que decir.

Quizá el lector conozca en profundidad estas tecnologías y no valore el hallazgo pero a mi me ha costado un tiempo (bien es verdad que algo disperso y de de escasa dedicación, a modo de hobby y no como actividad profesional) el llegar a disponer de la más mínima pista de naturaleza tecnológica, acerca de qué había detrás de Big Data.

Es, quizá, un vicio demasiado extendido en el mundo de la tecnología o, por mejor decir, del marketing tecnológico: hablamos de tecnología...pero sin hablar de tecnología. Es posible que eso simplifique los mensajes y los haga más accesibles al gran público...pero también es cierto que en ocasiones genera la sensación de 'venta de humo', la duda de si realmente hay una tecnología o sólo marketing. Y hace dudar...

Ya dispongo de algunas pistas tecnológicas sobre Big Data. Cuando pueda profundizar en ellas, espero descubir que, en efecto, hay tecnología detrás de Big Data y que esta nuevo y prometedor fenómeno puede, realmente, ponerse a la altura de su promesa.