viernes, 25 de abril de 2014

Entendiendo Big Data con Phil Simon

'Too big to ignore' es una panorámica general sobre el fenómeno Big Data, una panorámica que no es completamente de negocio (a pesar del subtítulo 'The business case for Big Data' que lo acompaña) ni tampoco completamente tecnológica. No debe sin embargo entenderse esto como un defecto sino, a mi parecer, todo lo contrario: es un buen punto de partida para saber de qué estamos hablando cuando empleamos el tan manido, y tan poco explicado término 'Big Data'.

El libro se estructura en ocho capítulos:

El primer capítulo, 'Data 101 and the Data Deluge' actúa como introducción pero sobre todo presenta la distinción entre datos estructurados, desestructurados y semi-estructurados. Argumenta el crecimiento e importancia de los no estructurados y semi-estructurados y cómo eso influye en las empresas.

'Demystifying Big Data' es un relativamente largo recorrido por las principales características e ideas a tener en cuenta en lo relativo a Big Data e introduce el interesante concepto de 'Deep web', aquella parte de la web a la que no se puede acceder a través de buscadores.

'The elements of Persuasion: Big data techniques' es uno de los capítulos más teóricos y repasa las técnicas que se aplican en Big Data, algunas de las cuales ya tienen una larga historia antes de que se acuñase el término Big Data. Así se habla de métodos estadísticos como regresión o tests A/B; de visualización de datos con técnicas como mapas de calor o análisis de series temporales; automatización incluyendo inteligencia artificial, sensores o NFC; técnicas semánticas como procesamiento de lenguaje natural o análisis de sentimiento; y finalmente análisis predictivo. Se complementa el capítulo repasando el uso que de Big Data hacen los gigantes tecnológicos y de Internet: Amazon, Apple, Facebook y Google.

'Big Data solutions' es el capítulo de carácter más tecnológico y en él se pasa revista a las principales tecnologías y soluciones existentes hoy día, entre las cuales goza de una enorme preponderancia Hadoop y sus derivados. Se habla de Hadoop, Cloudera, de bases de datos NoSQL, bases de datos columnares o newSQL y también se mencionan algunas startups como Kaggle.

En el quinto capítulo, 'Case studies: the big rewards of Big Data', se presentan, como el título anuncia, tres casos reales de aplicación de Big Data. En concreto se presenta el caso de Quancast (selección de público para campañas de publicidad), Explorys (atención sanitaria) y la propia NASA.

'Taking the big plunge' proporciona una serie de precauciones y consejos para la implantación de una iniciativa de Big Data.

'Big Data: big issues and big problems' continúa, en cierto sentido, la temática iniciada en el capítulo anterior pero centrándose ahora en advertir de los problemas que se pueden presentar como, por ejemplo, los relativos a privacidad y seguridad.

Finalmente, 'Looking forward: the future of Big Data' intenta avistar el futuro que espera a este fenómeno de Big Data, siendo dos los principales argumentos: Big Data está aquí para quedarse pero, también, Big Data evolucionará, no permanecerá como lo conocemos hoy día.

Debe considerarse 'Too big to ignore' como un libro introductorio o de divulgación sobre Big Data (aunque de más profundidad que una divulgación habitual), una guía para entender los aspectos más relevantes de este fenómeno. En ese sentido cumple muy bien su cometido. Sin embargo, debe advertirse, por lo mismo, que no se trata ni de un libro plenamente tecnológico ni plenamente de negocio, por lo que quien desee profundizar en alguna de esas dos facetas, deberá emplear fuentes adicionales.

Phil Simon:

Tras graduarse en la Universidad Carnegie Mellon en 1993 ingresó en Sony Eletronics en el área de relaciones con clientes. En Agosto de 1995 asistió a clases en Cornell University y durante su internado en 1996 comenzó e trabajar con tecnologías emergentes como sistemas ERP y de reporting.

Tras graduarse, tuvo una corta carrera en el área de recursos humanos pero rápidamente se orientó a trabajar con la tecnología, los datos y los sistemas. En 1988 tuvo su primer trabajo en el área de IT viajando frecuentemente por Latinoamérica como parte de un proyecto global sobre PeopleSoft para una empresa de Fortune 500. Durante ese tiempo aprendió uso avanzado de herramientas Microsoft como Ecel, Access, Crystal Reports, SQL y muchas otras aplicaciones. Se hizo adepto al tratamiento de datos empresariales. Comenzó a trabajar a tiempo completo en consultoría en 2000. Impartió clases sobre software a clientes y colegas y, en 2002 decidió hacerse su propio jefe.

Hoy en día, realiza consultoría para todo tipo de organizaciones en materias relacionadas con estrategia, gestión de datos y tecnología. Ha tenido más de 100 clientes en una variedad de sectores incluyendo salud, fabricación, distribución, educación, telecomunicaciones y sector público.

Además de consultor y conferenciante, ha escrito seis libros: 'Why New Systems Fail' (2010), 'The Next Wave of Technologies' (2010), 'The New Small' (2010), 'The Age of the Platform' (2011), 'Too Big to Ignore: The Business Case for Big Data' (2013) y 'The Visual Organization: Data Visualization, Big Data, and the Quest for Better Decisions' (2014).

Puedes saber más sobre el libro y el autor en la página oficial del autor. También puedes seguir al autor en Twitter en la cuenta @philsimon

Ficha técnica:

AUTOR: Phil Simon
EDITORIAL: Wiley
AÑO: 2013
ISBN: 978-1118638170
PAGINAS: 256

Artículos de este blog relacionados