Big Data

📡¿Qué es el Big Data?

Qué-es-el-big-data

Estoy convencido que es un concepto del que has oído hablar en multitud de ocasiones y es probable que nunca hayas llegado a comprender del todo en qué consiste y para qué sirve.

El Big Data estará presente en prácticamente todos los negocios y se espera que en la próxima década esta tecnología abarque tantos aspectos de nuestra vida, que las empresas sabrán de nosotros mucho más que nosotros mismos.

Los datos son el «nuevo oro» de nuestro siglo.

¿Qué es Big Data?

Vamos a empezar por entender qué es esto del Big Data definitivamente.

Es un concepto tan actual y en constante desarrollo que nadie se pone de acuerdo en ofrecer una definición global, que sea transversal a diferentes tipos de negocios y a administraciones públicas como privadas.

A su vez es un concepto tan real, que ofrece multitud de beneficios a las empresas que lo usan, siempre que se desarrolle una estrategia de manera eficaz.

Para mí, como ahora mismo entiendo el Big Data:

Big data es la capacidad de almacenar, gestionar, desarrollar y obtener valor de los datos que el usuario facilita en su navegación digital que tratados de manera adecuada ayuda a las empresas e instituciones a tomar decisiones, así como a fomentar el desarrollo de la humanidad y prevenir desastres.

Además de las empresas como las entendemos normalmente, el Big Data y su uso puede ser aplicado en diversos sectores y organismos tan dispares como el avance científico y en la previsión del tráfico en dirección al trabajo.

Todo lo que hacemos en el entorno digital siempre ha dejado, y deja, un rastro que hasta la aparición del Big Data no se recogía, era información que no se usaba y por lo tanto perdíamos oportunidades de mejorar y optimizar diseños y procesos.

Se llegó a un momento, no hace mucho tiempo, en el que se pensó que se deberían desarrollar arquitecturas y procesos que permitiesen obtener una información de mayor calidad de los datos que hasta el momento se disponía.

Pero ahí no acaba la historia, ¡qué va!

El Big Data permite, a partir de datos generados por la huella digital, entender la información, sacar patrones de comportamiento y desarrollar predicciones.

¿Qué beneficios aporta el Big Data?

Inimaginables. Ampliemos el horizonte y no cometamos el error de asimilar el Big Data con negocio empresarial tradicional.

El Big Data es una especialidad que va mucho más allá y puede aplicarse en beneficio de muchos aspectos de la sociedad:

  • Conocer las tendencias de compras y consumo
  • Cálculo del voto en elecciones
  • Realizar predicciones de fraude
  • Gestión de provisión futura
  • Contagios de enfermedades
  • Previsión de tráfico por zonas
  • Realizar campañas de marketing basadas en el uso de tu propio producto o servicio
  • En publicidad poder impactar a un usuario cuándo se encuentre cercano a tu establecimiento
  • Uso del contenido social media para obtener más información sobre gustos e intereses
  • Rendimiento físico en deportistas y equipos de élite
  • Defensa antiterrorista
  • Avances científicos
  • Prevención de crisis medioambientales
  • Fomentar la fidelización de clientes
  • Aumentar la probabilidad de un match en Tinder
  • El estudio de los genes y cómo influyen en enfermedades
  • Medicina preventiva más eficaz creada a través de macrodatos

Es decir, nos encontramos ante una especialidad multisegmento, en el que ya no solo el beneficio económico de una empresa o entidad puede hacer uso de él, si no el propio avance de nuestra especie.

¿No es maravilloso? 🤩

Evolución del Big Data: Tipos de datos

Hace unos años, solamente existían herramientas ofimáticas, se almacenaban las información estructurada en hojas de Excel, informes en Word, o incluso raramente en bases de datos. Hasta el momento era la manera que teníamos de organizar la información y dotarle de sentido.

En la actualidad, los analistas tienen la posibilidad de almacenar y organizar los datos y usando las herramientas/softwares apropiados, convertir los datos globales en información útil.

Para entender correctamente el concepto de Big Data es necesario comprender qué tipos de datos existen y cómo se clasifican.

Existen diferentes tipos de datos y clasificaciones.

En función a la estructura del dato:

  • Datos estructurados
    • Son los datos que tradicionalmente han sido usados en el tratamiento de datos
    • Se pueden almacenar en tablas
    • Los números y las fechas forman parte de este tipo de dato
  • Datos desestructurados
    • Son datos que no poseen un formato concreto que permita almacenarlo, pues no se pueden desglosar en un número que permita poder ser identificado y almacenado.
    • Un email, un word, un Excel ó un archivo PDF forman parte de esta categoría.
  • Datos semiestructurados
    • Corresponden a datos que siguen unos patrones comunes que permiten reconocerlos, describirlos e incluso ofrecen información, pero su estructura todavía no permite clasificarlos como estructurados.
    • Un claro ejemplo es el código HTML

En la actualidad, solo el 20-30% de la información es estructurada

¿De dónde vienen los datos?

Estoy convencido de que si has llegado hasta aquí, el pensar de dónde vienen los datos sea una pregunta que puedas estar haciéndote. Es una pregunta que yo también me hice en su momento 😉

Ten en cuenta que hasta hace muy poquito tiempo, no éramos capaces de obtener mucha más información que por la clasificación en relación a su estructura (estructurados, desestructuados y semiestructurados) que acabo de comentar.

Es decir, como mucho, las empresas algo más avanzadas ordenaban los datos en bases de datos o CRM, este último ya en épocas algo más digitalizadas.

Tanto ha ido evolucionando esta disciplina que a día de hoy ya somos capaces de adquirir datos de otras fuentes (existen miles de fuentes a las que acudir, pero las más significativas son estas) , pudiendo organizarlos de la siguiente manera:

  • Producidos por personas: Todos aquellos datos que los seres humanos debido a nuestra interacción con el mundo digital realizamos, siendo éstos una información abismal.
    • Un me gusta en Instagram, enviar un email, un match en Tinder, realizar una encuesta telefónica, responder a un WhatsApp etc
  • Entre máquinas: Es lo que se entiende por M2M (Machine 2 Machine). A través de WIFI, Bluetooth, ADSL y fibra óptica las máquinas se comunican entre sí, intercambiando información de unas a otras.
    • GPS del coche y del teléfono móvil, parquímetros lectores de matrícula, contadores de electricidad avanzados etc
  • Biométricas: Alexa, ¿qué tiempo hará mañana? y/ó desbloquear tu Iphone con lector de reconocimiento facial, son 2 claros ejemplos para entender esta tipología de fuente del Big Data.
    • Las fuentes biométricas son de las que más se está extendiendo en la actualidad, debido a la comodidad para el usuario y el conocimiento del usuario por parte de la tecnología.
  • Marketing Digital: Entender al consumidor y analizar su comportamiento para ofrecerle el producto que desea. Realmente la idea continúa siendo la misma desde los inicios del marketing: ofrecer lo que el cliente desea en el momento que lo desea al precio adecuado de la manera adecuada.
    • ¿Qué ocurre ahora?: Que tenemos más datos, mayor información y por tanto mayor posibilidad de impacto. Por otro lado, el usuario es más celoso de su intimidad (esto muy poquito a poco) y existe una tecnología asociada el Big Data que multiplicará exponencialmente su uso.
  • Transacciones económicas: ¿Quién no ha realizado una transferencia de una cuenta a otra? ¿Y herramientas de reciente implantación como Bizzum y similares?
    • Poco a poco, se va obteniendo un mayor conocimiento del cliente.

¿Qué retos tiene el Big Data?

Tenemos ante nosotros una especialidad que tiene ante sí uno de los mayores retos de la sociedad actual: comprender el presente para adelantarse al futuro

Una tarea de tal envergadura en la actualidad posee límites y retos. Las 7V del Big Data son el mapa donde se sustentan las bases para llegar a un buen puerto en la gestión de macrodatos:

imagen de las 7 v del big data
  • Velocidad: La información de hace apenas una hora ya se ha quedado desfasada. En una sociedad que nos demanda inmediatez y donde los datos en constante movimiento procesados a tiempo real cobran protagonismo debemos ser capaces de ejecutar algoritmos cada vez más complejos en menos tiempo.
  • Volúmen: A medida que van creciendo las bases de datos es indispensable que lo hagan a su vez las aplicaciones y la arquitectura que los soporta con el fin de ofrecer soluciones en la recogida y almacenamiento de los datos, teniendo en cuenta que éstos cada vez son más variados.
  • Variedad: Los datos proceden de diversas fuentes y se encuentran en diversos formatos (estructurados, desestructurados y semiestructurados). Debido al crecimiento de los datos desestructurados, son necesarios nuevos requerimientos en el tratamiento de los datos, haciendo que cada vez tengamos que dotar de sentido único a todos los orígenes.
  • Veracidad: Bajo mi punto de vista podría considerar este punto como el más importante del listado. ¿Para qué desarrollar y fundamentar decisiones en datos que no son reales? La calidad tanto del dato como de su gestión cobran vital importancia ya que son la base del todo el proyecto.
  • Valor: Es sin duda una cualidad importantísima en el análisis de datos. Conseguir información de manera eficiente para aportar valor es uno de los retos fundamentales del Big Data.
  • Visualización: De nada sirve desarrollar estrategias fundamentadas en datos si no somos capaces de convertir dichos datos en información y mostrarlos de manera que puedan ser entendidos y aportar conocimiento de manera sintetizada. Es decir, en un gráfico debemos ser capaces de representar qué expresan los datos y qué acciones vamos a desarrollar.
  • Variabilidad: En un entorno tan cambiante como el de los macrodatos, la información varía mucho. Y también han de hacerlo los modelos o tratamientos que se aplican en torno a esta, pues no son fijos en el tiempo y requieren de un control periódico.

Las 7V’s del Big Data sientan las bases y son el camino para construir una estrategia eficaz de gestión de macrodatos

4 fases de gestión de la información

Una vez que decidimos comenzar una gestión de los macrodatos es necesario establecer un plan que cumpla con los 4 requisitos que comento a continuación:

  • Captura de información: ¿Dónde está la información que necesitamos y dónde podemos obtenerla?
  • Almacenamiento: ¿Dónde y cómo vamos a organizar los datos que previamente han sido capturados?
  • Tratamiento: ¿Qué criterio vamos a marcar? ¿Buscamos patrones? ¿Estadística?
  • Puesta en valor: ¿Hemos obtenido información sobre los datos? ¿Los hemos representado y han sido entendidos? ¿Qué hacemos a continuación?

Los datos por sí mismos no generan conocimiento si no se ejecuta un análisis detallado, por lo que el valor no se encuentra en el propio dato si no en la relación de éstos entre sí.

Netflix

Netflix se ha convertido en una de las empresas que más y mejor ha sabido usar el Big Data para implantarse y convertirse en un líder mundial en la industria del entretenimiento.

Netflix ha alcanzado un nivel de hipersegmentación tan elevado que es capaz de ofrecer a cada cliente una oferta personalizada y única.

Conclusión

  • El Big Data es una especialidad que irá en constante crecimiento en los próximos años y junto a la Inteligencia Artificial serán los responsables en el desarrollo de aspectos de la humanidad nunca antes alcanzados.
  • Puede ser aplicado en diferentes segmentos de la sociedad.
  • Dónde obtener datos de calidad y fidedignos debe ser el principal objetivo de toda institución que comience con la gestión del dato.
  • Las 7 V’s del Big Data son el mapa que debe indicarnos el presente y futuro de la especialidad.
  • Ser capaces de convertir los datos en información, a través de una visualización efectiva de los mismos es de vital importancia para la correcta implementación de una cultura fundamentada en datos.