Fundamentos de la compra programática: ¿qué es un lago de datos (data lake)?

2018 mayo 03

Fundamentos de la compra programática: ¿qué es un lago de datos (data lake)?

Un lago de datos, o data lake, es un lugar centralizado que, como un lago, te permite almacenar una gran cantidad de datos sin procesar, estructurados o no, en su formato nativo y a cualquier escala. Puedes almacenar tus datos tal cual, sin tener que estructurarlos ni caracterizarlos hasta que los necesites. Se pueden utilizar para crear cuadros de mando y visualizaciones con los que crear informes, realizar análisis de datos en tiempo real y aplicar técnicas de  aprendizaje automático para mejorar las decisiones relacionadas con la publicidad programática.

Con el aumento y la diversificación de los datos, muchos equipos de marketing y, en particular, de estrategia digital han descubierto que las técnicas tradicionales de recopilación de datos se han quedado obsoletas, por lo que abogan por algo más centralizado, como un lago de datos. Según un estudio realizado por Aberdeen en septiembre de 2017, la empresa media está experimentando un crecimiento del volumen de sus datos a un ritmo superior al 50% anual. Adicionalmente, estas empresas gestionan una media de 33 fuentes únicas de datos según ese mismo estudio. Al tener los datos compartimentados por equipos o departamentos, como búsquedas, redes sociales o marketing directo, los directores de marketing (CMO) afrontan el reto de saber cómo gestionar eficientemente los análisis para sus campañas. Si no consolidan sus datos, corren el riesgo de dirigirse al mismo consumidor de forma repetida o incluso mostrarle el mensaje equivocado.

 

¿Por qué necesitas un lago de datos?

La mayoría de las plataformas de datos solo almacenan estos datos si se han formateado para que tengan una estructura determinada, por ejemplo, con columnas y filas. Por lo tanto, los datos no estructurados, como los archivos de registro o los datos de los análisis de clic, de las redes sociales y de los dispositivos conectados a internet, normalmente no pueden cargarse a la plataforma hasta que se han definido. Un lago de datos, en cambio, te permite importar todos los datos de marketing en tiempo real, desde múltiples fuentes y en su formato original. También te permite ajustar los conjuntos de datos de cualquier tamaño. A partir de ahí podrás averiguar cómo usarlos de una forma automática y personalizada para atraer y retener a los clientes mediante la publicidad digital. Empresas como Digilant te ayudarán a configurar tu lago de datos y usarlo en tus campañas.

¿Qué diferencia hay entre un lago de datos y una plataforma de gestión de datos (DMP)?

Si eres un profesional del marketing digital, un lago de datos te permite recopilar datos o información personal identificable (personally identifiable information, PII) algo que no te permiten las plataformas de gestión de datos (data management platform, DMP). La función primordial de las DMP es recopilar datos de las cookies para activar al público de ese medio, mientras que la de un lago de datos es servir como primer paso para que los científicos de datos aumenten el conocimiento del que dispone la DPM.  A menudo, la DMP se conecta directamente con la herramienta de activación de medios, que en el mundo programático suele ser una plataforma orientada a la DSP (Demand Side Platform). La DMP establecerá conexiones entre varios proveedores de datos externos, y el lago de datos los complementa con nuevos datos, por ejemplo, de las redes sociales o de los dispositivos conectados.

 

Cuatro grandes ventajas al disponer de un lago de datos

1. INDEXACIÓN DE DATOS

Los lagos de datos te permiten almacenar datos relacionales (una colección de datos individuales organizados como una serie de tablas descritas formalmente y desde las cuales se puede acceder a los datos o reensamblarlos de muchas formas sin tener que reorganizar las tablas de las bases de datos.) —bases de datos operativas (datos recopilados en tiempo real), datos de tus aplicaciones y non-datos no relacionales (apps de teléfonos móviles, dispositivos conectados y redes sociales). También te permiten rastrear, catalogar e indexar los datos en el lago.

2. ANALÍTICA

Los lagos de datos permiten que los científicos de datos, desarrolladores y analistas de operaciones accedan a los datos con las herramientas y marcos analíticos que deseen. Entre estos figuran los marcos de código abierto, como Apache Hadoop, Presto y Apache Spark, así como los productos comerciales de proveedores de almacenes de datos y de inteligencia de negocios (business intelligence, BI). Los lagos de datos también te permiten ejecutar estos análisis sin tener que trasladar la información de un sistema a otro.

3.APRENDIZAJE AUTOMÁTICO

Los lagos de datos permiten que las organizaciones produzcan diferentes tipos de conocimiento sobre el marketing y las operaciones, incluyendo informes sobre los datos históricos. También ayudan a fomentar el aprendizaje automático mediante la creación de modelos financieros que, por ejemplo, permiten pronosticar los resultados más probables o sugerir una serie de acciones que, de tomarse, tienen más probabilidades de conseguir los resultados óptimos.

4.MEJOR INTERACCIÓN CON LOS CLIENTES

Los lagos de datos pueden combinar los datos sobre los clientes procedentes de una plataforma de gestión de clientes (CRM) con análisis de datos de las redes sociales, así como una plataforma de marketing que incluye el historial de compras y que permite fortalecer el negocio y encontrar a los públicos más rentables, determinar la fuente del abandono de los clientes (churn) y qué promociones o premios podrías ofrecer para aumentar la lealtad de tus clientes.

En resumen

Recomendamos que los profesionales del marketing y los compradores de medios creen un lago de datos por tres motivos: primero, si quieren beneficiarse de las herramientas analíticas o los cuadros de mando más avanzados y sofisticados y usar una fuente de datos más compleja y diversa; segundo, si también quieren que sus actividades tradicionales (como el acceder a los datos o la velocidad de su recuperación) sean más eficaces y más fáciles de cumplir; y, tercero, si quieren reunir todos los datos que se encuentran dispersos por toda la organización en un solo lugar para ser más eficaces y ahorrar tiempo y dinero. Aunque no todas las empresas consiguen cumplir estos tres objetivos simultáneamente, las más eficaces podrán ver resultados positivos en relación con su habilidad para tomar mejores decisiones sobre la compra de medios programática..

SPREAD THE WORD