Elige los tags que mejor te definan:

Artículo

Qué es la gestión y gobierno de los datos y por qué te ayuda a convertirte en una organización data-driven

Por Xavier Alba — 21 de junio de 2021

Una introducción a las iniciativas de gestión y gobierno de los datos

La actual pandemia nos ha enseñado, entre muchas otras cosas, la gran importancia de disponer de datos actualizados, normalizados y confiables para asegurar una correcta toma de decisiones en todo momento. Hemos vivido y seguimos viviendo pendientes de múltiples indicadores epidemiológicos en función de los cuales los gobiernos toman decisiones que nos hacen cambiar nuestro día a día, en muchas ocasiones, de manera drástica.

Sin lugar a duda, los datos han jugado un papel fundamental a la hora de luchar contra la pandemia y salvar vidas. Para ello los gobiernos han tenido que realizar acciones como las siguientes:

  • Establecer un lenguaje común en cuanto a qué significan cada uno de los diferentes indicadores

  • Definir cómo y con qué frecuencia se tienen que medir

  • Quién es responsable de cada dato

  • Qué procesos de recogida y agregación de estos datos se deben seguir

  • Qué criterios de validación han de cumplir

En definitiva, se ha tenido que establecer un modelo de gobierno sobre los datos para asegurar algo fundamental: la calidad y confiabilidad de la información.

Estos mismos conceptos hace tiempo que vienen resonando cada vez con más fuerza dentro de las organizaciones que consideran los datos como un activo estratégico.

El objetivo no es otro que transformar la compañía a través del uso de los datos dotándola de una organización, procesos, tecnología y cultura que le permita ser más eficiente y eficaz en la toma de decisiones basadas en datos. Así lo recoge nuestro informe “La hora de las organizaciones Data-Driven: una guía metodológica” donde explicamos cómo, desde Nae, entendemos este tipo de proyectos de transformación.

La cadena de valor del dato y los retos que plantea

Los indicadores de negocio, al final, son la punta del iceberg, el eslabón último de una cadena de valor que permite tomar buenas decisiones y resolver de forma óptima casos de uso del negocio que, de otra manera, deben confiar en los procesos establecidos y la intuición de las personas que los gestionan.

Sin embargo, el dato en bruto puede no llegar a tener ningún tipo de valor para el negocio, y antes de que pueda ser usable, deberá pasar por una serie de procesos, a menudo costosos y complejos, que permitan asegurar su calidad, seguridad, trazabilidad, documentación y valor para el negocio.

Se estima que, entre el 30% y el 40% del tiempo de las personas que trabajan con datos se pierde en tareas de bajo valor añadido como son: búsqueda de fuentes de datos, tareas manuales de reconciliación, agregación, limpieza, reporting manual de los datos, etc. Si nos centramos en perfiles de analítica predictiva podemos llegar a hablar de valores de hasta el 80%, es decir, sólo podrían dedicar el 20% de su tiempo a extraer insights realmente valiosos para el negocio.

Los principales problemas que nos encontramos en esta primera parte de la cadena de valor del dato son muy numerosos y a menudo poco conocidos para el negocio; algunos ejemplos:

  • Datos disgregados en diferentes fuentes de datos que es necesario consolidar

  • Datos duplicados y con valores dispares que es necesario consolidar

  • Fuentes de origen poco accesibles

  • Datos desactualizados o con frecuencia de actualización insuficiente

  • Datos sensibles que es necesario anonimizar para cumplir la normativa vigente

  • Datos sin un responsable de negocio que entienda lo que significa y los valide

  • Datos con formato incorrecto

  • Datos incompletos

  • Datos no estandarizados

  • Datos no documentados

Existe un concepto muy gráfico y ampliamente manejado en el ámbito tanto del desarrollo software como el de la gestión de datos que es el GIGO (Garbage In – Garbage Out) que viene a resumir la idea de que el resultado o valor que puedas extraer de tus datos es nulo si los datos de entrada con los que trabajas no disponen de la calidad suficiente. Esto es, no podemos pretender crear un modelo predictivo que nos arroje resultados valiosos para el negocio a partir de datos de mala calidad.

Todas estas dificultades en torno a la calidad de los datos generan en las empresas una serie de retos a la hora de conseguir orientar su organización a la toma de decisiones basadas en datos:

  • El negocio desconfía de los datos y exige procesos de verificación manuales y costosos

  • No existe una única versión de la verdad, existen silos de información e inconsistencias entre los datos de los diferentes sistemas que hay que conciliar manualmente

  • La baja calidad en los datos puede afectar tanto internamente a una incorrecta toma de decisiones como a los clientes y por tanto al negocio

  • La responsabilidad del dato recae en las áreas de sistemas que no conocen el negocio y por tanto no pueden asegurar su calidad al 100%

  • Cumplimiento de regulación (GDPR) en materia de seguridad en el acceso, manejo y compartición de datos

  • Muchas herramientas y proyectos de BI (bussiness inteligence) fracasan y caen en desuso debido a la baja confianza en la calidad de los datos que se generan

  • Procesos de extracción y tratamiento de datos heterogéneos y complejos. Desarrollo muy a medida de los sistemas, poco ágiles y que tienen un mantenimiento costoso

  • Es complicado encontrar datos, existe poca información asociada a los datos y por tanto se pierde tiempo en preguntar, analizar, validar etc.

 No es extraño por tanto que según un reciente estudio de BARC, la principal tendencia por cuarto año consecutivo en el ámbito del BI y la analítica de datos sea la implantación de soluciones para la mejora de la calidad de los datos y la gestión del dato único (master data management) y, como para mejorar algo primero tenemos que poder medirlo, una de las primeras acciones que planean tomar las empresas es la monitorización de la calidad del dato.

Otra de las tendencias en este ámbito que es adoptada cada vez más en las organizaciones, es la de disponer de un programa para la gestión y gobierno del dato que permita cubrir, no solo los aspectos más técnicos relacionados con la gestión de datos, sino también, desde una perspectiva más estratégica y de compañía, incidir en las políticas, los procesos y la organización de manera que se puedan afrontar todos los retos antes mencionados de la manera más óptima y asegurando que el dato, al final de esta cadena, pueda explotarse con garantías de calidad y confiabilidad.

Data governance & management: definición y framework

Existen diferentes definiciones de estos términos relacionados con la mejora continua de la calidad de la información y a menudo se confunden. En nuestro caso tomaremos como referencia los estándares de DAMA, la sociedad que agrupa a la comunidad de practicantes de la gestión de datos y define los estándares para la gestión de estos.

Podemos definir el concepto de gobierno de los datos como aquel conjunto de normas, políticas y procesos de una organización que permitan asegurar que los datos de la organización sean correctos, fiables, seguros y útiles. Es decir, es la parte más estratégica y de planificación y control a alto nivel para conseguir crear valor para el negocio a partir de los datos.

El gobierno de los datos permite disponer de una visión integral de los datos facilitando una responsabilidad compartida en las decisiones basadas en datos. Por otra parte, un programa de iniciativas para el gobierno de los datos no es estático, sino que se adapta en cada momento a las necesidades del negocio y se embebe dentro de la misma organización pasando a formar parte de su operativa.

Por otro lado, tenemos la parte práctica y técnica de cómo hacemos para conseguir mejorar la calidad y seguridad de los datos, es lo que conocemos como data management.

Podemos hacer un símil si lo comparamos con el mundo de la restauración: data management sería toda la parte de infraestructura de la cocina, el almacén y los ingredientes, mientras que data governance serían las recetas de cocina e instrucciones necesarias para crear el mejor plato.

El framework de DAMA organiza 10 disciplinas relacionando las funciones más prácticas del data management alrededor de las funciones estratégicas del data governance:

A pesar de que el marco metodológico que propone DAMA pueda resultar abrumador, hay que tener en cuenta que no es necesario cubrir al 100% todos y cada uno de estos aspectos para lanzar un programa de gobierno y gestión de datos en mi organización.

Se trata más bien de adaptarlo a las necesidades concretas y estratégicas de la compañía focalizándolo en aquellos quick wins que permitan arrancar obteniendo un valor claro y en un tiempo acotado. De esta manera, es posible demostrar a los stakeholders los beneficios de este tipo de programas en etapas tempranas y asegurar el plan de ruta hacia objetivos más ambiciosos.

Data governance, el centro de control de los datos

Como comentábamos, el ámbito del gobierno del dato cubre la parte más estratégica en el ámbito de la gestión de datos y, según una encuesta de Dataversity en 2020, más del 80% de las empresas encuestadas ya habían empezado a desarrollar iniciativas relacionadas con el gobierno del dato.

Las principales razones que mueven a las empresas a iniciar este camino son, en orden de mayor a menor peso, el cumplimiento de la legislación actual en materia de seguridad, la eficiencia en el uso de datos en la organización y el aumento de casos de uso de analítica.

En términos generales las iniciativas de gobierno de datos deben incluir aspectos como:

  • La estrategia: definir, comunicar y asegurar la ejecución de las iniciativas asociadas a la estrategia de datos que deberá, a su vez, estar alineada y supeditada a la estrategia global de la empresa.

  • Las políticas: definir, implantar y asegurar el cumplimiento de políticas respecto al acceso, uso y seguridad de los datos.

  • Los estándares y calidad: establecer y asegurar el cumplimiento de los estándares de Calidad y arquitectura de los datos.

  • El control: establecer mecanismos para el seguimiento, auditoría y control de las políticas, estándares y reglas de calidad y su posterior remediación en caso necesario.

  • El cumplimiento regulatorio: asegurando los medios para que la organización pueda cumplir con la legislación vigente en materia de seguridad de los datos.

  • La gestión de incidencias: estableciendo procesos y mecanismos para la gestión de problemas e incidencias relacionados con cualquier de los ámbitos gestionados del dato: seguridad, calidad, propiedad, normativa, etc.

  • La gestión de proyectos del dato: participando en la gestión de proyectos del dato y asegurando que se tienen en cuenta los estándares, normas y políticas establecidas.

  • La estimación del valor de los datos: estableciendo procedimiento y estándares para la estimación del valor para el negocio de cada dato.

Para llevar a cabo estar tareas es necesario repensar la organización y dar espacio para nuevos roles que puedan asumir todas estas funciones. Cada organización tiene que adoptar el modelo organizativo que mejor se ajuste a sus necesidades y estrategia.

Existen modelos federados, centralizados, descentralizados o híbridos, en cualquier caso los elementos principales que los componen son los siguientes:

  • La oficina central del dato (DMO) liderada por el máximo responsable sobre las iniciativas de gobierno del dato en la compañía, el Chief Data Ofiicer (CDO).

  • La oficina es la responsable de coordinar y dar soporte a todas las iniciativas de gobierno de datos y asumir todas las funciones enumeradas anteriormente: definición de la estrategia, políticas, normativa, seguridad de los datos, gestión de incidencias, monitorización de KPI de calidad y seguimiento del programa, etc.

  • El comité de gobierno del dato, compuesto habitualmente por el CDO, el CIO y sponsors de negocio. Vela por la consecución de los objetivos estratégicos en materia de gobierno del dato, gestionando el presupuesto asociado, aprobando y revisando iniciativas, políticas y estándares, resolviendo o escalando incidencias y estableciendo los diferentes dominios de datos, la organización y los partners adecuados para alinearse con la estrategia.

  • Los equipos de data stewards son responsables de los datos, se encargan de asegurar e implantar las políticas y estándares definidos por la DMO aplicándolas a su ámbito de datos, documentando reglas técnicas y de negocio que deben cumplir los datos. Gestionan el ciclo de vida del dato, detectando, resolviendo y reportando incidencias o no conformidades de estas políticas y estándares. También son los responsables de la definición y actualización de los glosarios de negocio y diccionarios de datos, es decir los metadatos.


Después de esta breve introducción al mundo de la gestión y gobierno de los datos, donde nos hemos centrado en el qué y el porqué, dejamos para un artículo posterior ver cómo y mediante qué estrategias y mejores prácticas podemos poner en marcha iniciativas en el ámbito de la gestión de datos y establecer un modelo efectivo para el gobierno de los datos.

Servicios relacionados
BusinessDatos
Elena Antona

Directora de la Unidad de Negocio de Business

Contactar
Enrique Sahún

Líder del servicio de Datos

Contactar
Suscríbete a "Atrévete"

La newsletter mensual para los que buscan provocar el cambio en sus organizaciones.