Actualmente las empresas generan una gran cantidad de datos que provienen de distintas fuentes (ERPs, CRMs, analítica web, redes sociales…) y en diferentes formatos (csv, Excel, PDF…), por lo que resulta muy complicado poder extraer información relevante si no existen unos procedimientos previos a la hora de gestionar y tratar los datos.
Por eso es tan importante el Data Governance. Cuanto más se trabaje en cuidar la calidad de los datos, menos información se perderá y más valor se podrá extraer de ellos y, por lo tanto, se tomarán mejores decisiones.
El objetivo del Data Governance es la planificación, supervisión y control sobre la gestión y el uso de los datos. Incluye las personas, los procesos y las tecnologías necesarias para administrar y proteger los activos de datos de la empresa a fin de garantizar unos datos corporativos comprensibles, correctos, completos, confiables y seguros. Abarca todo el ciclo del análisis: desde la extracción de los datos hasta su visualización, incluyendo el almacenamiento y procesamiento.
La parte más importante de un Data Governance son los procesos ya que recoge las normas y regulaciones que permiten que haya una metodología común en toda la organización a la hora de tratar la información. Algunas tareas que se definen en este apartado son la documentación complementaria a los desarrollos (facilitando así las revisiones y auditorías) o los permisos que tienen los usuarios.
La aplicación de un Data Governance no solo incumbe al equipo de IT, también a los encargados de tomar decisiones sin importar su nivel o área en la compañía. Es más, significa un cambio de mentalidad y organizativo, puesto que contribuye a la digitalización de la empresa y a agilizar la toma de decisiones en los distintos departamentos.
Aparte de una mejor gestión de los datos y toma de decisiones, las principales ventajas que conlleva la correcta aplicación de un Data Governance son:
– Contar con un proceso estandarizado en el análisis de datos.
– Proceso de toma de decisiones transparente y basado en datos.
– Dotar a la empresa de datos fiables y de calidad.
– Reducir costes y optimizar los esfuerzos, ya sean económicos o humanos.
– Proteger la seguridad y la privacidad de los datos.
Como podemos observar en el gráfico situado al final del documento, los procesos de un Data Governance se dividen en tres grandes bloques:
Source Systems
Son las bases de datos que proporcionan la información que deseamos analizar. Aquí entraría todos los datos sin modificar (raw data) proveniente de los ERPs, CRMs y demás fuentes de información.
Data Warehouse
Es la parte más laboriosa del proceso y explicarla en profundidad daría para una entrada aparte. En pocas palabras, engloba todas las acciones de tratamiento de datos: desde la recogida de los Source Systems, pasado por la integración, almacenamiento, limpieza y por último la seguridad.
Este apartado incluye los mecanismos que hay que llevar en los despliegues entre entornos y administración del proceso de carga. Dichos procesos deben ser monitorizados para saber si los datos han sido actualizados correctamente.
Reporting
Es el proceso final y en él se utilizan herramientas de Business Intelligence como Power BI para generar cuadros de mandos interactivos y accesibles desde cualquier dispositivo con acceso a internet. Además, se puede realizar análisis estadísticos y analíticos con objetos visuales gracias a la integración de R y Python.