Dataflow en Power BI

Dataflow

En Bertia, somos expertos en procesos de ETL (Extract, Transform and Load) para garantizar la máxima eficiencia y fiabilidad en la preparación de los datos desde cualquier origen para su consumo final. Cualquier proyecto de analítica de datos en la actualidad requiere un proceso muy importante de preparación de datos, transformación y obtención de modelos útiles para su consumo por analistas y usuarios de negocio. Según expertos, este proceso suele tener entre el 60% y el 80% del peso dentro de cualquier proyecto de analítica.

Desde ahora, DataFlow de Power BI puede cumplir este propósito proporcionando funciones de carga y transformación de datos e incluso esquemas de datos por defecto que pueden reducir considerablemente el tiempo de desarrollo.

DataFlow de Power BI, como otras herramientas de ETL, se puede utilizar para cargar, limpiar, transformar, integrar, enriquecer y esquematizar fácilmente datos de una gran variedad de fuentes transaccionales y de observación, que abarcan toda la lógica de preparación de datos.
Hasta ahora, este proceso de ETL sólo podía hacerse de forma externa a Power BI y se debía consumir en un conjunto de datos ya alimentado de los datos finales que deja preparados este proceso.

Con esta herramienta se puede ganar tiempo, reducir costes y facilitar este proceso con una interfaz mucho más user-friendly para el usuario, pues para alguien acostumbrado a Power Query de Power BI no le debe resultar nada extraña la interfaz de Data Flow. Los flujos de datos se crean y administran en las áreas de trabajo, contando con todas las capacidades que ofrece el servicio Power BI, como la administración de permisos, actualizaciones programadas y más.

Data Flow usa el sistema CDM (Common Data Model) que es un conjunto de esquemas de datos estandarizados y un sistema de metadatos para permitir la coherencia de los datos y su significado en todas las aplicaciones y procesos empresariales. Ofrece un mapeo fácil de cualquier información a las entidades de CDM estándar, como Cuenta, Contacto, etc. Se puede aprovechar el esquema estándar, o personalizar las entidades según necesidades.

Una vez que se crean los flujos de datos, los usuarios pueden usar Power BI Desktop y el servicio Power BI para crear conjuntos de datos, informes, paneles y aplicaciones para consumir los datos y convertirlos en información útil para la toma de decisiones.
Os dejamos un vídeo de Microsoft dónde se hace un resumen general sobre DataFlow y cómo funciona: https://www.youtube.com/watch?time_continue=162&v=veuxofp0ZIg

 

Conectores de Data Flow

DataFlow contiene, desde enero de 2019, 47 conectores a orígenes de datos aunque cada vez son más, pues Microsoft actualiza esta funcionalidad mensualmente y se van añadiendo conectores a la herramienta de forma regular.

Cada conector puede disponer de seguridad propia para acceder a los datos, tanto orígenes online como orígenes on Premise. Con la última actualización se permite incluso el acceso con credenciales a recursos web.

 

Soporte para Querys en SQL Nativo

Con el lanzamiento de enero, DataFlow permite hacer consultas a base de datos en SQL nativo, hecho que permite sin duda ahorrar tiempo cuando ya se tiene una consulta SQL escrita y se quiere reutilizar en un flujo de datos; sin duda un gran ahorro de tiempo para usuarios habituados a usar SQL. Es especialmente útil también, para el uso de consultas complejas, en las que se pueden realizar cálculos y filtrados complejos en el servidor al que está conectado.

Para usar las consultas nativas de SQL, se puede comenzar seleccionando Consultas en blanco de la lista de conectores, luego escriba el código SQL.

 

Con esta herramienta de Power BI se pueden crear esquemas de metadatos que sirvan de origen para múltiples informes o paneles y, así, ahorrar tiempo de desarrollo en preparación de datos y garantizar siempre la corrección, veracidad y unicidad de los datos al poder usar todos los informes, paneles, conjuntos de datos y aplicaciones el mismo origen de datos sin pasar por modificaciones a medida según el usuario que elabore las visualizaciones.