Uso de R en el Editor de Power Query

El lenguaje R es un lenguaje de programación eficaz que usan muchos estadísticos, científicos de datos y analistas de datos. Puede usar R en el Editor de Power Query de Power BI Desktop para:

  • Preparar modelos de datos.
  • Crear informes.
  • Realizar la limpieza de datos, el modelado avanzado de datos y el análisis de modelos semánticos, que incluyen el completado de datos faltantes, predicciones, agrupamiento en clústeres y más.

Instalar R

Puede descargar R de forma gratuita desde el repositorio CRAN.

Instalar ratones

Como requisito previo, debe instalar el paquete mice en su entorno de R. Sin ratones, el código de script de ejemplo no funciona correctamente. El paquete mice implementa un método para tratar los datos que faltan.

Para instalar la biblioteca mice:

  1. Inicie el R.exe programa, por ejemplo, C:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe.

  2. Ejecute el comando install desde la consola de R.

    install.packages('mice') 
    

Uso de un script de R en el Editor de Power Query

Para demostrar el uso de R en el Editor de Power Query, en este ejemplo se usa un modelo semántico de mercado de valores contenido en un archivo .csv.

  1. Descargue el archivo EuStockMarkets_NA.csv. Recuerde dónde lo guarda.

  2. Cargue el archivo en Power BI Desktop. En la pestaña Inicio , seleccione Obtener texto de datos>/CSV.

    Captura de pantalla que muestra la opción Obtener datos, donde puede seleccionar Texto/CSV.

  3. Seleccione el archivoEuStockMarkets_NA.csv y, a continuación, elija Abrir. Los datos CSV se muestran en el cuadro de diálogo Archivo de texto/CSV .

    Captura de pantalla que muestra el contenido del archivo .csv seleccionado.

  4. Seleccione Cargar para cargar los datos del archivo. Una vez que Power BI Desktop carga los datos, la nueva tabla aparece en el panel Campos .

    Captura de pantalla que muestra los datos en el panel Campos.

  5. Para abrir el Editor de Power Query, en la cinta Inicio , seleccione Transformar datos.

    Captura de pantalla que muestra la cinta Inicio con datos de transformación resaltados.

  6. En la pestaña Transformar , seleccione Ejecutar script de R. Aparece el editor Ejecutar script de R. Las filas 15 y 20 tienen datos que faltan, al igual que otras filas que no se pueden ver en la imagen. Los pasos siguientes muestran cómo R completa esas filas por usted.

    [Captura de pantalla que muestra el Editor de Power Query con Ejecutar script de R seleccionado.

  7. En este ejemplo, escriba el siguiente código de script en el cuadro Script de la ventana Ejecutar script de R .

       library(mice)
       tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)
       completedData <- complete(tempData,1)
       output <- dataset
       output$completedValues <- completedData$"SMI missing values"
    

    Nota:

    Es posible que tenga que sobrescribir una variable denominada output para crear correctamente el nuevo modelo semántico con los filtros aplicados.

  8. Selecciona Aceptar. El Editor de Power Query muestra una advertencia sobre la privacidad de los datos.

    Captura de pantalla que muestra la advertencia de privacidad de datos con una opción Continuar.

  9. Dentro del mensaje de advertencia, seleccione Continuar. En el cuadro de diálogo Niveles de privacidad que aparece, establezca todos los orígenes de datos en Público para que los scripts de R funcionen correctamente en el servicio Power BI.

    Captura de pantalla que muestra el cuadro de diálogo Niveles de privacidad con privacidad pública seleccionada.

    Para más información sobre la configuración de privacidad y sus implicaciones, consulte Niveles de privacidad de Power BI Desktop.

  10. Seleccione Guardar para ejecutar el script.

    Al ejecutar el script, verá el siguiente resultado:

    Captura de pantalla de los resultados del script de R.

    Al seleccionar Tabla junto a Salida en la tabla que aparece, se presenta la tabla, como se muestra en la siguiente imagen.

    Captura de pantalla de los resultados de la tabla del script de R.

    Observe la nueva columna en el panel Campos denominado completedValues. La columna de valores ausentes de SMI tiene algunos elementos de datos que faltan. Eche un vistazo a cómo maneja eso R en la sección siguiente.

    Con solo cinco líneas de script de R, el Editor de Power Query rellena los valores que faltan con un modelo predictivo.

Creación de objetos visuales a partir de datos de script de R

Podemos crear ahora un objeto visual para ver cómo el script de R, utilizando la biblioteca mice, completa los valores que faltan.

Captura de pantalla que muestra un objeto visual de script de R que incluye valores que faltan y valores completados.

Puede guardar todos los objetos visuales completados en un archivo .pbix de Power BI Desktop y usar el modelo de datos y sus scripts de R en el servicio Power BI.

Nota:

Puede descargar un archivo .pbix con todos estos pasos completados.

Después de cargar el archivo .pbix en el servicio Power BI, debe seguir otros pasos para habilitar la actualización de datos del servicio y los objetos visuales actualizados:

  • Habilitar la actualización programada para el modelo semántico: para habilitar la actualización programada para el libro que contiene el modelo semántico con scripts de R, consulte Configuración de la actualización programada. En este artículo también se incluye información sobre las puertas de enlace de datos locales.

  • Instalar una puerta de enlace: necesita una puerta de enlace de datos local (modo personal) instalada en la máquina donde se encuentran el archivo y R. El servicio Power BI accede a ese libro y vuelve a representar los objetos visuales actualizados. Para más información, consulte Uso de puertas de enlace personales en Power BI.

Consideraciones y limitaciones

Hay algunas limitaciones en las consultas que incluyen scripts de R creados en el Editor de Power Query:

  • Toda la configuración del origen de datos de R debe establecerse en Público. Todos los demás pasos de una consulta del Editor de Power Query también deben ser públicos.

    Para acceder a la configuración del origen de datos, en Power BI Desktop, seleccione Opciones de archivo>y configuración>Configuración del origen de datos.

    Captura de pantalla que muestra el cuadro de diálogo Opciones y configuración, donde puede seleccionar Configuración del origen de datos.

    En el cuadro de diálogo Configuración del origen de datos, seleccione uno o varios orígenes de datos y, a continuación, seleccione Editar permisos. Establezca el nivel de privacidad en Público.

    Captura de pantalla que muestra el cuadro de diálogo Configuración del origen de datos, donde puede editar permisos.

  • Para programar la actualización de los objetos visuales de R o el modelo semántico, habilite la actualización programada e instale una puerta de enlace de datos local (modo personal) en el equipo que contiene el libro y R. No puede usar una puerta de enlace empresarial para actualizar modelos semánticos que contengan scripts de R en Power Query.

Hay todo tipo de cosas que puede hacer con R y consultas personalizadas. Explore y dé forma a los datos de la manera en que desea que aparezca.