Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El algoritmo de muestreo de Power BI mejora la forma en que los gráficos de dispersión representan datos de alta densidad.
Por ejemplo, puede crear un gráfico de dispersión con la actividad de ventas de la organización, donde cada tienda cuenta con decenas de miles de puntos de datos cada año. Gráfico de dispersión que representa una muestra de datos significativa para ilustrar cómo se desarrollaron las ventas a lo largo del tiempo. En este artículo se describen los detalles del muestreo de datos de alta densidad.
Nota:
El algoritmo de muestreo de alta densidad descrito en este artículo está disponible en los gráficos de dispersión para Power BI Desktop y el servicio Power BI.
Funcionamiento de los gráficos de dispersión de alta densidad
Sin muestreo de alta densidad, Power BI usa un algoritmo estándar que selecciona una colección de puntos de datos de ejemplo en toda la gama de datos subyacentes de forma determinista para crear un gráfico de dispersión. En concreto, Power BI selecciona las primeras y últimas filas de datos de la serie de gráficos de dispersión y, a continuación, divide las filas restantes uniformemente para que se trazarán 3500 puntos de datos totales en el gráfico de dispersión. Por ejemplo, si la muestra tiene 35 000 filas, se seleccionan las primeras y últimas filas para trazar, cada décima fila también se traza (35 000 / 10 = cada décima fila = 35 500 puntos de datos). Con el algoritmo estándar, los valores NULL o los puntos que no se pueden trazar, como los valores de texto, en la serie de datos no se muestran y, por tanto, no se consideran al generar el objeto visual. Con este muestreo, la densidad percibida del gráfico de dispersión también se basa en los puntos de datos representativos, por lo que la densidad visual implícita es una circunstancia de los puntos muestreados, no la colección completa de los datos subyacentes.
Al habilitar el muestreo de alta densidad, Power BI implementa un algoritmo que elimina los puntos superpuestos y garantiza que los puntos del objeto visual se puedan alcanzar al interactuar con el objeto visual. El algoritmo también garantiza que todos los puntos del conjunto de datos se representen en el objeto visual, proporcionando contexto al significado de los puntos seleccionados, en lugar de simplemente trazar una muestra representativa.
Por definición, los datos de alta densidad se muestrean para crear visualizaciones que responden a la interactividad. Demasiados puntos de datos en una visualización pueden ralentizarlas y dificultar la visibilidad de las tendencias. La forma en que se muestrea los datos impulsa la creación del algoritmo de muestreo para proporcionar la mejor experiencia de visualización y asegurarse de que todos los datos están representados. En Power BI, el algoritmo se ha mejorado para proporcionar la mejor combinación de capacidad de respuesta, representación y conservación clara de puntos importantes en el conjunto de datos general.
Nota:
Los gráficos de dispersión que usan el algoritmo de muestreo de alta densidad se trazan mejor en objetos visuales cuadrados, al igual que con todos los gráficos de dispersión.
Funcionamiento del algoritmo de muestreo del gráfico de dispersión
El algoritmo de muestreo de alta densidad para gráficos de dispersión usa métodos que capturan y representan los datos subyacentes de forma más eficaz y eliminan los puntos superpuestos. El algoritmo comienza con un radio pequeño para cada punto de datos, que es el tamaño del círculo visual de un punto determinado en la visualización. A continuación, aumenta el radio de todos los puntos de datos. Cuando dos o más puntos de datos se superponen, un único círculo del tamaño de radio aumentado representa esos puntos de datos superpuestos. El algoritmo sigue aumentando el radio de los puntos de datos hasta que ese valor de radio da como resultado un número razonable de puntos de datos (3500) que se muestran en el gráfico de dispersión.
Los métodos de este algoritmo aseguran que los valores atípicos se representen en la visualización resultante. El algoritmo respeta la escala al determinar también la superposición, de modo que las escalas exponenciales se visualizan con fidelidad a los puntos visualizados subyacentes.
El algoritmo también conserva la forma general del gráfico de dispersión.
Nota:
Cuando se usa el algoritmo de muestreo de alta densidad para gráficos de dispersión, la distribución precisa de los datos es el objetivo, no la densidad visual implícita. Por ejemplo, podría ver un gráfico de dispersión con una gran cantidad de círculos que se superponen (densidad) en un área determinada e imaginar que muchos puntos de datos deben estar agrupados allí. Dado que el algoritmo de muestreo de alta densidad puede usar un círculo para representar muchos puntos de datos, la densidad visual implícita o la "agrupación en clústeres" no se muestran. Para obtener más detalles en un área determinada, puede usar segmentadores para acercar.
Además, el algoritmo omite los puntos de datos que no se pueden trazar, como valores NULL o de texto, por lo que selecciona otro valor que se puede trazar. Esto garantiza aún más que la forma verdadera del gráfico de dispersión se mantiene.
Cuando se usa el algoritmo estándar para gráficos de dispersión
Algunas circunstancias impiden que el muestreo de alta densidad se aplique a un gráfico de dispersión. En estas circunstancias, se usa el algoritmo original:
Si hace clic con el botón derecho en Un valor en Valores y lo establece en Mostrar elementos sin datos en el menú, el gráfico de dispersión vuelve al algoritmo original.
Cualquier valor del campo Eje de reproducción da como resultado que el gráfico de dispersión revierta al algoritmo original.
Si faltan ejes X e Y en un gráfico de dispersión, el gráfico vuelve al algoritmo original.
El uso de una línea ratio en el panel Análisis da como resultado que el gráfico se revierta al algoritmo original.
Cómo activar el muestreo de alta densidad para un gráfico de dispersión
Para cambiar el muestreo de alta densidad a Activado, seleccione un gráfico de dispersión, vaya al panel Formato visual, expanda la tarjeta General y, cerca de la parte inferior de esa tarjeta, deslice el control deslizante de muestreo de alta densidad a Activado.
Nota:
Después de activar el conmutador, Power BI intenta usar el algoritmo de muestreo de alta densidad siempre que sea posible. Cuando no se puede usar el algoritmo, como cuando se coloca un valor en el eje Play, el interruptor permanece Activado aunque el gráfico vuelva al algoritmo estándar. Si quita un valor del eje Play o si las condiciones cambian para habilitar el uso del algoritmo de muestreo de alta densidad, el gráfico usa automáticamente el muestreo de alta densidad para ese gráfico dado que la función está activa.
Nota:
Los puntos de datos se agrupan o seleccionan mediante el índice. Tener una leyenda no afecta al muestreo del algoritmo. Solo afecta el orden de la visualización.
Consideraciones y limitaciones
El algoritmo de muestreo de alta densidad es una mejora importante de Power BI. Sin embargo, el algoritmo de muestreo de alta densidad solo funciona con conexiones dinámicas a modelos basados en el servicio Power BI, modelos importados o DirectQuery.