Arquitectura de recuperación ante desastres para una plataforma de datos de Azure

Este artículo es el segundo de una serie que proporciona instrucciones sobre la recuperación ante desastres (DR) para una plataforma de datos de Azure. Presenta una arquitectura de referencia que muestra cómo estructurar una plataforma de datos de Azure con funcionalidades de recuperación ante desastres. Use esta arquitectura como base para planear su propia implementación de recuperación ante desastres.

Definición del caso de uso

Para respaldar este ejemplo práctico, se utiliza la firma ficticia "Contoso" con una plataforma de datos de Azure según las arquitecturas de referencia de Microsoft.

Servicio de datos: vista de componentes

Contoso ha implementado la siguiente arquitectura básica de Azure, que es un subconjunto del diseño de zona de aterrizaje empresarial. Diagrama que muestra una zona de aterrizaje empresarial de Azure de ejemplo.

Descargue un archivo de Visio de esta arquitectura.

Fundamentos de Azure de Contoso: flujo de trabajo

  1. Inscripción empresarial: la inscripción empresarial principal de Contoso dentro de Azure que refleja su contrato comercial con Microsoft, su estructura de cuentas organizativas y las suscripciones de Azure disponibles. Proporciona la base de facturación de las suscripciones y cómo se administra el patrimonio digital.
  2. Administración de identidades y acceso : los componentes necesarios para proporcionar servicios de identidad, autenticación, acceso a recursos y autorización en el patrimonio de Azure de Contoso.
  3. Organización de grupos de administración y suscripción : una jerarquía de grupos escalable alineada con las funcionalidades principales de la plataforma de datos, lo que permite la operacionalización a escala mediante la seguridad y gobernanza administradas centralmente donde las cargas de trabajo tienen una separación clara. Los grupos de administración proporcionan un ámbito de gobernanza sobre las suscripciones.
  4. Suscripción de administración: una suscripción dedicada a las distintas funciones de nivel de gestión necesarias para soportar la plataforma de datos.
  5. Suscripción de conectividad: una suscripción dedicada para las funciones de conectividad de la plataforma de datos que le permiten identificar servicios con nombre, determinar el enrutamiento seguro y la comunicación entre los servicios internos y externos.
  6. Suscripción de zona de aterrizaje: suscripciones de uno a muchos para aplicaciones nativas de Azure en línea, cargas de trabajo y recursos internos y externos
  7. Plataforma de DevOps: la plataforma de DevOps que admite todo el patrimonio de Azure. Esta plataforma contiene el repositorio de control de código fuente base y las canalizaciones de CI/CD que permiten implementaciones automatizadas de infraestructura como código (IaC).

Nota:

Muchos clientes aún conservan una gran presencia de infraestructura como servicio (IaaS). Para proporcionar funcionalidades de recuperación en IaaS, el componente clave que se va a agregar es Azure Site Recovery. Site Recovery organiza y automatiza la replicación de máquinas virtuales de Azure entre regiones, máquinas virtuales locales y servidores físicos en Azure y máquinas locales en un centro de datos secundario.

Dentro de esta estructura fundamental, Contoso implementa los siguientes elementos para satisfacer sus necesidades de inteligencia empresarial (BI). Estos elementos se alinean con las instrucciones de Analytics de un extremo a otro con Microsoft Fabric.

En el diagrama siguiente se muestra la plataforma de datos contoso.

Diagrama de arquitectura que muestra una plataforma de datos moderna que usa Microsoft Fabric.

El diagrama muestra una arquitectura detallada de una solución basada en Microsoft Fabric. A la izquierda, la arquitectura comienza con diversos orígenes de datos que incluyen sistemas locales, Amazon Web Services, Google Cloud Storage y datos estructurados y no estructurados. Las secuencias de eventos ingieren datos en tiempo real, y las bases de datos locales reflejan datos a plataformas en la nube como Azure SQL Database, Azure Databricks y Snowflake. Un lakehouse almacena formatos sin procesar y semiestructurados y Fabric Data Warehouse almacena análisis estructurados. Los accesos directos permiten el acceso entre entornos para mejorar la agilidad y la integración. A la derecha, los cuadernos, procedimientos almacenados, DataFlow Gen2 en Fabric y las canalizaciones dentro de Fabric procesan los datos almacenados. Los modelos avanzados de análisis y aprendizaje automático enriquecen los datos antes y después de atender a los usuarios. Un data lakehouse, endpoints de análisis SQL, agentes de datos, y Power BI hacen que los datos procesados estén disponibles y proporcionen visualizaciones para garantizar información procesable y de alta calidad. En la parte inferior, la capa de plataforma admite toda la arquitectura con servicios como Microsoft Purview para gobernanza, identificador de Microsoft Entra para la administración de identidades y Azure Key Vault para secretos seguros. GitHub y Azure DevOps permiten la integración continua y la implementación continua (CI/CD). Azure Policy aplica el cumplimiento, la característica de supervisión del área de trabajo en Fabric proporciona supervisión y Copilot en Fabric proporciona desarrollo asistido por IA.

Amazon Simple Storage Service (AWS S3), Amazon Web Services (AWS), AWS Kinesis, Google Cloud Storage, Google Cloud, Google Cloud Pub/Sub y Snowflake son marcas comerciales registradas o marcas comerciales de sus respectivos propietarios. Apache y Apache® Kafka son marcas comerciales registradas o marcas comerciales de Apache Software Foundation en Los Estados Unidos o en otros países. El uso de estas marcas no implica ninguna aprobación por parte de los respectivos propietarios de marcas comerciales.

La plataforma de datos contoso: flujo de trabajo

El flujo de trabajo se interpreta de izquierda a derecha y muestra el flujo de datos.

  • Orígenes de datos: Orígenes y tipos de datos que la plataforma puede ingerir.

  • Ingest

  • Tienda

    • OneLake almacena todos los datos ingeridos. OneLake es el lago de datos unificado de Microsoft Fabric que sirve como base para todas las experiencias de Fabric. OneLake admite formatos abiertos como Delta, Parquet y valores separados por comas (CSV). También proporciona opciones integradas de redundancia geográfica y continuidad empresarial y recuperación ante desastres (BCDR) para garantizar la durabilidad y la resistencia. Con OneLake como base, Fabric proporciona servicios especializados para organizar y administrar datos.

      • Lakehouse combina la flexibilidad de un lago de datos con las funcionalidades de consulta estructuradas de un almacenamiento de datos. Admite cargas de trabajo de análisis y aprendizaje automático a gran escala, al tiempo que aplica esquemas para mantener los datos organizados y administrables.

      • El almacenamiento de datos es un entorno administrado y escalable basado en SQL optimizado para consultas estructuradas y análisis empresariales. Ofrece un alto rendimiento para las cargas de trabajo de inteligencia empresarial e informes.

      • El centro de eventos administra el procesamiento y el streaming de eventos en tiempo real. Ingiere y analiza datos sensibles al tiempo para escenarios como telemetría de Internet de las cosas (IoT) y supervisión operativa.

      • La base de datos reflejada proporciona replicación casi en tiempo real de datos operativos de orígenes como Azure SQL Database o Azure Cosmos DB en OneLake. Este enfoque mantiene actualizados los análisis sin necesidad de procesos ETL complejos.

  • Proceso

    • Fabric proporciona varias maneras de procesar y transformar datos. Elija su enfoque en función de la carga de trabajo y el conjunto de aptitudes. Tanto si usa flujos ETL de poco código, realiza ingeniería de datos avanzada, aplica análisis en tiempo real o requiere lógica empresarial insertada, Fabric proporciona herramientas que funcionan con datos en OneLake. Asegúrese de que los datos permanecen limpios, enriquecidos y preparados para el análisis o el aprendizaje automático.

      • Los cuadernos de Fabric realizan transformaciones avanzadas, limpieza de datos y enriquecimiento mediante lenguajes como PySpark o Apache Spark SQL.

      • DataFlow Gen2 se conecta a varios orígenes de datos y realiza transformaciones ETL de poco código. Este enfoque es ideal para ingerir y dar forma a datos de varios orígenes.

      • Los procedimientos almacenados que se ejecutan en el entorno de SQL de Fabric aplican la lógica de negocios o las transformaciones por lotes directamente en las tablas de OneLake.

      • Los flujos de eventos procesan datos en tiempo real a medida que fluyen a su centro de eventos. Aplican transformaciones, filtros y enriquecimiento a eventos entrantes antes del almacenamiento, por lo que los datos de streaming se preparan inmediatamente para aplicaciones de análisis o posteriores. Este enfoque es ideal para escenarios que requieren información instantánea, detección de anomalías o paneles de inteligencia de Real-Time.

  • Servir

  • Enriquecer

    • Use herramientas de ciencia de datos en Fabric con Azure Machine Learning para compilar, entrenar e implementar modelos de aprendizaje automático. Estos modelos se ejecutan directamente en la base de datos unificada de Fabric. Este enfoque enriquece los conjuntos de datos y ofrece información predictiva en tiempo real dentro de las experiencias de análisis.

    • Copilot en Power BI está diseñado para usuarios empresariales, analistas y creadores de informes que desean obtener información sin escribir consultas complejas ni crear objetos visuales manualmente. Usa inteligencia artificial generativa para ayudar a crear informes, resumir datos y generar objetos visuales a partir de avisos de lenguaje natural.

    • Use el agente de datos de Fabric para explorar información a través de interacciones de lenguaje natural. Con la integración de Microsoft Foundry, el agente de datos proporciona acceso a los datos empresariales y permite la toma de decisiones controlada por datos.

  • Compartición de datos

    • El uso compartido de datos externos en Fabric permite a un inquilino de proveedor compartir de forma segura datos de OneLake con un inquilino de consumidor. Esta funcionalidad admite el acceso entre inquilinos y la colaboración sin mover datos. En el diagrama anterior, un inquilino de proveedor es la organización que comparte datos externamente y un inquilino de consumidor es la organización que accede a los datos compartidos y los usa.

    • El Plan de Recuperación ante Desastres para el uso compartido de datos externos garantiza que los datos compartidos permanezcan disponibles y coherentes durante las interrupciones o fallos. Entre los aspectos clave se incluyen los siguientes componentes:

      • Redundancia geográfica: los datos de OneLake residen en regiones con replicación geográfica, por lo que los conjuntos de datos compartidos permanecen disponibles si la región primaria experimenta tiempo de inactividad.

      • Compatibilidad con la conmutación por error: cuando se produce una interrupción regional, la estrategia de recuperación ante desastres del inquilino del proveedor redirige el acceso a la región secundaria, lo que garantiza la continuidad para los inquilinos consumidores.

      • Sincronización de metadatos: las configuraciones de uso compartido, como los permisos y las directivas de acceso, se replican entre regiones para conservar la integridad del uso compartido externo durante la conmutación por error.

  • Descubra y controle: Use Microsoft Purview, el catálogo de OneLake y las herramientas de gobernanza de Fabric para administrar el linaje, los metadatos y el control de acceso.

  • Plataforma: Fabric proporciona una plataforma de análisis de software como servicio (SaaS) unificada de un extremo a otro con almacenamiento de datos centralizado en OneLake y funcionalidades de inteligencia artificial insertadas. Microsoft Entra ID administra la identidad y el control de acceso. La supervisión del área de trabajo y la administración de costos proporcionan visibilidad y optimización operativas. Azure DevOps y GitHub admiten flujos de trabajo de desarrollo e implementación para CI/CD y Azure Policy exige una gobernanza coherente entre los recursos. Fabric también admite el uso de "bring your own key" (BYOK) a través de Key Vault, permitiéndole administrar y controlar las claves de cifrado para asegurar los datos en reposo.

Nota:

Para muchos clientes, el nivel conceptual de la arquitectura de referencia de la plataforma de datos que se usa se alinea, pero la implementación física puede variar. Por ejemplo, los procesos ELT (extracción, carga, transformación) se pueden realizar a través de Azure Data Factory y el modelado de datos mediante Azure SQL Server. Para solucionar este problema, la siguiente sección Componentes con estado frente a sin estado proporciona instrucciones.

Para la plataforma de datos, Contoso ha seleccionado los niveles de servicio de producción recomendados más bajos para todos los componentes y ha elegido adoptar una estrategia de recuperación ante desastres "Volver a implementar en caso de desastre" en función de un enfoque de reducción de costos operativos.

En las secciones siguientes se proporciona una comprensión de referencia del proceso de recuperación ante desastres y las opciones disponibles para que los clientes eleven su postura.

Vista de componentes y servicios de Azure

En las tablas siguientes, se presenta un desglose de cada servicio y componente de Azure que se usa en la plataforma de datos de Contoso, con opciones para mejorar la recuperación ante desastres.

Nota:

Las secciones siguientes están organizadas según servicios stateful y stateless.

Componentes fundamentales con estado

  • Microsoft Entra ID, incluyendo las asignaciones de roles

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: Premium P1
    • Opciones de mejoras de recuperación ante desastres (DR): la confiabilidad de Microsoft Entra es parte de su oferta de software como servicio (SaaS).
    • Notas:
  • Azure Key Vault

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: N/A
    • Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
  • Azure DevOps

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: DevOps Services
    • Opciones de mejora de DR: el servicio DevOps y la confiabilidad de los datos es parte de su oferta SaaS.
    • Notas:
      • DevOps Server, como oferta local, sigue siendo responsabilidad del cliente la recuperación en caso de desastres.
      • Si se usan servicios que no son de Microsoft (como SonarCloud, JFrog Artifactory y servidores de compilación de Jenkins), seguirán siendo responsabilidad del cliente la recuperación de un desastre.
      • Si las máquinas virtuales de IaaS se usan dentro de la cadena de herramientas de DevOps, siguen siendo responsabilidad del cliente la recuperación de un desastre.
  • GitHub

    • Responsabilidad de recuperación de componentes: GitHub (Microsoft)
    • Responsabilidad de recuperación de la carga de trabajo y configuración: GitHub (Microsoft)
    • Selección de SKU de Contoso: GitHub Enterprise Cloud
    • Opciones de mejora de DR:
    • Notas:
      • GitHub Enterprise Server (autohospedado o en las instalaciones) es responsabilidad del cliente para la recuperación ante desastres (DR), incluida la copia de seguridad y restauración de repositorios y configuración.
      • Las integraciones que no son de Microsoft, como las herramientas de CI/CD y los repositorios de artefactos, son responsabilidad del cliente para la recuperación.
      • Si los ejecutores de Acciones de GitHub se hospedan en la infraestructura administrada por el cliente (máquinas virtuales o contenedores), su recuperación también es responsabilidad del cliente.

Componentes fundamentales sin estado

  • Subscriptions

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: N/A
    • Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
  • Grupos de Administración

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: N/A
    • Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
  • Azure Monitor

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: N/A
    • Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
  • Microsoft Cost Management

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: N/A
    • Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
  • Microsoft Defender for Cloud

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: N/A
    • Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
  • DNS de Azure

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: zona única pública
    • Opciones de mejora de DR: No aplicable. DNS es de alta disponibilidad por diseño.
  • Redes virtuales, incluidas subredes, rutas definidas por el usuario (UDR) y grupos de seguridad de red (NSG)

    • Responsabilidad de recuperación de componentes: Contoso
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: N/A
    • Opciones de mejora para la recuperación de desastres: las redes virtuales se pueden replicar en la región secundaria emparejada.
  • Azure Firewall

    • Responsabilidad de recuperación de componentes: Contoso
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: Estándar
    • Opciones de elevación de recuperación ante desastres: Azure Firewall es de alta disponibilidad por diseño y se puede crear con Availability Zones para aumentar la disponibilidad.
  • Azure DDoS

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: protección de red contra DDoS
    • Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
  • circuito ExpressRoute

    • Responsabilidad de recuperación de componentes: Contoso, asociado de conectividad y Microsoft
    • Responsabilidad de recuperación de la carga de trabajo y configuración: asociado de conectividad y Microsoft
    • Selección de SKU de Contoso: Estándar
    • Opciones de mejora de DR:
      • ExpressRoute se puede elevar para usar el emparejamiento privado, lo que proporciona un servicio con redundancia geográfica.
      • ExpressRoute también tiene diseños de alta disponibilidad (HA) disponibles.
      • La conexión VPN de sitio a sitio se puede usar como copia de seguridad de ExpressRoute.
    • Notas:
      • ExpressRoute tiene redundancia integrada, con cada circuito que consta de dos conexiones a dos enrutadores perimetrales (MSE) de Microsoft Enterprise en una ubicación de ExpressRoute desde el perímetro de red del proveedor o cliente de conectividad.
      • El circuito Premium de ExpressRoute permite el acceso a todas las regiones de Azure globalmente.
  • Pasarela VPN

    • Responsabilidad de recuperación de componentes: Contoso
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: Zona Única - VpnGw1
    • Opciones de elevación de recuperación ante desastres: Una puerta de enlace VPN se puede implementar en una Zona de Disponibilidad con los SKUs VpnGw#AZ para proporcionar un servicio redundante por zona.

Servicios específicos de la plataforma de datos con estado

  • Cuenta de almacenamiento: Azure Data Lake Gen2

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: LRS
    • Opciones para mejorar la recuperación ante desastres: Las cuentas de almacenamiento ofrecen una amplia gama de opciones de redundancia de datos, desde la redundancia de región primaria hasta la redundancia de región secundaria.
    • Notas:
      • Se recomienda utilizar GRS para mejorar la redundancia, proporcionando una copia de los datos en la región emparejada.
  • Base de datos de Azure para PostgreSQL

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: Estándar
    • Opciones de elevación de recuperación ante desastres: habilite las zonas de disponibilidad para la resistencia de nivel de zona (operación continua durante un único error de zona). Para las interrupciones en toda la región, agregue la funcionalidad de recuperación ante desastres geográfica para admitir la conmutación por error y los procedimientos de recuperación posteriores.
    • Notas:
  • Azure Databricks

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: nivel Premium o Enterprise
    • Opciones de mejora para la recuperación ante desastres:
    • La resistencia de IoT Hub (continuidad durante los errores localizados) se puede aumentar mediante una implementación de alta disponibilidad entre regiones. El despliegue entre regiones y los procesos de conmutación por error abordan la recuperabilidad.
    • Notas:
      • IoT Hub proporciona conmutación por error iniciada por Microsoft y conmutación por error manual mediante la replicación de datos en la región emparejada para cada centro de IoT.
      • IoT Hub proporciona alta disponibilidad intra-regional y usa automáticamente una zona de disponibilidad si se crea en un conjunto predefinido de regiones de Azure.
  • Azure Data Explorer

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: pago por uso (o tamaño del clúster en función de la carga de trabajo)
    • Opciones de mejora de DR:
      • Azure Data Explorer no proporciona failover regional automático. En el caso de la recuperación ante desastres (DR), implemente varios clústeres en regiones pareadas (activo-activo o activo-pasivo) y replique las canalizaciones de ingesta.
      • Use el almacenamiento con redundancia de zona (ZRS) para la resistencia intraregión y seleccione Zonas de disponibilidad durante la creación del clúster para protegerse frente a errores de nivel de zona. Para lograr resistencia regional, combine ZRS con una arquitectura de varios clústeres y redundancia de ingesta a través de Event Hubs o IoT Hub.
    • Nota:
  • Azure Event Hubs

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: niveles Estándar, Premium y Dedicado
    • Opciones de mejora de DR:
      • Habilite la recuperación ante desastres georreferenciada para la replicación de metadatos en espacios de nombres emparejados.
      • Para la replicación de datos completa, use la replicación geográfica (solo niveles Premium y Dedicado).
    • Notas:
  • Azure Machine Learning

  • Azure SQL Database

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: nivel Crítico Empresarial o Premium recomendado
    • Opciones de mejora de DR:
      • Habilite los grupos de conmutación por error para activar el traspaso automático entre regiones.
      • Use la replicación geográfica activa para bases de datos secundarias legibles.
      • Configure el almacenamiento de copia de seguridad con redundancia geográfica para la funcionalidad de restauración geográfica.
    • Notas:
  • Dataverse

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: no aplicable
    • Opciones de mejora de DR:
      • Utilice DR integrado con zonas de disponibilidad de Azure para la resiliencia dentro de la región.
      • Configurar la conmutación por error de autoservicio entre regiones para entornos de producción.
    • Notas:
  • Power BI

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: Power BI Pro
    • Opciones de mejora de recuperación ante desastres: No disponible, la confiabilidad de Power BI forma parte de su oferta de SaaS.
    • Notas:
      • Power BI reside en el entorno de Office 365, no en el de Azure.
      • Power BI usa Azure Availability Zones para proteger informes, aplicaciones y datos de Power BI frente a errores del centro de datos.
      • En caso de error regional, Power BI conmutará a una nueva región, normalmente en la misma ubicación geográfica, como se indica en el Centro de Confianza de Microsoft.
  • Azure Cosmos DB

  • Azure Data Share

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
    • Selección de SKU de Contoso: N/A
    • Opciones para mejorar la recuperación ante desastres: la confiabilidad de Azure Data Share puede mejorar mediante la implementación de alta disponibilidad en una región secundaria.
  • Microsoft Purview

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: N/A
    • Opciones de mejora de recuperación ante desastres: N/A
    • Notas:
  • Tejido: OneLake

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: capacidad de Tejido
    • Opciones de mejora de DR:
      • Habilite BCDR para la capacidad de Fabric.
    • Notas:
  • Fabric: base de datos SQL en Fabric

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: capacidad de Tejido
    • Opciones de mejora de DR:
      • Habilitar la capacidad DR en Fabric para la replicación entre regiones de los datos de la base de datos SQL mediante OneLake.
      • Realice la copia de seguridad geográfica manual o la replicación geográfica para las configuraciones activas y activas entre regiones.
    • Notas:
  • Fabric: Ingeniero de datos

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: capacidad de Tejido
    • Opciones de mejora de DR:
      • Habilite la capacidad de recuperación ante desastres en Fabric para la replicación entre regiones de los datos de lakehouse a través de OneLake.
      • Realice la copia de seguridad geográfica manual o la replicación geográfica para las configuraciones activas y activas entre regiones.
    • Notas:
  • Plataforma: Almacén de datos

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: capacidad de Tejido
    • Opciones de mejora de DR:
      • Realice la copia de seguridad geográfica manual o la replicación geográfica para las configuraciones activas y activas entre regiones.
      • Habilite la capacidad de DR en Fabric para la replicación de datos de almacén entre regiones a través de OneLake.
    • Notas:
      • Para obtener más información, consulte Recuperación ante desastres específica para experiencias en el almacenamiento de datos.
      • Para los clientes que necesitan recuperación ante desastres entre regiones y continuidad empresarial totalmente automatizada, se recomienda mantener dos configuraciones de almacenamiento de Fabric en distintas regiones. Mantenga la paridad de código y datos realizando implementaciones periódicas y ingesta de datos en ambos sitios.
  • Plataforma: punto de conexión de SQL Analytics

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: capacidad de Tejido
    • Opciones de mejora de DR:
      • Habilite la capacidad de recuperación ante desastres en Fabric para la replicación entre regiones de los datos de lakehouse y almacenamiento a través de OneLake.
      • Use canalizaciones de CI/CD para volver a implementar objetos SQL, como vistas, procedimientos almacenados y roles de seguridad, en la región de recuperación ante desastres.
      • Use la API de sincronización de metadatos o realice una actualización de la interfaz de usuario para asegurarse de que el esquema del punto de conexión de SQL permanece actualizado después de la conmutación por error.
    • Notas:
      • El punto de conexión de SQL Analytics proporciona acceso de solo lectura a las tablas de Delta Lake almacenadas en OneLake.
  • Estructura: base de datos duplicada

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: capacidad de Tejido
    • Opciones de mejora de DR:
      • Copia de seguridad geográfica manual o replicación geográfica para las configuraciones activas y activas entre regiones.
    • Notas:
      • Las bases de datos reflejadas de la región primaria siguen sin estar disponibles para los clientes y la configuración no se replica en la región secundaria.
      • Vuelva a crear una base de datos reflejada en otro espacio de trabajo en una región diferente.

Servicios específicos de la plataforma de datos sin estado

  • Fundición

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: Enterprise
    • Opciones de mejora de DR:
      • Implemente áreas de trabajo de Foundry de varias regiones para garantizar la redundancia para el hospedaje y la orquestación del modelo.
      • Habilitar el almacenamiento georredundante para conjuntos de datos, artefactos de modelo y flujos de comandos mediante Azure Storage con GRS o GRS de acceso de lectura (RA-GRS).
    • Notas:
  • Tejido: Inteligencia en tiempo real

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: capacidad de Tejido
    • Opciones de mejora de DR:
      • Use la replicación geográfica para las configuraciones activas y activas entre regiones.
    • Notas:
      • Para los clientes que requieren recuperación ante desastres entre regiones y continuidad empresarial automatizada, mantenga dos entornos de inteligencia Real-Time en regiones diferentes. Asegúrese de la paridad mediante la replicación de datos, configuraciones de eventstream, consultas KQL y canalizaciones de ingesta con regularidad.
      • Para obtener más información, consulte Recuperación ante desastres específica para experiencia en Real-Time Intelligence.
  • Tejido: Data Factory

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: capacidad de Tejido
    • Opciones de mejora de DR:
      • Utilice un despliegue de pipeline entre regiones.
    • Notas:
  • Fabric: ciencia de datos

    • Responsabilidad de recuperación de componentes: Microsoft
    • Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
    • Selección de SKU de Contoso: capacidad de Tejido
    • Opciones de mejora de DR:
      • Cree áreas de trabajo en dos regiones diferentes. A continuación, copie los datos e importe cuadernos, experimentos de aprendizaje automático y modelos en el área de trabajo secundaria.
    • Notas:
      • La Recuperación ante Desastres para la Ciencia de Datos requiere que copies y vuelvas a crear recursos manualmente en una región secundaria, puesto que esta carga de trabajo no incluye la replicación integrada entre regiones.
      • Para obtener más información, consulte DR de Data Science.

Componentes con estado y sin estado

La velocidad de innovación en el conjunto de productos de Microsoft y Azure, en particular, significa que el conjunto de componentes que hemos usado para este ejemplo de trabajo evoluciona rápidamente. Para asegurar que no se proporcionen instrucciones obsoletas en el futuro y ampliar esta guía a los componentes que no se tratan explícitamente en este artículo, en la siguiente sección se proporcionan algunas instrucciones basadas en la clasificación de grano grueso del estado.

Un componente o servicio se considera con estado cuando conserva información de eventos o interacciones anteriores. Algunos ejemplos son los lakehouses, los eventhouses y los almacenes, que almacenan datos y metadatos que deben ser protegidos y recuperados. Por el contrario, los componentes sin estado no conservan ningún registro de las interacciones anteriores. Cada solicitud se procesa de forma independiente usando solo la información proporcionada en ese momento. Algunos ejemplos son Data Factory y cuadernos, que orquestan o procesan datos sin conservar información y dependen de componentes con estado externos para el almacenamiento.

Para un escenario de recuperación ante desastres que requiere una redistribución:

  • Los componentes o servicios sin estado, como Azure Functions y las canalizaciones de Azure Data Factory, se pueden volver a implementar desde el control de código fuente con al menos una prueba de humo para validar la disponibilidad antes de introducirse en el sistema más amplio.
  • Los componentes o servicios con estado, como Azure SQL Database y las cuentas de almacenamiento, requieren más atención.
    • Al adquirir un componente, una decisión clave es la selección de su característica de redundancia de datos. Esta opción normalmente requiere equilibrar la disponibilidad y la durabilidad con los costos operativos.
  • Los almacenes de datos también necesitan una estrategia de copia de seguridad de datos. La funcionalidad de redundancia de datos del almacenamiento subyacente mitiga este riesgo para algunos diseños, mientras que otras, como las bases de datos SQL necesitan un proceso de copia de seguridad independiente.
    • Si es necesario, el componente se puede volver a implementar desde el control de código fuente con una configuración validada a través de una prueba de humo.
    • Un almacén de datos redistribuido debe tener su conjunto de datos rehidratado. La rehidratación se puede lograr mediante la redundancia de datos (cuando esté disponible) o un conjunto de datos de copia de seguridad. Cuando se haya completado la rehidratación, debe validarse para obtener precisión e integridad.
      • En función de la naturaleza del proceso de copia de seguridad, es posible que los conjuntos de datos de copia de seguridad requieran validación antes de aplicarse. Los errores o daños en el proceso de copia de seguridad pueden dar lugar a que se use una copia de seguridad anterior en lugar de la versión más reciente disponible.
    • Cualquier diferencia entre la fecha y la marca de tiempo del componente y la fecha actual debe abordarse volviendo a ejecutar o reproduciendo los procesos de ingestión de datos desde ese punto hacia adelante.
    • Una vez actualizado el conjunto de datos del componente, se puede introducir en el sistema más amplio.

Otros servicios clave

Esta sección contiene instrucciones de alta disponibilidad y recuperación ante desastres para otros servicios y componentes clave de datos de Azure.

Costos de ejemplo para la arquitectura

Use esta estimación de precios de Azure como punto de partida para estimar los costes de su escenario. La estimación se centra en las unidades de capacidad Microsoft Fabric usadas en la arquitectura, tal como se describe en esta serie de artículos.

Pasos siguientes

Ahora que ha aprendido sobre la arquitectura del escenario, puede obtener información sobre los detalles del escenario.