Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Este artículo es el segundo de una serie que proporciona instrucciones sobre la recuperación ante desastres (DR) para una plataforma de datos de Azure. Presenta una arquitectura de referencia que muestra cómo estructurar una plataforma de datos de Azure con funcionalidades de recuperación ante desastres. Use esta arquitectura como base para planear su propia implementación de recuperación ante desastres.
Definición del caso de uso
Para respaldar este ejemplo práctico, se utiliza la firma ficticia "Contoso" con una plataforma de datos de Azure según las arquitecturas de referencia de Microsoft.
Servicio de datos: vista de componentes
Contoso ha implementado la siguiente arquitectura básica de Azure, que es un subconjunto del diseño de zona de aterrizaje empresarial.
Descargue un archivo de Visio de esta arquitectura.
Fundamentos de Azure de Contoso: flujo de trabajo
- Inscripción empresarial: la inscripción empresarial principal de Contoso dentro de Azure que refleja su contrato comercial con Microsoft, su estructura de cuentas organizativas y las suscripciones de Azure disponibles. Proporciona la base de facturación de las suscripciones y cómo se administra el patrimonio digital.
- Administración de identidades y acceso : los componentes necesarios para proporcionar servicios de identidad, autenticación, acceso a recursos y autorización en el patrimonio de Azure de Contoso.
- Organización de grupos de administración y suscripción : una jerarquía de grupos escalable alineada con las funcionalidades principales de la plataforma de datos, lo que permite la operacionalización a escala mediante la seguridad y gobernanza administradas centralmente donde las cargas de trabajo tienen una separación clara. Los grupos de administración proporcionan un ámbito de gobernanza sobre las suscripciones.
- Suscripción de administración: una suscripción dedicada a las distintas funciones de nivel de gestión necesarias para soportar la plataforma de datos.
- Suscripción de conectividad: una suscripción dedicada para las funciones de conectividad de la plataforma de datos que le permiten identificar servicios con nombre, determinar el enrutamiento seguro y la comunicación entre los servicios internos y externos.
- Suscripción de zona de aterrizaje: suscripciones de uno a muchos para aplicaciones nativas de Azure en línea, cargas de trabajo y recursos internos y externos
- Plataforma de DevOps: la plataforma de DevOps que admite todo el patrimonio de Azure. Esta plataforma contiene el repositorio de control de código fuente base y las canalizaciones de CI/CD que permiten implementaciones automatizadas de infraestructura como código (IaC).
Nota:
Muchos clientes aún conservan una gran presencia de infraestructura como servicio (IaaS). Para proporcionar funcionalidades de recuperación en IaaS, el componente clave que se va a agregar es Azure Site Recovery. Site Recovery organiza y automatiza la replicación de máquinas virtuales de Azure entre regiones, máquinas virtuales locales y servidores físicos en Azure y máquinas locales en un centro de datos secundario.
Dentro de esta estructura fundamental, Contoso implementa los siguientes elementos para satisfacer sus necesidades de inteligencia empresarial (BI). Estos elementos se alinean con las instrucciones de Analytics de un extremo a otro con Microsoft Fabric.
En el diagrama siguiente se muestra la plataforma de datos contoso.
Amazon Simple Storage Service (AWS S3), Amazon Web Services (AWS), AWS Kinesis, Google Cloud Storage, Google Cloud, Google Cloud Pub/Sub y Snowflake son marcas comerciales registradas o marcas comerciales de sus respectivos propietarios. Apache y Apache® Kafka son marcas comerciales registradas o marcas comerciales de Apache Software Foundation en Los Estados Unidos o en otros países. El uso de estas marcas no implica ninguna aprobación por parte de los respectivos propietarios de marcas comerciales.
La plataforma de datos contoso: flujo de trabajo
El flujo de trabajo se interpreta de izquierda a derecha y muestra el flujo de datos.
Orígenes de datos: Orígenes y tipos de datos que la plataforma puede ingerir.
Ingest
Ingerir datos estructurados, semiestructurados y no estructurados en OneLake mediante Fabric Data Factory, secuencias de eventos, cuadernos, accesos directos o creación de reflejo.
Utilice Data Factory para las canalizaciones de extracción, transformación y carga por lotes (ETL) y de extracción, carga y transformación (ELT). Utiliza flujos de eventos para la ingesta en tiempo real a través del centro de inteligencia en tiempo real.
Reflejar bases de datos compatibles para la replicación casi en tiempo real o utilizar accesos directos para acceder a datos externos sin copiar los datos en OneLake.
Use secuencias de eventos para habilitar la ingesta en tiempo real y admitir una arquitectura lambda.
Tienda
OneLake almacena todos los datos ingeridos. OneLake es el lago de datos unificado de Microsoft Fabric que sirve como base para todas las experiencias de Fabric. OneLake admite formatos abiertos como Delta, Parquet y valores separados por comas (CSV). También proporciona opciones integradas de redundancia geográfica y continuidad empresarial y recuperación ante desastres (BCDR) para garantizar la durabilidad y la resistencia. Con OneLake como base, Fabric proporciona servicios especializados para organizar y administrar datos.
Lakehouse combina la flexibilidad de un lago de datos con las funcionalidades de consulta estructuradas de un almacenamiento de datos. Admite cargas de trabajo de análisis y aprendizaje automático a gran escala, al tiempo que aplica esquemas para mantener los datos organizados y administrables.
El almacenamiento de datos es un entorno administrado y escalable basado en SQL optimizado para consultas estructuradas y análisis empresariales. Ofrece un alto rendimiento para las cargas de trabajo de inteligencia empresarial e informes.
El centro de eventos administra el procesamiento y el streaming de eventos en tiempo real. Ingiere y analiza datos sensibles al tiempo para escenarios como telemetría de Internet de las cosas (IoT) y supervisión operativa.
La base de datos reflejada proporciona replicación casi en tiempo real de datos operativos de orígenes como Azure SQL Database o Azure Cosmos DB en OneLake. Este enfoque mantiene actualizados los análisis sin necesidad de procesos ETL complejos.
Proceso
Fabric proporciona varias maneras de procesar y transformar datos. Elija su enfoque en función de la carga de trabajo y el conjunto de aptitudes. Tanto si usa flujos ETL de poco código, realiza ingeniería de datos avanzada, aplica análisis en tiempo real o requiere lógica empresarial insertada, Fabric proporciona herramientas que funcionan con datos en OneLake. Asegúrese de que los datos permanecen limpios, enriquecidos y preparados para el análisis o el aprendizaje automático.
Los cuadernos de Fabric realizan transformaciones avanzadas, limpieza de datos y enriquecimiento mediante lenguajes como PySpark o Apache Spark SQL.
DataFlow Gen2 se conecta a varios orígenes de datos y realiza transformaciones ETL de poco código. Este enfoque es ideal para ingerir y dar forma a datos de varios orígenes.
Los procedimientos almacenados que se ejecutan en el entorno de SQL de Fabric aplican la lógica de negocios o las transformaciones por lotes directamente en las tablas de OneLake.
Los flujos de eventos procesan datos en tiempo real a medida que fluyen a su centro de eventos. Aplican transformaciones, filtros y enriquecimiento a eventos entrantes antes del almacenamiento, por lo que los datos de streaming se preparan inmediatamente para aplicaciones de análisis o posteriores. Este enfoque es ideal para escenarios que requieren información instantánea, detección de anomalías o paneles de inteligencia de Real-Time.
Servir
Sirva datos seleccionados a través de puntos de conexión de análisis de SQL, que proporcionan acceso seguro y controlado a lakehouse, almacén de datos y bases de datos en espejo sin exponer los datos subyacentes ni las conexiones directas a los orígenes de datos.
Cree un modelo semántico en el modo de almacenamiento de Direct Lake para optimizar el rendimiento y compartir conjuntos de datos regulados con usuarios empresariales para el análisis de autoservicio.
Cree paneles de Real-Time Intelligence en el hub de inteligencia en tiempo real de Fabric para visualizar los datos de transmisión en tiempo real y proporcionar información instantánea para la toma de decisiones operativas.
Exponga los datos mediante programación a través de Fabric API para GraphQL. Esta API permite a los desarrolladores consultar varios orígenes de datos mantenidos de forma eficaz a través de un único punto de conexión.
Enriquecer
Use herramientas de ciencia de datos en Fabric con Azure Machine Learning para compilar, entrenar e implementar modelos de aprendizaje automático. Estos modelos se ejecutan directamente en la base de datos unificada de Fabric. Este enfoque enriquece los conjuntos de datos y ofrece información predictiva en tiempo real dentro de las experiencias de análisis.
Copilot en Power BI está diseñado para usuarios empresariales, analistas y creadores de informes que desean obtener información sin escribir consultas complejas ni crear objetos visuales manualmente. Usa inteligencia artificial generativa para ayudar a crear informes, resumir datos y generar objetos visuales a partir de avisos de lenguaje natural.
Use el agente de datos de Fabric para explorar información a través de interacciones de lenguaje natural. Con la integración de Microsoft Foundry, el agente de datos proporciona acceso a los datos empresariales y permite la toma de decisiones controlada por datos.
Compartición de datos
El uso compartido de datos externos en Fabric permite a un inquilino de proveedor compartir de forma segura datos de OneLake con un inquilino de consumidor. Esta funcionalidad admite el acceso entre inquilinos y la colaboración sin mover datos. En el diagrama anterior, un inquilino de proveedor es la organización que comparte datos externamente y un inquilino de consumidor es la organización que accede a los datos compartidos y los usa.
El Plan de Recuperación ante Desastres para el uso compartido de datos externos garantiza que los datos compartidos permanezcan disponibles y coherentes durante las interrupciones o fallos. Entre los aspectos clave se incluyen los siguientes componentes:
Redundancia geográfica: los datos de OneLake residen en regiones con replicación geográfica, por lo que los conjuntos de datos compartidos permanecen disponibles si la región primaria experimenta tiempo de inactividad.
Compatibilidad con la conmutación por error: cuando se produce una interrupción regional, la estrategia de recuperación ante desastres del inquilino del proveedor redirige el acceso a la región secundaria, lo que garantiza la continuidad para los inquilinos consumidores.
Sincronización de metadatos: las configuraciones de uso compartido, como los permisos y las directivas de acceso, se replican entre regiones para conservar la integridad del uso compartido externo durante la conmutación por error.
Descubra y controle: Use Microsoft Purview, el catálogo de OneLake y las herramientas de gobernanza de Fabric para administrar el linaje, los metadatos y el control de acceso.
Plataforma: Fabric proporciona una plataforma de análisis de software como servicio (SaaS) unificada de un extremo a otro con almacenamiento de datos centralizado en OneLake y funcionalidades de inteligencia artificial insertadas. Microsoft Entra ID administra la identidad y el control de acceso. La supervisión del área de trabajo y la administración de costos proporcionan visibilidad y optimización operativas. Azure DevOps y GitHub admiten flujos de trabajo de desarrollo e implementación para CI/CD y Azure Policy exige una gobernanza coherente entre los recursos. Fabric también admite el uso de "bring your own key" (BYOK) a través de Key Vault, permitiéndole administrar y controlar las claves de cifrado para asegurar los datos en reposo.
Nota:
Para muchos clientes, el nivel conceptual de la arquitectura de referencia de la plataforma de datos que se usa se alinea, pero la implementación física puede variar. Por ejemplo, los procesos ELT (extracción, carga, transformación) se pueden realizar a través de Azure Data Factory y el modelado de datos mediante Azure SQL Server. Para solucionar este problema, la siguiente sección Componentes con estado frente a sin estado proporciona instrucciones.
Para la plataforma de datos, Contoso ha seleccionado los niveles de servicio de producción recomendados más bajos para todos los componentes y ha elegido adoptar una estrategia de recuperación ante desastres "Volver a implementar en caso de desastre" en función de un enfoque de reducción de costos operativos.
En las secciones siguientes se proporciona una comprensión de referencia del proceso de recuperación ante desastres y las opciones disponibles para que los clientes eleven su postura.
Vista de componentes y servicios de Azure
En las tablas siguientes, se presenta un desglose de cada servicio y componente de Azure que se usa en la plataforma de datos de Contoso, con opciones para mejorar la recuperación ante desastres.
Nota:
Las secciones siguientes están organizadas según servicios stateful y stateless.
Componentes fundamentales con estado
Microsoft Entra ID, incluyendo las asignaciones de roles
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: Premium P1
- Opciones de mejoras de recuperación ante desastres (DR): la confiabilidad de Microsoft Entra es parte de su oferta de software como servicio (SaaS).
- Notas:
Azure Key Vault
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: N/A
- Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
Azure DevOps
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: DevOps Services
- Opciones de mejora de DR: el servicio DevOps y la confiabilidad de los datos es parte de su oferta SaaS.
- Notas:
- DevOps Server, como oferta local, sigue siendo responsabilidad del cliente la recuperación en caso de desastres.
- Si se usan servicios que no son de Microsoft (como SonarCloud, JFrog Artifactory y servidores de compilación de Jenkins), seguirán siendo responsabilidad del cliente la recuperación de un desastre.
- Si las máquinas virtuales de IaaS se usan dentro de la cadena de herramientas de DevOps, siguen siendo responsabilidad del cliente la recuperación de un desastre.
GitHub
- Responsabilidad de recuperación de componentes: GitHub (Microsoft)
- Responsabilidad de recuperación de la carga de trabajo y configuración: GitHub (Microsoft)
- Selección de SKU de Contoso: GitHub Enterprise Cloud
- Opciones de mejora de DR:
- Los usuarios pueden realizar copias de seguridad de repositorios con fines de recuperación ante desastres.
- Los usuarios pueden seguir las instrucciones de recuperación ante desastres de GitHub Codespaces para prepararse para la posibilidad de una interrupción regional. Si toda una región experimenta una interrupción del servicio, las copias con redundancia local de los datos se vuelven temporalmente no disponibles.
- Notas:
- GitHub Enterprise Server (autohospedado o en las instalaciones) es responsabilidad del cliente para la recuperación ante desastres (DR), incluida la copia de seguridad y restauración de repositorios y configuración.
- Las integraciones que no son de Microsoft, como las herramientas de CI/CD y los repositorios de artefactos, son responsabilidad del cliente para la recuperación.
- Si los ejecutores de Acciones de GitHub se hospedan en la infraestructura administrada por el cliente (máquinas virtuales o contenedores), su recuperación también es responsabilidad del cliente.
Componentes fundamentales sin estado
Subscriptions
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: N/A
- Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
Grupos de Administración
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: N/A
- Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
Azure Monitor
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: N/A
- Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
Microsoft Cost Management
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: N/A
- Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
Microsoft Defender for Cloud
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: N/A
- Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
DNS de Azure
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: zona única pública
- Opciones de mejora de DR: No aplicable. DNS es de alta disponibilidad por diseño.
Redes virtuales, incluidas subredes, rutas definidas por el usuario (UDR) y grupos de seguridad de red (NSG)
- Responsabilidad de recuperación de componentes: Contoso
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: N/A
- Opciones de mejora para la recuperación de desastres: las redes virtuales se pueden replicar en la región secundaria emparejada.
Azure Firewall
- Responsabilidad de recuperación de componentes: Contoso
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: Estándar
- Opciones de elevación de recuperación ante desastres: Azure Firewall es de alta disponibilidad por diseño y se puede crear con Availability Zones para aumentar la disponibilidad.
Azure DDoS
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: protección de red contra DDoS
- Opciones de recuperación ante desastres (DR): No aplica, cubierto como parte del servicio de Azure.
circuito ExpressRoute
- Responsabilidad de recuperación de componentes: Contoso, asociado de conectividad y Microsoft
- Responsabilidad de recuperación de la carga de trabajo y configuración: asociado de conectividad y Microsoft
- Selección de SKU de Contoso: Estándar
- Opciones de mejora de DR:
- ExpressRoute se puede elevar para usar el emparejamiento privado, lo que proporciona un servicio con redundancia geográfica.
- ExpressRoute también tiene diseños de alta disponibilidad (HA) disponibles.
- La conexión VPN de sitio a sitio se puede usar como copia de seguridad de ExpressRoute.
- Notas:
- ExpressRoute tiene redundancia integrada, con cada circuito que consta de dos conexiones a dos enrutadores perimetrales (MSE) de Microsoft Enterprise en una ubicación de ExpressRoute desde el perímetro de red del proveedor o cliente de conectividad.
- El circuito Premium de ExpressRoute permite el acceso a todas las regiones de Azure globalmente.
Pasarela VPN
- Responsabilidad de recuperación de componentes: Contoso
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: Zona Única - VpnGw1
- Opciones de elevación de recuperación ante desastres: Una puerta de enlace VPN se puede implementar en una Zona de Disponibilidad con los SKUs VpnGw#AZ para proporcionar un servicio redundante por zona.
Servicios específicos de la plataforma de datos con estado
Cuenta de almacenamiento: Azure Data Lake Gen2
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: LRS
- Opciones para mejorar la recuperación ante desastres: Las cuentas de almacenamiento ofrecen una amplia gama de opciones de redundancia de datos, desde la redundancia de región primaria hasta la redundancia de región secundaria.
- Notas:
- Se recomienda utilizar GRS para mejorar la redundancia, proporcionando una copia de los datos en la región emparejada.
Base de datos de Azure para PostgreSQL
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: Estándar
- Opciones de elevación de recuperación ante desastres: habilite las zonas de disponibilidad para la resistencia de nivel de zona (operación continua durante un único error de zona). Para las interrupciones en toda la región, agregue la funcionalidad de recuperación ante desastres geográfica para admitir la conmutación por error y los procedimientos de recuperación posteriores.
- Notas:
- Por diseño, la recuperación ante desastres geográfica de Event Hubs no replica los datos, por lo que hay varias consideraciones que se deben tener en cuenta para el failover y la restauración.
Azure Databricks
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: nivel Premium o Enterprise
- Opciones de mejora para la recuperación ante desastres:
- La resistencia de IoT Hub (continuidad durante los errores localizados) se puede aumentar mediante una implementación de alta disponibilidad entre regiones. El despliegue entre regiones y los procesos de conmutación por error abordan la recuperabilidad.
- Microsoft proporciona las siguientes instrucciones para las opciones de alta disponibilidad y recuperación ante desastres.
- Notas:
- IoT Hub proporciona conmutación por error iniciada por Microsoft y conmutación por error manual mediante la replicación de datos en la región emparejada para cada centro de IoT.
- IoT Hub proporciona alta disponibilidad intra-regional y usa automáticamente una zona de disponibilidad si se crea en un conjunto predefinido de regiones de Azure.
Azure Data Explorer
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: pago por uso (o tamaño del clúster en función de la carga de trabajo)
- Opciones de mejora de DR:
- Azure Data Explorer no proporciona failover regional automático. En el caso de la recuperación ante desastres (DR), implemente varios clústeres en regiones pareadas (activo-activo o activo-pasivo) y replique las canalizaciones de ingesta.
- Use el almacenamiento con redundancia de zona (ZRS) para la resistencia intraregión y seleccione Zonas de disponibilidad durante la creación del clúster para protegerse frente a errores de nivel de zona. Para lograr resistencia regional, combine ZRS con una arquitectura de varios clústeres y redundancia de ingesta a través de Event Hubs o IoT Hub.
- Nota:
- Para más información, consulte BCDR para Azure Data Explorer.
Azure Event Hubs
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: niveles Estándar, Premium y Dedicado
- Opciones de mejora de DR:
- Habilite la recuperación ante desastres georreferenciada para la replicación de metadatos en espacios de nombres emparejados.
- Para la replicación de datos completa, use la replicación geográfica (solo niveles Premium y Dedicado).
- Notas:
- La recuperación ante desastres geográfica solo replica metadatos, no datos de eventos.
- La replicación geográfica replica metadatos y datos para la continuidad empresarial.
- Para más información, consulte Recuperación ante desastres geográfica de Azure Event Hubs.
Azure Machine Learning
- Responsabilidad de recuperación de componentes: Contoso y Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: De uso general, instancias de la serie D
- Opciones de mejora de DR:
- Azure Machine Learning depende de varios servicios de Azure, algunos de los cuales se aprovisionan en la suscripción del cliente. Por lo tanto, el cliente sigue siendo responsable de la configuración de alta disponibilidad de estos servicios.
- La resistencia se puede elevar a través de una implementación multirregional.
- Notas:
- Azure Machine Learning no proporciona conmutación automática por error ni recuperación ante desastres.
Azure SQL Database
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: nivel Crítico Empresarial o Premium recomendado
- Opciones de mejora de DR:
- Habilite los grupos de conmutación por error para activar el traspaso automático entre regiones.
- Use la replicación geográfica activa para bases de datos secundarias legibles.
- Configure el almacenamiento de copia de seguridad con redundancia geográfica para la funcionalidad de restauración geográfica.
- Notas:
- Para obtener más información, consulte Recuperación ante desastres para SQL Database.
Dataverse
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: no aplicable
- Opciones de mejora de DR:
- Utilice DR integrado con zonas de disponibilidad de Azure para la resiliencia dentro de la región.
- Configurar la conmutación por error de autoservicio entre regiones para entornos de producción.
- Notas:
- Para obtener más información, consulte BCDR para Dynamics 365 y Microsoft Power Platform.
Power BI
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: Power BI Pro
- Opciones de mejora de recuperación ante desastres: No disponible, la confiabilidad de Power BI forma parte de su oferta de SaaS.
- Notas:
- Power BI reside en el entorno de Office 365, no en el de Azure.
- Power BI usa Azure Availability Zones para proteger informes, aplicaciones y datos de Power BI frente a errores del centro de datos.
- En caso de error regional, Power BI conmutará a una nueva región, normalmente en la misma ubicación geográfica, como se indica en el Centro de Confianza de Microsoft.
Azure Cosmos DB
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: escritura en una sola región con copia de seguridad periódica
- Opciones de mejora de DR:
- Las cuentas de una sola región pueden perder disponibilidad después de una interrupción regional. La resiliencia se puede elevar a una sola región de escritura y al menos una segunda región (de lectura), y permitir la conmutación por error gestionada por el servicio.
- Use cuentas de Azure Cosmos DB para cargas de trabajo de producción, habilitando la conmutación automática por error. Sin esta configuración, la cuenta pierde la capacidad de escritura durante una interrupción en una región de escritura porque la conmutación por error manual no se puede realizar correctamente sin conectividad con la región.
- Notas:
- Para protegerse contra la pérdida de datos en una región, Azure Cosmos DB proporciona dos modos de copia de seguridad diferentes - : Periódico y Continuo.
- El cliente de Azure Cosmos DB detecta y controla las conmutaciones por error regionales. No requieren ningún cambio de la aplicación.
- En las instrucciones siguientes se describe el impacto de una interrupción de una región en función de la configuración de Cosmos DB.
Azure Data Share
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Microsoft
- Selección de SKU de Contoso: N/A
- Opciones para mejorar la recuperación ante desastres: la confiabilidad de Azure Data Share puede mejorar mediante la implementación de alta disponibilidad en una región secundaria.
Microsoft Purview
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: N/A
- Opciones de mejora de recuperación ante desastres: N/A
- Notas:
- Microsoft Purview no admite BCDR automatizado. El cliente administra las actividades de copia de seguridad y restauración.
Tejido: OneLake
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: capacidad de Tejido
- Opciones de mejora de DR:
- Habilite BCDR para la capacidad de Fabric.
- Notas:
- Para más información, consulte Recuperación ante desastres y protección de datos para OneLake.
Fabric: base de datos SQL en Fabric
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: capacidad de Tejido
- Opciones de mejora de DR:
- Habilitar la capacidad DR en Fabric para la replicación entre regiones de los datos de la base de datos SQL mediante OneLake.
- Realice la copia de seguridad geográfica manual o la replicación geográfica para las configuraciones activas y activas entre regiones.
- Notas:
- Para obtener más información, consulte Recuperación ante Desastres específica de la experiencia de SQL Database.
Fabric: Ingeniero de datos
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: capacidad de Tejido
- Opciones de mejora de DR:
- Habilite la capacidad de recuperación ante desastres en Fabric para la replicación entre regiones de los datos de lakehouse a través de OneLake.
- Realice la copia de seguridad geográfica manual o la replicación geográfica para las configuraciones activas y activas entre regiones.
- Notas:
- Puede volver a implementar cuadernos a través de CI/CD.
- Para obtener más información, consulte Recuperación ante desastres específica para la experiencia del ingeniero de datos.
Plataforma: Almacén de datos
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: capacidad de Tejido
- Opciones de mejora de DR:
- Realice la copia de seguridad geográfica manual o la replicación geográfica para las configuraciones activas y activas entre regiones.
- Habilite la capacidad de DR en Fabric para la replicación de datos de almacén entre regiones a través de OneLake.
- Notas:
- Para obtener más información, consulte Recuperación ante desastres específica para experiencias en el almacenamiento de datos.
- Para los clientes que necesitan recuperación ante desastres entre regiones y continuidad empresarial totalmente automatizada, se recomienda mantener dos configuraciones de almacenamiento de Fabric en distintas regiones. Mantenga la paridad de código y datos realizando implementaciones periódicas y ingesta de datos en ambos sitios.
Plataforma: punto de conexión de SQL Analytics
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: capacidad de Tejido
- Opciones de mejora de DR:
- Habilite la capacidad de recuperación ante desastres en Fabric para la replicación entre regiones de los datos de lakehouse y almacenamiento a través de OneLake.
- Use canalizaciones de CI/CD para volver a implementar objetos SQL, como vistas, procedimientos almacenados y roles de seguridad, en la región de recuperación ante desastres.
- Use la API de sincronización de metadatos o realice una actualización de la interfaz de usuario para asegurarse de que el esquema del punto de conexión de SQL permanece actualizado después de la conmutación por error.
- Notas:
- El punto de conexión de SQL Analytics proporciona acceso de solo lectura a las tablas de Delta Lake almacenadas en OneLake.
Estructura: base de datos duplicada
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: capacidad de Tejido
- Opciones de mejora de DR:
- Copia de seguridad geográfica manual o replicación geográfica para las configuraciones activas y activas entre regiones.
- Notas:
- Las bases de datos reflejadas de la región primaria siguen sin estar disponibles para los clientes y la configuración no se replica en la región secundaria.
- Vuelva a crear una base de datos reflejada en otro espacio de trabajo en una región diferente.
Servicios específicos de la plataforma de datos sin estado
Fundición
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: Enterprise
- Opciones de mejora de DR:
- Implemente áreas de trabajo de Foundry de varias regiones para garantizar la redundancia para el hospedaje y la orquestación del modelo.
- Habilitar el almacenamiento georredundante para conjuntos de datos, artefactos de modelo y flujos de comandos mediante Azure Storage con GRS o GRS de acceso de lectura (RA-GRS).
- Notas:
- Para obtener más información sobre BCDR con el servicio de agente Foundry, consulte DR habilitado por el cliente.
Tejido: Inteligencia en tiempo real
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: capacidad de Tejido
- Opciones de mejora de DR:
- Use la replicación geográfica para las configuraciones activas y activas entre regiones.
- Notas:
- Para los clientes que requieren recuperación ante desastres entre regiones y continuidad empresarial automatizada, mantenga dos entornos de inteligencia Real-Time en regiones diferentes. Asegúrese de la paridad mediante la replicación de datos, configuraciones de eventstream, consultas KQL y canalizaciones de ingesta con regularidad.
- Para obtener más información, consulte Recuperación ante desastres específica para experiencia en Real-Time Intelligence.
Tejido: Data Factory
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: capacidad de Tejido
- Opciones de mejora de DR:
- Utilice un despliegue de pipeline entre regiones.
- Notas:
- Implemente nuevamente los pipelines a través de CI/CD.
- Cuando se utilizan puertas de enlace de red de datos locales o virtuales en las canalizaciones de datos, deben volver a configurarse cuando se traslada a un espacio de trabajo en otra región.
- Para obtener más información, consulte Recuperación ante desastres específica para la experiencia en Data Factory.
Fabric: ciencia de datos
- Responsabilidad de recuperación de componentes: Microsoft
- Responsabilidad de recuperación de carga de trabajo y configuración: Contoso
- Selección de SKU de Contoso: capacidad de Tejido
- Opciones de mejora de DR:
- Cree áreas de trabajo en dos regiones diferentes. A continuación, copie los datos e importe cuadernos, experimentos de aprendizaje automático y modelos en el área de trabajo secundaria.
- Notas:
- La Recuperación ante Desastres para la Ciencia de Datos requiere que copies y vuelvas a crear recursos manualmente en una región secundaria, puesto que esta carga de trabajo no incluye la replicación integrada entre regiones.
- Para obtener más información, consulte DR de Data Science.
Componentes con estado y sin estado
La velocidad de innovación en el conjunto de productos de Microsoft y Azure, en particular, significa que el conjunto de componentes que hemos usado para este ejemplo de trabajo evoluciona rápidamente. Para asegurar que no se proporcionen instrucciones obsoletas en el futuro y ampliar esta guía a los componentes que no se tratan explícitamente en este artículo, en la siguiente sección se proporcionan algunas instrucciones basadas en la clasificación de grano grueso del estado.
Un componente o servicio se considera con estado cuando conserva información de eventos o interacciones anteriores. Algunos ejemplos son los lakehouses, los eventhouses y los almacenes, que almacenan datos y metadatos que deben ser protegidos y recuperados. Por el contrario, los componentes sin estado no conservan ningún registro de las interacciones anteriores. Cada solicitud se procesa de forma independiente usando solo la información proporcionada en ese momento. Algunos ejemplos son Data Factory y cuadernos, que orquestan o procesan datos sin conservar información y dependen de componentes con estado externos para el almacenamiento.
Para un escenario de recuperación ante desastres que requiere una redistribución:
- Los componentes o servicios sin estado, como Azure Functions y las canalizaciones de Azure Data Factory, se pueden volver a implementar desde el control de código fuente con al menos una prueba de humo para validar la disponibilidad antes de introducirse en el sistema más amplio.
- Los componentes o servicios con estado, como Azure SQL Database y las cuentas de almacenamiento, requieren más atención.
- Al adquirir un componente, una decisión clave es la selección de su característica de redundancia de datos. Esta opción normalmente requiere equilibrar la disponibilidad y la durabilidad con los costos operativos.
- Los almacenes de datos también necesitan una estrategia de copia de seguridad de datos. La funcionalidad de redundancia de datos del almacenamiento subyacente mitiga este riesgo para algunos diseños, mientras que otras, como las bases de datos SQL necesitan un proceso de copia de seguridad independiente.
- Si es necesario, el componente se puede volver a implementar desde el control de código fuente con una configuración validada a través de una prueba de humo.
- Un almacén de datos redistribuido debe tener su conjunto de datos rehidratado. La rehidratación se puede lograr mediante la redundancia de datos (cuando esté disponible) o un conjunto de datos de copia de seguridad. Cuando se haya completado la rehidratación, debe validarse para obtener precisión e integridad.
- En función de la naturaleza del proceso de copia de seguridad, es posible que los conjuntos de datos de copia de seguridad requieran validación antes de aplicarse. Los errores o daños en el proceso de copia de seguridad pueden dar lugar a que se use una copia de seguridad anterior en lugar de la versión más reciente disponible.
- Cualquier diferencia entre la fecha y la marca de tiempo del componente y la fecha actual debe abordarse volviendo a ejecutar o reproduciendo los procesos de ingestión de datos desde ese punto hacia adelante.
- Una vez actualizado el conjunto de datos del componente, se puede introducir en el sistema más amplio.
Otros servicios clave
Esta sección contiene instrucciones de alta disponibilidad y recuperación ante desastres para otros servicios y componentes clave de datos de Azure.
Azure Analysis Services: Para más información, consulte Alta disponibilidad de Analysis Services.
Azure Database for MySQL:
- Para más información, consulte Continuidad empresarial con el servidor flexible de Azure Database for MySQL y la documentación de Azure Database for MySQL.
SQL:
- Para más información, consulte Continuidad empresarial y HADR para SQL Server en máquinas virtuales de Azure y continuidad empresarial en SQL Database.
Foundry Tools: Si los Foundry Tools se implementan a través de contenedores de Docker administrados por el cliente, el cliente es responsable de la recuperación.
Búsqueda de Azure AI: Este servicio no incluye un mecanismo integrado para la recuperación ante desastres. Si necesita un servicio continuo durante un error catastrófico, implemente un segundo servicio en otra región e implemente una estrategia de replicación geográfica para asegurarse de que los índices permanecen totalmente redundantes en todos los servicios.
IoT Hub: IoT Hub ofrece conmutación por error iniciada por Microsoft y conmutación por error manual, replicando datos en la región emparejada para cada centro de IoT. IoT Hub también proporciona alta disponibilidad intrarregional y usa automáticamente una zona de disponibilidad si se crea en un conjunto predefinido de regiones de Azure.
Azure Stream Analytics: Stream Analytics es una oferta de plataforma como servicio (PaaS) totalmente administrada, pero no proporciona conmutación automática por error geográfica. Para lograr la redundancia geográfica , implemente trabajos idénticos de Stream Analytics en varias regiones de Azure.
Recurso compartido de datos: Mejore la resistencia mediante la implementación de recursos de Data Share en una región secundaria.
Costos de ejemplo para la arquitectura
Use esta estimación de precios de Azure como punto de partida para estimar los costes de su escenario. La estimación se centra en las unidades de capacidad Microsoft Fabric usadas en la arquitectura, tal como se describe en esta serie de artículos.
Pasos siguientes
Ahora que ha aprendido sobre la arquitectura del escenario, puede obtener información sobre los detalles del escenario.