Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Azure Chaos Studio es un servicio administrado que le ayuda a validar la resistencia de las aplicaciones de Azure mediante la inserción de interrupciones controladas, como apagar máquinas virtuales, forzar las conmutaciones por error de base de datos y bloquear la resolución dns. Puede usar Chaos Studio para reproducir patrones de interrupción reales, comprobar que los mecanismos de recuperación funcionan y crear pruebas de que los sistemas controlan correctamente los errores.
Áreas de trabajo y escenarios
La forma más rápida de empezar es con un área de trabajo. Un área de trabajo se conecta al entorno de Azure a través de un ámbito (una suscripción, un grupo de recursos o un grupo de servicios), detecta los recursos implementados y recomienda escenarios que simulan patrones de interrupción reales en esos recursos.
Las áreas de trabajo son flexibles. Puede organizarlos para que se ajusten a su equipo: cree un área de trabajo por aplicación, una por entorno (preproducción frente a producción), una por equipo o una por límite de cumplimiento. El ámbito determina qué recursos ve el área de trabajo, por lo que se controla el radio de explosión en el nivel del área de trabajo.
Cada escenario es una prueba de resistencia preconfigurada. En lugar de componer manualmente acciones individuales, se selecciona un escenario como Caída de la zona de proceso o Interrupción de DNS, y Chaos Studio se encarga de la composición de las acciones, la detección de los recursos y la secuenciación. Una vez finalizada la ejecución, obtendrá un informe del escenario, un registro estructurado de lo ocurrido que puede utilizar para cumplimiento normativo, retrospectivas o la comunicación con las partes interesadas.
Los escenarios disponibles abarcan interrupciones de zona y de red, conmutaciones por error de bases de datos, avalanchas de caché e interrupciones en la mensajería. Cuando las plantillas integradas no se ajusten a sus necesidades, use el Diseñador de escenarios para adaptar una plantilla a su propio escenario guardado. Consulte Escenarios en Azure Chaos Studio para obtener el catálogo completo.
Para crear su primera área de trabajo y ejecutar un escenario, consulte Inicio rápido: Creación de un área de trabajo y ejecución del primer escenario.
Experimentos (clásico)
Para las combinaciones de errores personalizadas que no cubre el catálogo de escenarios, cree experimentos directamente. Los experimentos te dan control completo sobre los pasos, las ramas, las acciones, los objetivos y los selectores. Este es el modelo de Chaos Studio original y los experimentos existentes siguen funcionando como antes.
Chaos Studio admite dos tipos de errores:
- Servicio directo: errores que se ejecutan directamente en un recurso de Azure a través de su API de administración, sin que se requiera ningún agente. Algunos ejemplos incluyen apagar una máquina virtual, desencadenar una conmutación por error de SQL Database o vaciar una caché de Redis.
- Basado en agentes: errores que se ejecutan dentro de una máquina virtual o un conjunto de escalado de máquinas virtuales para inyectar errores en el sistema invitado, como presión de CPU, presión de memoria o finalización de procesos.
Cada error tiene parámetros específicos que puede configurar. Al compilar un experimento, se definen uno o varios pasos que se ejecutan secuencialmente. Cada paso contiene una o varias ramas que se ejecutan en paralelo. Cada rama contiene una o varias acciones, como insertar un error o esperar una duración especificada.
Para ver un tutorial del modelo de experimento, consulte Experimentos de Caos en Azure Chaos Studio.
complemento de IA de Chaos Studio
El complemento Chaos Studio AI (startchaos) le permite crear áreas de trabajo, configurar escenarios, ejecutarlos y analizar los resultados a través de una interfaz conversacional. El complemento funciona como una aptitud interactiva para GitHub Copilot CLI y como un servidor MCP (Protocolo de contexto de modelo) al que pueden llamar los agentes autónomos.
Una vez completada la ejecución de un escenario, la herramienta de análisis de impacto del complemento correlaciona Azure Monitor métricas, registros y eventos de registro de actividad con los recursos de destino, por lo que puede ver qué señales se mueven durante la prueba sin generar paneles manualmente.
Para obtener instrucciones de configuración y la referencia completa de herramientas, consulte el repositorio del complemento Chaos Studio.
Cuándo usar Chaos Studio
Chaos Studio encaja en varios puntos del ciclo de vida de desarrollo y operaciones:
- Reproducción de incidentes: después de una interrupción, reproduzca el patrón de error para comprobar que las correcciones mejoran la resistencia.
- Jornadas de simulación: antes de un evento importante, ejecute escenarios en su entorno de producción o preproducción para validar que sus sistemas pueden gestionar los modos de fallo previstos.
- Pruebas de continuidad empresarial: valide el comportamiento de la conmutación por error y los objetivos de tiempo de recuperación para los planes de recuperación ante desastres.
- Validación continua: Ejecute escenarios o experimentos como controles de implementación en sus canalizaciones de CI/CD para detectar regresiones de resiliencia antes de que lleguen a producción.
- Pruebas de cumplimiento: Utilice informes de escenarios para ayudar a respaldar los requisitos de prueba de marcos de resiliencia operativa como DORA.
En el vídeo siguiente se proporciona más información sobre Chaos Studio: