Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Al diseñar una carga de trabajo para maximizar la rentabilidad de la inversión (ROI) bajo restricciones financieras, primero necesita requisitos funcionales y no funcionales claramente definidos. Una estrategia de priorización de trabajo y esfuerzo es esencial. La fundación es un equipo que tiene un fuerte sentido de responsabilidad financiera. El equipo debe tener una comprensión sólida de las tecnologías disponibles y sus modelos de facturación.
Después de comprender el ROI de una carga de trabajo, puede empezar a mejorarla. Tenga en cuenta cómo las decisiones basadas en los principios de diseño de optimización de costos y las recomendaciones de la lista de comprobación de revisión de diseño para la optimización de costos pueden influir en los objetivos y optimizaciones de otros pilares de Well-Architected Framework. Para la optimización de costos, es importante evitar centrarse en una solución más barata. Las opciones que solo se concentran en minimizar el gasto pueden perjudicar los objetivos empresariales de la carga de trabajo y su reputación. En este artículo se describen los inconvenientes de ejemplo que un equipo de carga de trabajo podría encontrar al establecer destinos, diseñar y planear operaciones para la optimización de costos.
Ventajas de la optimización de costos con confiabilidad
El costo de una interrupción del servicio debe medirse con respecto al costo de evitar o recuperarse de uno. Si el costo de las interrupciones supera el costo del diseño de confiabilidad, debe invertir más para evitar o mitigar las interrupciones. Por el contrario, el costo de los esfuerzos de confiabilidad podría ser mayor que el costo de una interrupción, incluidos factores como los requisitos de cumplimiento y la reputación. Debe considerar la desinversión estratégica en el diseño de confiabilidad solo en este escenario.
Compensación: reducción de la resistencia. Una carga de trabajo incorpora medidas de resistencia para intentar evitar y resistir tipos y cantidades específicos de mal funcionamiento.
Para ahorrar dinero, el equipo de cargas de trabajo podría subaprovisionar un componente o sobrerestringir su escalado, lo que hace que el componente tenga más probabilidades de fallar durante picos repentinos de demanda.
La consolidación de los recursos de carga de trabajo (aumento de la densidad) para la optimización de costos hace que los componentes individuales produzcan errores durante los picos de demanda y durante las operaciones de mantenimiento, como las actualizaciones.
La eliminación de componentes que admiten patrones de diseño de resistencia, como un bus de mensajes, y la creación de una dependencia directa reduce las funcionalidades de autoconservación.
Ahorrar dinero al reducir la redundancia puede limitar la capacidad de una carga de trabajo para controlar errores de funcionamiento simultáneos.
El uso de SKUs económicos podría limitar el máximo objetivo de nivel de servicio (SLO) que la carga de trabajo puede alcanzar.
Establecer límites de gasto estrictos puede impedir que una carga de trabajo se ecale para satisfacer la demanda legítima.
Sin herramientas o pruebas de confiabilidad, se desconoce la confiabilidad de una carga de trabajo y es menos probable que cumpla los objetivos de confiabilidad.
Compensación: estrategia de recuperación limitada. Una carga de trabajo confiable tiene un plan de recuperación y respuesta a incidentes probados para escenarios de desastres.
Las pruebas o simulacros reducidos del plan de recuperación ante desastres de una carga de trabajo podrían afectar la velocidad y efectividad de las operaciones de recuperación.
La creación o conservación de menos copias de seguridad reduce los posibles puntos de recuperación y aumenta la posibilidad de perder datos.
Elegir un contrato de soporte técnico menos costoso con asociados tecnológicos podría aumentar el tiempo de recuperación de la carga de trabajo debido a posibles retrasos en la asistencia técnica.
Compensación: mayor complejidad. Una carga de trabajo que usa enfoques sencillos y evita la complejidad innecesaria o excesiva es generalmente más fácil de administrar en términos de confiabilidad.
El uso de patrones de nube de optimización de costos puede agregar nuevos componentes, como una red de entrega de contenido (CDN) o cambiar las tareas a los dispositivos perimetrales y cliente para los que una carga de trabajo debe proporcionar objetivos de confiabilidad.
El escalado basado en eventos puede ser más complicado ajustar y validar que el escalado basado en recursos.
La reducción del volumen de datos y la jerarquización de datos a través de acciones del ciclo de vida de los datos, posiblemente junto con la implementación de puntos de datos agregados antes de un evento de ciclo de vida, introduce aspectos de confiabilidad que deben considerarse en la carga de trabajo.
El uso de regiones diferentes para optimizar el costo puede dificultar la administración, las redes y la supervisión.
Ventajas de la optimización de costos con seguridad
El costo de un compromiso con la confidencialidad, integridad o disponibilidad siempre debe equilibrarse con el costo de prevenirlo. Un incidente de seguridad puede causar daños financieros, legales y de reputación significativos. Invertir en seguridad mitiga el riesgo y esa inversión debe medirse con el costo de experimentar el riesgo. Como regla, no sacrifique la seguridad para obtener optimizaciones de costos que estén por debajo del punto considerado responsable y de la acordada mitigación de riesgos. Optimizar los costos de seguridad mediante la asignación de derechos a las soluciones es una práctica de optimización importante, pero tenga en cuenta los inconvenientes como los siguientes al hacerlo.
Compensación: controles de seguridad reducidos. Los controles de seguridad se establecen en varias capas, a veces redundantes, para proporcionar defensa en profundidad.
Una táctica de optimización de costos es buscar formas de quitar componentes o procesos que acumulan costos operativos o de unidad. La eliminación de componentes de seguridad como los ejemplos siguientes para ahorrar dinero afecta a la seguridad. Debe realizar cuidadosamente un análisis de riesgos sobre este impacto.
La reducción o simplificación de las técnicas de autenticación y autorización pone en peligro el principio de verify explicitly de la arquitectura Confianza cero. Algunos ejemplos de estas simplificaciones incluyen el uso de un esquema de autenticación básico, como claves precompartidas en lugar de invertir tiempo para aprender los enfoques de OAuth del sector, o el uso de asignaciones simplificadas de control de acceso basado en roles para reducir la sobrecarga de administración.
La eliminación del cifrado en tránsito o en reposo para reducir los costos de los certificados y sus procesos operativos expone los datos a posibles infracciones de integridad o confidencialidad.
La eliminación o reducción del examen de seguridad, las herramientas de inspección o las pruebas de seguridad debido al costo y la inversión de tiempo asociados pueden afectar directamente a la confidencialidad, integridad o disponibilidad que esas herramientas y pruebas están diseñadas para proteger.
Reducir la frecuencia de aplicación de revisiones de seguridad para ahorrar tiempo operativo en la catalogación y la aplicación de revisiones afecta a la capacidad de una carga de trabajo para abordar las amenazas en constante evolución.
La eliminación de controles de red como firewalls podría provocar un error al bloquear el tráfico entrante y saliente malintencionado.
Compromiso: aumento de la superficie de carga de trabajo. El pilar de seguridad prioriza una superficie reducida y controlada para minimizar los vectores de ataque y la administración de los controles de seguridad.
Los patrones de diseño en la nube que optimizan los costos a veces requieren la introducción de componentes adicionales. Estos componentes adicionales aumentan el área expuesta de la carga de trabajo. Los componentes y los datos dentro de ellos deben protegerse, posiblemente de maneras que aún no se usen en el sistema. Estos componentes y datos suelen estar sujetos a cumplimiento. Entre los ejemplos de patrones que pueden introducir componentes se incluyen:
Usar el patrón de hospedaje de contenido estático para descargar datos en un nuevo componente de red CDN.
Uso del patrón Valet Key para transferir el procesamiento y proteger el acceso a los recursos a la computación del cliente.
Usar el patrón de nivelación de carga basado en cola para suavizar los costos mediante la introducción de un bus de mensajes.
Compromiso: se ha quitado la segmentación. El pilar de Seguridad prioriza una segmentación fuerte para facilitar la aplicación de controles de seguridad específicos y para controlar el radio de explosión.
Compartir recursos, por ejemplo, en situaciones multiinquilino o colocar varias aplicaciones en una plataforma de aplicaciones compartidas, es un enfoque para reducir los costos aumentando la densidad y reduciendo la superficie de administración. Esta mayor densidad puede provocar problemas de seguridad como estos:
El movimiento lateral entre componentes que comparten recursos es más fácil. Un evento de seguridad que pone en peligro la disponibilidad del host de la plataforma de aplicaciones o una aplicación individual también tiene un radio de explosión mayor.
Los recursos ubicados conjuntamente pueden compartir una identidad de carga de trabajo y tener pistas de auditoría menos significativas en los registros de acceso.
Los controles de seguridad de red deben ser lo suficientemente amplios como para cubrir todos los recursos ubicados conjuntamente. Esta configuración podría infringir el principio de privilegios mínimos para algunos recursos.
La colocalización de aplicaciones o datos dispares en un host compartido puede dar lugar a la ampliación de los requisitos de cumplimiento y los controles de seguridad a las aplicaciones o los datos que, de otro modo, estarían fuera del ámbito. Esta ampliación del ámbito requiere un esfuerzo adicional de examen y auditoría de seguridad en los componentes ubicados conjuntamente.
Ventajas de optimización de costos con excelencia operativa
Compensación: capacidades de ciclo de vida de desarrollo de software (SDLC) comprometidas. El proceso SDLC de una carga de trabajo proporciona rigor, coherencia, especificidad y priorización para la administración de cambios en una carga de trabajo.
La reducción de los esfuerzos de pruebas para ahorrar tiempo y el costo asociado al personal de prueba, los recursos y las herramientas pueden dar lugar a más errores en producción.
Retrasar el pago de la deuda técnica para centrar los esfuerzos del personal en las nuevas características puede dar lugar a ciclos de desarrollo más lentos y a una agilidad general reducida.
La desprioritización de la documentación para centrar los esfuerzos del personal en el desarrollo de productos puede dar lugar a un mayor tiempo de incorporación para los nuevos empleados, afectar a la eficacia de la respuesta a incidentes y poner en peligro los requisitos de cumplimiento.
Una falta de inversión en el entrenamiento conduce a habilidades estancadas, lo que reduce la capacidad del equipo para adoptar tecnologías y prácticas más recientes.
La eliminación de herramientas de automatización para ahorrar dinero puede dar lugar a que el personal dedica más tiempo a las tareas que ya no están automatizadas. También aumenta el riesgo de errores e incoherencias.
Reducir los esfuerzos de planificación, como el ámbito y la priorización de la actividad, para reducir los gastos puede aumentar la probabilidad de volver a trabajar debido a especificaciones vagas y a una implementación deficiente.
Evitar o reducir las actividades de mejora continua, como las retrospectivas y los informes posteriores a los incidentes, para mantener al equipo de carga de trabajo centrado en la entrega puede crear oportunidades perdidas para optimizar los procesos rutinarios, no planeados y de emergencia.
Compensación: reducción de la observabilidad. La observabilidad es necesaria para ayudar a garantizar que una carga de trabajo tenga una alerta significativa y una respuesta a incidentes correcta.
La reducción del volumen de registro y métricas para ahorrar en los costos de almacenamiento y transferencia reduce la observabilidad del sistema y puede dar lugar a:
- Menos puntos de datos para crear alertas relacionadas con la confiabilidad, la seguridad y el rendimiento.
- Brechas de cobertura en las actividades de respuesta a incidentes.
- Observabilidad limitada en interacciones o límites relacionados con la seguridad o el cumplimiento.
Los patrones de diseño de optimización de costos pueden agregar componentes a una carga de trabajo, lo que aumenta su complejidad. La estrategia de supervisión de cargas de trabajo debe incluir esos nuevos componentes. Por ejemplo, algunos patrones pueden introducir flujos que abarcan varios componentes o desplazan procesos del servidor al cliente. Estos cambios pueden aumentar la complejidad de la correlación y la información de seguimiento.
La reducción de la inversión en herramientas de observabilidad y el mantenimiento de paneles eficaces puede reducir la capacidad de aprender de producción, validar las opciones de diseño e informar al diseño del producto. Esta reducción también puede obstaculizar las actividades de respuesta a incidentes y complicar el cumplimiento del objetivo de tiempo de recuperación (RTO) y el Acuerdo de Nivel de Servicio (SLA).
Compensación: mantenimiento diferido. Se espera que los equipos de carga de trabajo mantengan el código, las herramientas, los paquetes de software y los sistemas operativos revisados y actualizados de forma oportuna y ordenada.
Permitir que los contratos de mantenimiento con proveedores de herramientas expiren puede dar lugar a características de optimización perdidas, soluciones de errores y actualizaciones de seguridad.
Aumentar el tiempo entre los parches del sistema con el objetivo de ahorrar tiempo puede provocar la pérdida de correcciones de errores o una falta de protección contra las amenazas de seguridad que evolucionan constantemente.
Compromisos de la optimización de costos con la eficiencia del rendimiento
Los pilares optimización de costos y eficiencia del rendimiento priorizan la maximización del valor de una carga de trabajo. La eficiencia del rendimiento hace hincapié en cumplir los objetivos de rendimiento sin gastar más de lo necesario. La optimización de costos destaca la maximización del valor generado por los recursos de una carga de trabajo sin superar los objetivos de rendimiento. Como resultado, la optimización de costos a menudo mejora la eficiencia del rendimiento. Sin embargo, hay desventajas de eficiencia del rendimiento asociadas a la optimización de costos. Estos inconvenientes pueden dificultar el alcance de los objetivos de rendimiento y dificultar la optimización continua del rendimiento.
Compensación: recursos infraaprovisionados o infraescalados. Una carga de trabajo eficaz en el rendimiento tiene suficientes recursos para atender la demanda, pero no tiene sobrecarga excesiva sin usar, incluso cuando los patrones de uso fluctúan.
Reducir los costos al reducir el tamaño de los recursos puede privar a las aplicaciones de los recursos. Es posible que la aplicación no pueda controlar las fluctuaciones significativas del patrón de uso.
Limitar o retrasar el escalado para establecer un límite o reducir los costos podría resultar en una oferta insuficiente para satisfacer la demanda.
La configuración de escalado automático que se reduce de forma agresiva para reducir los costos podría dejar a un servicio desprevenido ante picos repentinos de demanda o provocar fluctuaciones frecuentes de escalado (también conocido como flapping).
Compensación: falta de optimización a lo largo del tiempo. Evaluar los efectos de los cambios en la funcionalidad, los cambios en los patrones de uso, las nuevas tecnologías y los distintos enfoques de la carga de trabajo es una manera de intentar aumentar la eficacia.
Limitar el enfoque en el desarrollo de experiencia en la optimización del rendimiento para priorizar la entrega puede provocar oportunidades perdidas para mejorar la eficiencia del uso de recursos.
La eliminación de las herramientas de supervisión o pruebas de rendimiento de acceso aumenta el riesgo de problemas de rendimiento no detectados. También limita la capacidad de un equipo responsable de la carga de trabajo para participar en ciclos de medición y mejora.
El abandono de áreas propensas a la degradación del rendimiento, como los almacenes de datos, puede deteriorar gradualmente el rendimiento de las consultas y elevar el uso general del sistema.
Vínculos relacionados
Explore los inconvenientes de los otros pilares: