Mejora La Productividad Utilizando IA En La Gestión Operativa De Salud En La Nube

0
114
Boost productivity by using AI in cloud operational health management

Las organizaciones modernas dependen cada vez más de una infraestructura en la nube robusta para garantizar la continuidad del negocio y la eficiencia operativa. Los eventos de salud operativa, que incluyen problemas operativos, notificaciones del ciclo de vida del software y más, son insumos fundamentales para la gestión de operaciones en la nube. Una gestión ineficiente de estos eventos puede resultar en tiempos de inactividad no planificados, costos innecesarios y pérdida de ingresos para las organizaciones.

Sin embargo, la gestión de eventos operativos en la nube presenta desafíos significativos, especialmente en estructuras organizativas complejas. Con una vasta gama de servicios y recursos que abarcan cientos de cuentas, las organizaciones pueden enfrentar un volumen abrumador de eventos operativos que ocurren a diario, lo que hace que la administración manual sea impracticable. Si bien los enfoques programáticos tradicionales ofrecen capacidades de automatización, a menudo implican una sobrecarga significativa de desarrollo y mantenimiento, además de reglas de mapeo cada vez más complejas y lógica de triaje inflexible.

Para abordar estos desafíos, se ha desarrollado un asistente de operaciones impulsado por inteligencia artificial (IA) que responde automáticamente a los eventos operativos. Este asistente utiliza Amazon Bedrock, AWS Health, AWS Step Functions y otros servicios de AWS para filtrar eventos irrelevantes, recomendar acciones, crear y gestionar tickets de problemas en herramientas de gestión de servicios de TI (ITSM) integradas y consultar bases de conocimiento para obtener información relacionada con eventos operativos. La solución permite la automatización de tareas complejas, racionalizando el proceso de remediación de eventos operativos en la nube, mejorando la continuidad del negocio y la eficiencia operativa.

Dentro de este esquema, los eventos operativos se consideran como ocurrencias dentro del entorno en la nube de una organización que pueden afectar el rendimiento, la resiliencia, la seguridad o el costo de las cargas de trabajo. Los ejemplos de eventos operativos de AWS incluyen eventos de salud relacionados con la disponibilidad de servicios de AWS, hallazgos de AWS Security Hub sobre vulnerabilidades de seguridad y alertas de detección de anomalías de costo de AWS.

El manejo eficiente de eventos operativos implica notificación, triaje, seguimiento del progreso, acción y archivo y reporte a gran escala. Sin embargo, las automatizaciones programáticas tradicionales tienen limitaciones cuando se manejan múltiples tareas. La inteligencia artificial se ha integrado en esta solución para proporcionar una mayor flexibilidad y capacidad de adaptación a cambios organizativos, expansiones de servicios u nuevos formatos de fuentes de datos.

Este enfoque innovador no solo optimiza la gestión de eventos operativos, sino que también mejora la capacidad de las organizaciones para mantener la continuidad operativa y reducir los riesgos de costos y tiempos de inactividad. Implementando un asistente de operaciones basado en IA, las organizaciones pueden gestionar eficientemente el gran volumen de eventos operativos en entornos complejos, centrados en la nube, con mínima supervisión humana.
vía: AWS machine learning blog