Saltar al contenido principal

Características de AWS DevOps Agent

Respuesta autónoma ante incidentes

Abrir todo

    AWS DevOps Agent se integra con sistemas de creación de tickets y alarmas, como ServiceNow, para iniciar automáticamente investigaciones a partir de los tickets de incidentes, lo que acelera la respuesta a los incidentes dentro de los flujos de trabajo existentes para reducir el tiempo medio de resolución (MTTR).

    También puede iniciar y guiar las investigaciones mediante un chat interactivo. AWS DevOps Agent actúa como miembro de su equipo de operaciones y trabaja directamente en sus herramientas de colaboración, como ServiceNow y Slack, para compartir los resultados y coordinar la respuesta. Cuando sea necesario, cree un caso de AWS Support directamente a partir de una investigación para ofrecer a los expertos de AWS Support contexto inmediato a fin de que conseguir una resolución más rápida.

    Agente de DevOps de AWS clasifica los incidentes automáticamente y correlaciona las alarmas relacionadas para identificar cuándo tienen su origen en el mismo evento. Esto acelera la respuesta a incidentes al comprender de inmediato qué alarmas están relacionadas y cuáles requieren una investigación independiente, lo que reduce el ruido y permite a los equipos centrarse primero en los problemas más críticos.

    AWS DevOps Agent se integra con herramientas de observabilidad, repositorios de código y canalizaciones de CI/CD para correlacionar y analizar los datos de telemetría, código e implementación, y compartir sus hipótesis exploradas, observaciones y resultados de la causa raíz. Mediante las investigaciones sistemáticas, AWS DevOps Agent identifica la causa raíz de los problemas derivados de cambios en el sistema, anomalías de entrada, límites de recursos, errores de componentes y problemas de dependencias en todo el entorno.

    Una vez que AWS DevOps Agent identifique la causa principal, proporciona planes de mitigación detallados, con acciones para resolver el incidente, validar el éxito y revertir un cambio si es necesario. AWS DevOps Agent también proporciona instrucciones listas para el agente que otro agente de fronera puede implementar; por ejemplo, mejoras de código que puede implementar el agente autónomo de Kiro.

    Agente de DevOps de AWS mejora las capacidades de investigación revisando las investigaciones anteriores para crear aptitudes de investigación aprendidas. La habilidad de investigación aprendida analiza las investigaciones anteriores para aprender a clasificar los eventos y generar análisis de causa raíz y planes de mitigación de forma más eficaz y rápida, volviéndose más inteligente con el tiempo

    Mediante la investigación sistemática de las alarmas derivadas de cambios en el sistema, anomalías de entrada, límites de recursos, errores de componentes y problemas de dependencias en toda la pila, AWS DevOps Agent guía a los equipos de DevOps con pasos de mitigación específicos, lo que reduce el tiempo medio de resolución (MTTR) de horas a minutos. Por ejemplo:

    • Cambios en el sistema: si un incidente se debe a la limitación de Amazon DynamoDB porque se ha introducido un cambio reciente en el código que provoca una alta latencia debido a un uso ineficiente, AWS DevOps Agent puede recomendar la reversión del cambio como medida de mitigación inmediata.
    • Cambios en el sistema: si un incidente se debe a errores de suscripción a Amazon SNS porque hay una falta de coincidencia en la política de filtros tras la implementación de un código, AWS DevOps Agent puede recomendar la reversión del cambio en el código que alteró la estructura de los mensajes como medida de mitigación inmediata para restaurar el flujo de mensajes.
    • Anomalías de entrada: si un incidente se debe a que AWS Lambda limita las notificaciones porque el tráfico supera los límites, AWS DevOps Agent puede recomendar un aumento de los límites de simultaneidad como medida de mitigación inmediata.
    • Anomalías de entrada: si un incidente se debe a errores en la publicación de mensajes de Amazon SNS porque hay problemas de tamaño de los mensajes, AWS DevOps Agent puede recomendar agregar la validación a la publicación de mensajes de Amazon SNS como medida de mitigación inmediata.
    • Límites de recursos: si un incidente se debe a la limitación de la API porque se han superado los límites de velocidad, AWS DevOps Agent puede recomendar un aumento de los límites de velocidad y ráfaga como medida de mitigación inmediata.
    • Límites de recursos: si un incidente se debe a la limitación de Amazon DynamoDB porque se ha superado la capacidad de escritura, AWS DevOps Agent puede recomendar un aumento de la capacidad de escritura como medida de mitigación inmediata.
    • Errores de componentes: si un incidente se debe a una latencia de arranque en frío porque se ha degradado el rendimiento, AWS DevOps Agent puede recomendar un aumento de la simultaneidad aprovisionada como medida de mitigación inmediata.

Prevención proactiva de incidentes

Abrir todo

    Agente de DevOps de AWS analiza los patrones de los incidentes históricos para ofrecer recomendaciones prácticas que refuerzan cuatro áreas clave: la observabilidad, la optimización de la infraestructura, la mejora de las canalizaciones de implementación y la resiliencia de las aplicaciones. Por ejemplo, Agente de DevOps de AWS puede identificar brechas en las pruebas que habrían evitado que un problema llegara a producción. Las recomendaciones también incluyen especificaciones listas para usar por agentes, con el fin de delegar la implementación a su agente de codificación o a un compañero para actualizar el código de la aplicación o la infraestructura. Esto impulsa la mejora continua sin necesidad de gestionar el trabajo acumulado.

    AWS DevOps Agent identifica las brechas en la cobertura de la observabilidad y las oportunidades para ajustar las alarmas con precisión, lo que reduce el tiempo medio de detección (MTTD) y le permite identificar los problemas antes de que se conviertan en un problema mayor. Por ejemplo, después de identificar que la detección de incidentes para los errores recientes ha sido demasiado lenta, Agente de DevOps de AWS puede recomendar la implementación de la supervisión y la detección de anomalías más cerca del origen del error para reducir el tiempo de detección y evitar interrupciones prolongadas.

    Mediante un bucle de aprendizaje, AWS DevOps Agent sigue mejorando sus recomendaciones, las ajusta a sus prioridades operativas y ofrece recomendaciones cada vez más relevantes y adaptadas a las necesidades de su organización en función de los comentarios del equipo sobre las recomendaciones.

    AWS DevOps Agent analiza los patrones de los incidentes históricos para ofrecer recomendaciones específicas que eviten futuras interrupciones y refuercen la resiliencia del sistema. Al evaluar los incidentes reales, ofrece mejoras específicas y viables que reducen la frecuencia y el impacto de los problemas similares en cuatro áreas principales: observabilidad, optimización de la infraestructura, mejora de las canalizaciones de implementación y resiliencia de las aplicaciones.

    • Mejora de la observabilidad: AWS DevOps Agent puede recomendar un ajuste de los umbrales de alarma de 15 errores en 20 minutos a 3 errores en 5 minutos para los sistemas de autenticación críticos a fin de reducir el tiempo de detección y evitar interrupciones prolongadas de la integración.
    • Mejora de la observabilidad: AWS DevOps Agent puede recomendar la implementación de filtros de métricas de CloudWatch específicos para rastrear los patrones anómalos de acceso denegado para los cambios de roles de IAM, lo que mejora la rapidez de las detecciones en comparación con las alarmas anteriores.
    • Mejora de la infraestructura: tras analizar que el esquema de tablas de Amazon DynamoDB no coincide con el patrón de acceso principal del servicio (lo que obliga a realizar análisis poco eficientes de tablas completas), AWS DevOps Agent recomienda la creación de un índice secundario global (GSI) con el atributo consultado con frecuencia como clave de partición. Esto transformaría las operaciones de análisis a consultas, lo que reduciría la latencia de 2500 a 3500 ms a menos de 100 ms y evitaría la limitación.
    • Mejora de la infraestructura: el análisis de AWS DevOps Agent indica que la aplicación cuenta con los recursos adecuados, pero está limitada por un cuello de botella con un solo pod en el que todas las solicitudes pasan a una sola instancia durante los picos de tráfico. Es posible que AWS DevOps Agent recomiende agregar Horizontal Pod Autoscaler al clúster de Kubernetes, lo que escalará horizontalmente el servicio de forma automática en función de la demanda y distribuirá la carga de manera efectiva entre varios pods.
    • Canalización de implementación: después de analizar las implementaciones con errores de Amazon ECS, AWS DevOps Agent puede recomendar habilitar las reversiones automáticas y supervisar los estados de implementación con Amazon EventBridge. Estos cambios detectarán y resolverán rápidamente los errores de comprobación de estado de las tareas, lo que evitará la interrupción de las transacciones de los clientes.
    • Canalización de implementación: tras analizar los errores de implementaciónAWS DevOps Agent puede recomendar la validación obligatoria previa a la implementación de la conectividad con Amazon Managed Service para Prometheus para las definiciones de tareas de Amazon ECS. Esta recomendación reduciría las implementaciones con errores al detectar los problemas de conectividad durante el proceso de implementación.  

Gestión de tareas de SRE bajo demanda

Abrir todo

    Haga a Agente de DevOps de AWS cualquier pregunta operativa y obtenga respuestas inmediatas y contextuales basadas en su infraestructura real sin tener que navegar entre consolas ni herramientas de supervisión. Más allá del formato de preguntas y respuestas, cree, guarde y comparta gráficos e informes personalizados, como resúmenes diarios del estado de las operaciones o tendencias de errores 4xx, que le permitan realizar un seguimiento de las métricas operativas y a comunicar información a su equipo.

    Agente de DevOps de AWS incorpora integraciones con sus herramientas existentes, incluidas herramientas de observabilidad (CloudWatch, Dynatrace, Datadog, New Relic, Splunk), repositorios de código y canalizaciones de CI/CD (GitHub, GitLab, Azure DevOps), y herramientas de tickets y colaboración (ServiceNow, PagerDuty, Slack), para identificar rápidamente las causas raíz, prevenir futuros incidentes de forma proactiva y obtener respuestas contextuales bajo demanda sobre su entorno.

    Conéctese a servidores MCP privados o remotos para integrarse con herramientas adicionales, como sistemas propietarios, plataformas especializadas, sistemas de control de versiones administrados por el cliente y documentación de infraestructura interna. Esto permite a Agente de DevOps de AWS acceder de forma segura a sus herramientas, datos y flujos de trabajo internos para ofrecer información más precisa y automatizar acciones usando el contexto real de su organización.

    Agente de DevOps de AWS aprende sobre su entorno, detectando automáticamente las aplicaciones, sus servicios componentes y los recursos que componen dichos servicios. Con su habilidad de topología, el agente analiza todas las herramientas configuradas, acepta la información del usuario y crea una comprensión detallada de los recursos, las relaciones y los flujos clave de sus aplicaciones. Asigna estas relaciones en una topología dinámica y actualizada continuamente, lo que le ofrece una verdadera vista general de sus aplicaciones. Al correlacionar este mapa de recursos en tiempo real con datos de telemetría, código e implementaciones, Agente de DevOps de AWS desarrolla un conocimiento profundo de su entorno, lo que permite una resolución de incidentes más rápida, la prevención proactiva de problemas futuros y respuestas contextuales basadas en cómo se ejecutan sus aplicaciones.

    Agregue aptitudes reutilizables y modulares que Agente de DevOps de AWS puede invocar para realizar tareas de forma consistente y fiable. Las habilidades definidas por clientes y socios le permiten ampliar las capacidades del agente para adaptarlas a su entorno; por ejemplo, puede definir una habilidad que permita a Agente de DevOps de AWS consultar los registros de bases de datos en las instalaciones proporcionando información sobre las ubicaciones de los registros, las convenciones de nomenclatura y las estrategias de consulta. Al transferir el conocimiento institucional al agente, puede potenciar desde la detección de servicios y el análisis de registros hasta los runbooks de respuesta a incidentes y la información sobre la propiedad de los equipos.

¿Ha encontrado lo que buscaba hoy?

Ayúdenos a mejorar la calidad del contenido de nuestras páginas compartiendo sus comentarios