Agente de DevOps da AWS
Promova a excelência operacional com um agente de IA autônomo que resolve e previne incidentes de forma proativa
Por que usar o Agente de DevOps da AWS?
O Agente de DevOps da AWS é seu colega de equipe de operações sempre disponível que resolve e evita incidentes de forma proativa, otimiza a confiabilidade e o desempenho de aplicativos e lida com tarefas de SRE sob demanda em ambientes da AWS, multinuvem e locais. Ele investiga incidentes e identifica melhorias operacionais como faria um engenheiro de DevOps experiente: aprendendo seus aplicativos e seus relacionamentos, trabalhando com suas ferramentas de observabilidade, runbooks, repositórios de código e pipelines de CI/CD e correlacionando dados de telemetria, código e implantação em todos os ambientes. Faça perguntas, obtenha respostas contextuais instantâneas e crie gráficos e relatórios personalizados que você pode salvar e compartilhar com sua equipe.
Benefícios
O AWS DevOps Agent é o seu engenheiro de plantão autônomo e sempre ativo. Ele começa a investigar no momento em que um alerta chega, seja às 2h da manhã ou durante o horário de pico, para restaurar rapidamente a performance ideal de sua aplicação. O AWS DevOps Agent faz triagem autônoma de incidentes 24 horas por dia, 7 dias por semana, fornecendo análise de causa raiz e ações para resolução. Ele usa a compreensão dos recursos e relacionamentos de sua aplicação para entender rapidamente as dependências e interações. O AWS DevOps Agent agiliza a resposta a incidentes, encaminhando automaticamente observações, descobertas e etapas de mitigação por meio de seus canais de comunicação preferidos, como Slack, ServiceNow e PagerDuty.
O Agente de DevOps da AWS analisa padrões em incidentes históricos para fornecer recomendações acionáveis que fortalecem quatro áreas principais: observabilidade, otimização da infraestrutura, aprimoramento do pipeline de implantação e resiliência de aplicativos. As recomendações incluem especificações prontas para entregar a implementação ao seu agente de codificação ou a um colega para atualizar o código dos aplicativos ou da infraestrutura. Isso impulsiona a melhoria contínua sem a necessidade de gerenciar uma lista de pendências.
O Agente de DevOps da AWS permite que você acesse os insights inexplorados em seus dados operacionais, integrando-se com segurança aos seus fluxos de trabalho e ferramentas de observabilidade, runbooks, repositórios de código e pipelines de CI/CD. O AWS DevOps Agent oferece integrações internas com ferramentas de observabilidade, como Amazon CloudWatch, Dynatrace, Datadog, Grafana, New Relic e Splunk, além de repositórios de programação e pipelines de CI/CD, como Azure DevOps, GitHub e GitLab. É possível estender o AWS DevOps Agent além das integrações integradas, conectando-se de forma segura a servidores MCP privados ou remotos, permitindo integrações com ferramentas adicionais, como as ferramentas personalizadas da sua organização, plataformas especializadas ou sistemas de tíquete proprietários.
O Agente de DevOps da AWS aproveita seu profundo conhecimento do seu ambiente, permitindo que você mergulhe mais fundo no seu ambiente de aplicativos, em vez de apenas fazer perguntas, para criar, salvar e compartilhar gráficos e relatórios personalizados. Consulte a integridade dos recursos, investigue padrões de incidentes, acompanhe implantações e confira recomendações de prevenção, tudo por meio de uma interface de linguagem natural. Crie, salve e compartilhe gráficos e relatórios personalizados que ajudam você a monitorar métricas operacionais e transmitir informações à sua equipe.
Clientes
United Airlines
"Na United Airlines, transportamos mais de 500.000 passageiros diariamente. Temos cerca de 38.000 Dynatrace OneAgents monitorando um ambiente de nuvem híbrida, mais de 500 contas da AWS, 20.000 funções do AWS Lambda, microsserviços do Amazon ECS e vários outros serviços. Nessa escala, usamos anteriormente várias ferramentas executando as mesmas funções em diferentes domínios, o que criava lacunas e caixas fechadas durante a solução de problemas. O Agente de DevOps da AWS com o Dynatrace muda completamente isso. O Dynatrace detecta problemas com rapidez e precisão, identifica a camada de aplicativo responsável e, em seguida, o agente investiga mais detalhadamente e fornece etapas precisas para resolver o problema, tudo diretamente inserido no Dynatrace. Em vez de iniciar uma chamada de incidente às 3 da manhã e alternar entre as ferramentas, agora temos as respostas prontas: um painel centralizado."
Jason Eckhart, engenheiro líder de confiabilidade e observabilidade, United Airlines
T-Mobile
"Quando a AWS apresentou o Agente de DevOps, a T-Mobile deu apoio desde o primeiro dia. Como parceiro de design, vimos como o Agente de DevOps da AWS pode melhorar significativamente a análise da causa raiz em ambientes de produção. Nosso feedback de casos reais influenciou diretamente a evolução do produto.
Nossa infraestrutura abrange várias nuvens e ambientes locais, com registros de aplicativos centralizados em nossa implantação local do Splunk. A capacidade do Agente de DevOps da AWS de se integrar perfeitamente ao Splunk e analisar registros nesses diversos ambientes tem sido impactante à medida que continuamos testando a solução."
Aravind Manchireddy, vice-presidente sênior de operações de tecnologia da T-Mobile
Western Governors University
A Western Governor's University (WGU), uma universidade on-line líder que atende a mais de 191.000 estudantes, foi uma das primeiras organizações a implantar o Agente de DevOps da AWS na produção, mesmo antes do lançamento prévio na re:Invent. Como usuário em grande escala do Dynatrace, a WGU aproveita a integração nativa do Agente de DevOps com o Dynatrace, permitindo que o Dynatrace Intelligence encaminhe automaticamente os registros de problemas ao agente para investigação e devolva as descobertas enriquecidas diretamente ao Dynatrace.
Durante uma recente investigação de produção, a equipe de SRE da WGU usou o Agente de DevOps para analisar um cenário de interrupção do serviço, reduzindo o tempo total de resolução de cerca de duas horas para apenas 28 minutos — uma melhoria de 77% no MTTR. O agente identificou rapidamente a causa raiz na configuração de uma função do Lambda, revelando conhecimentos operacionais essenciais que existiam anteriormente apenas em documentação interna não descoberta.
"Foi capaz de fornecer a prova definitiva e identificou que o Lambda era a causa. A investigação teve métricas quase perfeitas que correspondiam ao que vimos no front-end." Ele acrescentou: "Ontem foi uma grande vitória. Se pudermos continuar acelerando a descoberta, não consigo descrever o quanto seria uma vitória para nossa organização." Com planos de aproveitar o recurso de habilidades do Agente de DevOps, a WGU está a caminho de reduzir ainda mais o tempo de investigação.
Angel Marchena, diretor de operações técnicas da Western Governors University
Zenchef
A Zenchef é uma plataforma de tecnologia que ajuda os restaurantes a gerenciar reservas, operações de mesa, menus digitais, pagamentos e marketing de clientes com base em um único sistema sem comissões. Com uma equipe de DevOps focada gerenciando vários ambientes de produção em diversas unidades de negócios, eles enfrentaram um teste real quando um problema de integração de API afetando um parceiro downstream surgiu durante um hackathon da empresa, com engenheiros envolvidos no evento e nada significativo aparecendo no monitoramento para dar a direção certa.
Em vez de retirar os engenheiros do hackathon, a equipe trouxe o problema para o Agente de DevOps. Ele resolveu o problema de forma sistemática, descartando a autenticação como um fator, mudando o foco da investigação para implantações do ECS e, por fim, rastreando a causa raiz de uma regressão de código na qual uma nova versão falhou em lidar com um valor de enumeração não reconhecido no banco de dados. A investigação completa foi concluída em 20 a 30 minutos, uma redução de aproximadamente 75% em comparação com as 1-2 horas que seriam necessárias manualmente, e as descobertas foram compartilhadas com o engenheiro responsável.
"Durante o hackathon, quase não tínhamos tempo disponível para investigar, e não precisamos disso. Estamos sempre tentando dar um passo à frente, e esse tipo de investigação proativa nem sempre é possível de outra forma. O Agente de DevOps está nos mostrando novas formas de entender como nossas plataformas se comportam."
Theo Massard, gerente de engenharia de plataforma, Zenchef
Recursos
Casos de uso
Resposta e resolução de incidentes
O AWS DevOps Agent faz a triagem autônoma de incidentes e orienta as equipes para uma resolução rápida. O AWS DevOps Agent se integra a ferramentas de observabilidade, repositórios de código e pipelines de CI/CD para correlacionar e analisar dados de telemetria, código e implantação, compartilhando suas hipóteses, observações e descobertas. Por meio de investigações sistemáticas, o AWS DevOps Agent identifica a causa raiz dos problemas decorrentes de alterações no sistema, anomalias de entrada, limites de recursos, falhas de componentes e problemas de dependência em todo o seu ambiente.
Coordenação automatizada de incidentes
Você pode iniciar e orientar investigações usando o chat interativo. O AWS DevOps Agent atua como membro da sua equipe de operações, trabalhando diretamente nas suas ferramentas de colaboração, como ServiceNow e Slack, para compartilhar descobertas e coordenar respostas. Quando necessário, crie um caso do AWS Support diretamente de uma investigação, fornecendo aos especialistas do AWS Support um contexto imediato para uma resolução mais rápida.
Previna futuros incidentes operacionais
O AWS DevOps Agent analisa padrões em incidentes históricos para fornecer recomendações acionáveis que fortalecem quatro áreas principais: observabilidade, otimização da infraestrutura, aprimoramento do pipeline de implantação e resiliência de aplicações.
Acelere o tratamento de tarefas de SRE sob demanda
Obtenha respostas imediatas e contextuais para questões operacionais sem precisar navegar entre consoles. Consulte a integridade dos recursos, investigue padrões de incidentes, acompanhe implantações e confira recomendações por meio de conversas naturais. Além das perguntas e respostas, crie, salve e compartilhe gráficos e relatórios personalizados, como resumos diários da integridade das operações ou tendências de erro 4xx. O histórico de conversas é mantido para que você possa se basear em consultas anteriores sem perder o contexto.
Próximas etapas
Você encontrou o que estava procurando hoje?
Informe-nos para que possamos melhorar a qualidade do conteúdo em nossas páginas