Amazon EKS

Conceitos básicos do Amazon EKS

Escolha seu próprio percurso

O Amazon EKS é um serviço do Kubernetes totalmente gerenciado que facilita a execução de contêineres em grande escala na AWS. Esteja você se modernizando com microsserviços, executando workloads de machine learning em grande escala ou criando com tecnologias emergentes, como IA generativa, o Amazon EKS ajuda os clientes a executar suas aplicações em contêineres de missão crítica, ao mesmo tempo em que reduz a sobrecarga operacional e acelera a inovação. Escolha seu percurso para saber como o EKS pode ajudar você a operar com eficiência ambientes do Kubernetes de nível de produção e siga as etapas selecionadas para começar com seu caso de uso específico.

Percurso 1-0: IA agêntica
1
Percurso 1-1: implantação de agentes
4
Percurso 1-2: operações de agentes para o Amazon EKS
4
Percurso 2-0: IA generativa
1
Percurso 2-1: implantação e inferência de modelos
4
Percurso 3-0: nenhum caso de uso em mente?
4

Percurso 1-0: IA agêntica

Abrir tudo

O Amazon EKS permite duas abordagens distintas para a IA agêntica. Primeiro, você pode implantar e escalar agentes autônomos como aplicações em contêineres, oferecendo controle sobre a infraestrutura de seus agentes. Segundo, você pode otimizar as operações e o desenvolvimento de aplicações do Kubernetes para permitir que agentes e assistentes de IA simplifiquem as operações e solucionem problemas por meio de interações em linguagem natural usando o Agent2Agent Protocol (A2A) e o protocolo de contexto para modelos (MCP). Esse percurso orienta você nas duas abordagens: implantação de agentes no Amazon EKS e uso de IA agêntica para aprimorar a experiência dos desenvolvedores e operadores do Amazon EKS.

Percurso 1-1: implantação de agentes

Abrir tudo

Implante e escale agentes de IA autônomos no Amazon EKS usando o SDK de código aberto do Strands Agents ou seu framework de agentes de preferência. Essa abordagem oferece controle total sobre a infraestrutura de agentes, permitindo que você use qualquer modelo e personalize sua implementação. O EKS fornece recursos de nível de produção para executar agentes de IA conteinerizados com alta disponibilidade e escalabilidade.

Confira os fundamentos da criação e implantação de agentes de IA no EKS. Saiba mais sobre o SDK do Strands Agents e como ele simplifica o desenvolvimento de agentes, ou aplique esses conceitos ao seu framework de preferência. Estude um exemplo real de previsão do tempo para entender como um agente simples pode se integrar a APIs externas, lidar com respostas de streaming e processar consultas em linguagem natural. Este exemplo demonstra os principais conceitos, como prompts do sistema, integração de ferramentas e fluxos de trabalho de APIs, de que você precisará ao implantar agentes no EKS.

Siga nosso guia detalhado para implantar agentes do SDK do Strands Agents no Amazon EKS. Comece aprendendo a conteinerizar seu agente, a configurar endpoints FastAPI, a implementar respostas de streaming e a empacotar sua aplicação usando o Docker. Use nosso projeto de exemplo para entender conceitos essenciais, como configuração do Modo Automático do EKS, implantações do Helm e testes básicos. Embora este guia use o SDK do Strands, os princípios se aplicam à implantação de qualquer agente conteinerizado no EKS.

Aprenda a escalar e operar suas implantações de agentes de forma confiável na produção. Implemente ajuste de escala automático para lidar com diversas workloads, obtenha alta disponibilidade por meio de configurações de backup e failover e configure um monitoramento abrangente usando o CloudWatch Container Insights. Siga nosso Guia de práticas recomendadas do EKS para executar workloads de IA/ML para garantir que a infraestrutura de seu agente seja segura e observável. Participe do nosso workshop individualizado de IA agêntica no EKS para obter orientação passo a passo para implantar agentes de IA em grande escala.

Percurso 1-2: operações de agentes para o Amazon EKS

Abrir tudo

Transforme suas operações do Kubernetes fornecendo aos assistentes de codificação de IA ferramentas e recursos em tempo real por meio do servidor MCP do Amazon EKS. Isso possibilita que os agentes de IA interajam diretamente com seus clusters do EKS, com orientação contextual e automação por meio de interações em linguagem natural. Da criação do cluster à solução de problemas, esses agentes de IA ajudam a otimizar suas operações do Kubernetes, mantendo as práticas recomendadas da AWS.

Saiba como os diferentes servidores MCP da AWS facilitam a interação entre os modelos de IA e os serviços e recursos da AWS. Confira o Guia do servidor MCP do EKS para entender como os agentes de IA podem ajudar a automatizar tarefas operacionais comuns, desde o gerenciamento de clusters até a solução de problemas. Defina seu ambiente de desenvolvimento para configurar assistentes de IA, como o Cline ou a CLI do Amazon Q Developer com a integração do servidor MCP do EKS.

Siga nosso guia detalhado para otimizar as operações do Kubernetes com o servidor MCP do Amazon EKS. Saiba como usar comandos de linguagem natural para conteinerizar e implantar aplicações no EKS. Confira esta demonstração para saber mais sobre como os agentes de IA podem ajudar a gerar manifestos do Kubernetes, a gerenciar recursos de clusters e a automatizar fluxos de trabalho de implantação usando as ferramentas do servidor MCP do EKS.

Siga nosso passo a passo de solução de problemas assistida por IA com o servidor MCP do Amazon EKS para ver como os agentes de IA podem ajudar a monitorar a integridade das aplicações e resolver problemas comuns. Por meio de exemplos práticos de depuração de falhas de pod e problemas de infraestrutura, aprenda a usar consultas de linguagem natural para verificar as métricas do CloudWatch, analisar logs e diagnosticar problemas. Este guia prático demonstra como a assistência de IA pode ajudar você a aproveitar o Amazon CloudWatch e outros serviços da AWS para manter aplicações íntegras no EKS.

Percurso 2-0: IA generativa

Abrir tudo

O cenário de IA generativa está evoluindo rapidamente, com organizações criando, implantando e escalando diversas workloads de IA/ML para casos de uso que vão desde treinamento de modelos distribuídos, ajustes finos e implantações de inferência em grande escala. Clientes como a Anthropic e a Adobe estão escolhendo o Amazon EKS para obter controle refinado sobre os recursos de computação e, ao mesmo tempo, manter a eficiência operacional. Confira este guia para obter uma visão geral sobre por que os clientes escolhem o EKS para IA/ML para casos de uso comuns, como treinamento e implantação de modelos, geração aumentada via recuperação (RAG) e inferência.

Percurso 2-1: implantação e inferência de modelos

Abrir tudo

O Amazon EKS permite implantações de inferência de nível de produção com suporte para otimização de GPU, fornecimento de vários modelos e ajuste de escala automático. As organizações podem aproveitar sua experiência e práticas operacionais existentes no EKS para implantar e gerenciar rapidamente workloads de inferência junto com outras aplicações. Por meio da integração com ferramentas de código aberto e da variedade de aceleradores na AWS, empresas como a Vannevar Labs e a Omi alcançaram significativas reduções de custos e melhorias de desempenho, mantendo a consistência operacional em toda a infraestrutura.

Aprenda os fundamentos da infraestrutura e da arquitetura para implantar workloads de inferência no EKS neste guia de soluções que aborda os principais tópicos, como suporte a GPU, padrões de serviço de modelos e otimização de recursos. Confira a IA de código aberto no projeto EKS, que fornece esquemas prontos para implantação, como a configuração de um serviço de inferência de LLM escalável com modelos de infraestrutura como código para implantação em produção.

Comece com nosso Guia de configuração de clusters de práticas recomendadas para inferência em tempo real para criar um cluster do EKS otimizado para workloads de inferência de produção. Implante modelos usando nossa IA pronta para produção em gráficos de inferência do EKS, que fornecem charts do Helm e modelos de infraestrutura como código para frameworks conhecidos, como vLLM e NVIDIA Triton. Para workloads tradicionais de ML, confira o guia do desenvolvedor de contêineres de deep learning da AWS para inferência baseada em CPU e GPU para ver os padrões de implantação.

Acompanhe nossos workshops práticos para implantar workloads de inferência no EKS usando o acelerador de sua escolha: o workshop baseado na NVIDIA para inferência baseada em GPU e o workshop baseado no AWS Neuron usando aceleradores Inferentia e Trainium. Ambos os workshops abrangem tarefas essenciais, como configuração de plug-ins de dispositivos, gerenciamento de recursos e monitoramento. Consulte o abrangente Guia de práticas recomendadas do EKS para workloads de IA/ML para garantir que suas implantações de inferência sigam padrões comprovados de computação, rede, armazenamento e observabilidade. Esses guias servem como referências contínuas à medida que você opera e desenvolve sua arquitetura de inferência no EKS.

Percurso 3-0: nenhum caso de uso em mente?

Abrir tudo

Está iniciando no Amazon EKS? Siga as etapas desse percurso e configure seu primeiro cluster do Kubernetes em apenas alguns minutos.

Saiba como o Amazon EKS funciona por meio da série de vídeos Containers from the Couch e do canal Containers Blog.

Saiba como implantar workloads e complementos no Amazon EKS com exemplos de implantações no Linux e no Windows.

Principais conceitos

O que é um contêiner?

O que é o Kubernetes?

Implantações e pods do Kubernetes

Explicação dos esquemas do EKS para Terraform

Amazon EKS Anywhere vs. EKS no AWS Outposts

Recursos

Orientação

Implante uma aplicação do Kubernetes com o Amazon EKS

Configure o cluster do Kubernetes gerenciado pelo Amazon EKS e implante uma amostra de aplicação. Amazon EKS, EC2, Elastic Load Balancing e kubectl

Comece a criar

Workshop

Conclua o workshop sobre microsserviços do Amazon EKS

Transite de um novo cluster para uma malha de serviços neste workshop interativo e imersivo sobre o Amazon EKS. Amazon EKS, EC2, VPC, ALB e muito mais

Comece a criar

Documentação