top of page
bg_topo.jpg
Banner 1920x240.png

Falha da Amazon derruba mais de 500 apps; especialistas analisam o caso

  • Foto do escritor: Fabio Sanches
    Fabio Sanches
  • 20 de out.
  • 7 min de leitura
AWS: nuvem da Amazon tem instabilidade e afeta sites pelo mundo inteiro. Imagem: Shutterstock
AWS: nuvem da Amazon tem instabilidade e afeta sites pelo mundo inteiro. Imagem: Shutterstock

Instabilidade em data center nos EUA afeta aplicativos como Mercado Livre, Roblox, Duolingo, Canva e outras centenas de plataformas; especialistas comentam motivo e monopólio no Mercado de Nuvem


Uma falha crítica no sistema da Amazon Web Services (AWS) provoca instabilidade global nesta segunda-feira (20). Com isso, mais de 500 aplicativos e plataformas online apresentaram erros simultaneamente. A pane, que já dura aproximadamente 10 horas, impactou serviços populares como Mercado Livre, Roblox, Duolingo, Canva, Fortnite e diversas outras aplicações que dependem da infraestrutura em nuvem da Amazon. Pesquisas no Google Trends, como "aws fora do ar", "telefone do picpay", "picpay não funciona", "olx fora do ar" e mais estão com aumento repentino devido à falha. Veja a seguir mais detalhes sobre o pane.


O que causou a falha na AWS?


De acordo com comunicado oficial da Amazon, o problema teve origem em um data center localizado na Virgínia do Norte (US-EAST-1), nos Estados Unidos, uma das regiões mais importantes da infraestrutura global da companhia. A empresa identificou que a falha estava relacionada a problemas na resolução de DNS do endpoint da API do DynamoDB na região US-EAST-1. Em termos práticos, isso significa que os serviços não conseguiam se comunicar adequadamente com os bancos de dados hospedados na nuvem da Amazon.


Eduardo Freire, estrategista de inovação e CEO da FWK, explica que isso acontece porque concentramos muita coisa no mesmo ‘hub’ e ele não foi desenhado para a carga e a complexidade atuais. O especialista também destaca que isso não acontece do nada e vem sendo anunciado por alguns fatores: "Primeiro, a explosão de demanda com IA, streaming, autenticação e inferência em tempo real, tudo isso cresceu muito e pressiona redes, filas e DNS. Segundo, a geopolítica e as regras de soberania de dados por país aumentam a complexidade operacional, deixando menos margem de manobra quando algo falha. E terceiro, o legado tecnológico: tanto na nuvem quanto nas telecomunicações existem sistemas antigos, difíceis e caros de substituir, criando pontos de estrangulamento". Em termos simples, nossa infraestrutura digital virou uma cadeia interdependente. Com isso, se um nó central degrada, o efeito se espalha em cascata e gera quedas generalizadas.


Falha da Amazon derruba mais de 500 apps simultaneamente; entenda ocorrido — Foto: Distribuição: Bloomberg
Falha da Amazon derruba mais de 500 apps simultaneamente; entenda ocorrido — Foto: Distribuição: Bloomberg

Igor Lucena, economista e Doutor em Relações Internacionais também explica que o apagão cibernético ocorre quando a cadeia de infraestrutura é desabilitada, e isso pode envolver não apenas os data centers, mas também os sistemas de controle de energia, os cabos submarinos e todos os equipamentos periféricos que fazem com que todo um sistema tecnológico funcione.


"Já vimos isso acontecer de diversas maneiras no mundo, paralisando servidores, pontos de venda (os POS, Points of Sale), computadores, entre outros. O sistema cibernético depende de um conjunto de elementos físicos, servidores, energia, sistemas elétricos e a própria rede de Internet, e, por isso, não se trata de algo “falho”, mas sim de um ecossistema sujeito a riscos. Um apagão pode ocorrer quando um ou mais desses elementos estão desalinhados ou sofrem algum problema técnico, seja causado por desastres naturais, como terremotos ou tufões, seja por situações provocadas, como os ataques cibernéticos (cyber warfare)", explica Lucena.


Centenas de aplicativos ficam fora do ar por erro na nuvem da Amazon; entenda — Foto: Reprodução: X (antigo Twitter)
Centenas de aplicativos ficam fora do ar por erro na nuvem da Amazon; entenda — Foto: Reprodução: X (antigo Twitter)

Principais aplicativos afetados pela pane da AWS


A lista de plataformas impactadas pela falha da Amazon inclui:



Segundo o site de monitoramento Downdetector, os primeiros relatos de instabilidade começaram a ser registrados por volta das 05h40 (horário de Brasília). Como alguns serviços continuam com erro ou fora do ar, o site segue com o aviso, às 10h, de que: "Relatórios de usuários indicam problemas na Amazon Web Services (AWS) na região US-East-1. Esses problemas estão afetando diversos serviços que dependem da infraestrutura da AWS. Estamos monitorando a situação: verifique o site Downdetector local para obter as atualizações mais recentes".


Além disso, é possível acompanhar mais informações sobre o status dos serviços da AWS em tempo real no site "https://health.aws.amazon.com/health/status" (sem as aspas). Em comunicado posterior, a Amazon explicou que as correções aplicadas estavam progredindo. Já às 15h:30 (horário de Brasília), a empresa informou que conseguiu resolver o problema que impedia a criação de novos servidores virtuais (instâncias EC2) no data center da Virgínia, e também afirmou que os problemas de conectividade de rede na região diminuíram significativamente. Além disso, disse que as funções automáticas dos aplicativos (Lambda), responsáveis por executar tarefas como processar pedidos e enviar notificações, voltaram a funcionar normalmente. Contudo, alguns usuários continuam experimentando respostas lentas durante o período de estabilização.


Como os usuários são impactados


No Brasil, usuários do Mercado Livre relataram que o aplicativo chegava a abrir, mas exibia mensagens de erro ao tentar realizar buscas ou completar transações. A assistente virtual Alexa apresentou um comportamento peculiar: os comandos eram reconhecidos pelas luzes do dispositivo, mas não havia resposta de voz.


Já o Duolingo manteve as lições funcionando parcialmente, porém os usuários ficaram sem acesso ao ranking de ligas. Já plataformas como Canva e Prime Video apresentaram lentidão significativa e falhas no carregamento de conteúdo. Veja abaixo alguns relatos no X (antigo Twitter) sobre as várias instabilidades.


Quanto tempo ainda dura a instabilidade?


A Amazon reconheceu uma "interrupção operacional" afetando "múltiplos serviços" e informou que estava trabalhando em "caminhos paralelos para acelerar a recuperação". Por volta das 6h27, a empresa divulgou atualização indicando "sinais significativos de recuperação", embora ainda houvesse acúmulo de solicitações em fila.


Às 15h30, ainda é possível encontrar relatos de erros nas redes sociais em diversas línguas e observar sites e aplicativos fora do ar no Downdetector. Por isso, pode-se dizer que o serviço da Amazon está fora do ar há cerca de dez horas.


É possível evitar que essas quedas generalizadas ocorram?


O economista e Doutor em Relações Internacionais, Igor Lucena, explica que, hoje, o ciberespaço e a tecnologia são vistos como elementos fundamentais para a segurança dos países. "Nações hostis têm, de fato, destruído cabos submarinos, além de realizarem ataques hackers a servidores e tentado desestabilizar sistemas eletrônicos. O AWS, por exemplo, pelo seu tamanho e pela quantidade de produtos e serviços, públicos e privados, que rodam nele, é considerado uma infraestrutura essencial, principalmente pelo governo norte-americano. Por isso, o risco de ciberataques e tentativas de desestabilizar esse tipo de infraestrutura é cada vez maior", conta.


O especialista também traz o seu ponto de vista sobre a resolução do problema. Para ele, não é algo simples evitar esse tipo de ocorrido:

"Em primeiro lugar, é preciso um constante avanço tecnológico e informacional, ou seja, investimentos recorrentes. No Brasil, por exemplo, já vimos críticas em relação ao Pix, com preocupações sobre a falta de investimentos suficientes em sua manutenção e cibersegurança. Outro ponto fundamental é a redundância: servidores interligados entre si, funcionando de forma que um seja redundante ao outro. Assim, quando uma rede cai, outra entra em funcionamento, idealmente, de forma independente. Quando há um conjunto robusto de protocolos e sistemas redundantes, o risco diminui, mas nunca é eliminado", explica.

Para o economista, esses fenômenos podem ocorrer novamente e o essencial é ter capacidade de mitigá-los.

"A questão é: como aprender com os erros e problemas de hoje para que eles não se repitam no futuro. Basicamente, o desenvolvimento da Internet e do ciberespaço é construído sobre essa lógica: aprender, corrigir e evoluir continuamente", afirma.

O poder (e o risco) da AWS no Mercado de Nuvem


A Amazon Web Services é a maior provedora de computação em nuvem do mundo, detendo aproximadamente 30% de participação no mercado global de infraestrutura em nuvem, com mais de quatro milhões de clientes.


A AWS funciona alugando poder de processamento, armazenamento de dados e ferramentas tecnológicas para empresas, governos e plataformas online em todo o mundo. Isso permite que essas organizações operem seus sites e aplicativos sem precisar manter servidores próprios. Justamente por sustentar uma parcela tão significativa da internet global, qualquer interrupção nos serviços da AWS gera efeitos em cadeia que impactam milhões de usuários simultaneamente.


Raphael Farinazzo, COO da PM3, referência em produtos digitais no Brasil, explica que a escala de serviços de computação em nuvem permite que aplicações consigam servir o mundo inteiro a um custo muito mais baixo do que se tivessem que subir uma infraestrutura própria. "Muitos negócios não existiriam ou não teriam alcance global sem serviços como da AWS, Google ou Microsoft, porque não seriam economicamente viáveis", afirma.


Contudo, com essa concentração cria-se uma dependência estrutural. Dessa forma, quando algo falha, o impacto se propaga em cadeia, derrubando parte significativa de serviços da Internet. "Ok, essas aplicações talvez nem existissem se não fosse a AWS, mas agora que elas existem, movimentam a economia e muita gente depende delas. Então, quando saem do ar, é sempre traumático. Em última análise, o domínio de dois ou três competidores principais é benéfico, mas as aplicações precisam trabalhar com maneiras de evitar grandes perdas em caso de falhas como essas", completa Farinazzo.


Apagão cibernético da CrowdStrike gerou caos no serviço de avião dos Estados Unidos — Foto: Flightradar24/Divulgação
Apagão cibernético da CrowdStrike gerou caos no serviço de avião dos Estados Unidos — Foto: Flightradar24/Divulgação

Precedentes de falhas em grandes provedores


Este não é um caso isolado no setor de tecnologia. A interconexão dos sistemas tecnológicos modernos faz com que problemas em uma única empresa possam causar impactos catastróficos na economia global.


Em 2024, uma atualização defeituosa de software na empresa de cibersegurança CrowdStrike Holdings provocou o cancelamento de voos e quedas de sistemas em todo o mundo, causando prejuízos estimados em bilhões de dólares.


Como se proteger de futuras instabilidades


Embora a maioria das falhas em grandes sistemas de tecnologia seja resolvida rapidamente, especialistas recomendam que empresas considerem estratégias de redundância e múltiplos provedores de nuvem para minimizar o impacto de interrupções futuras.


Para usuários comuns, manter aplicativos atualizados e ter alternativas offline para tarefas críticas pode ajudar a amenizar os transtornos causados por panes desse tipo.


Fonte: techtudo

Comentários


bottom of page
google-site-verification: google4a972b81c6e55585.html