Blog

Minuter senare – Amazons EC2 går ner

logo_awsVi hann inte mer än posta vår artikel om att Amazon är ett av de få företag i världen som kan stoltsera med att ha fler än 50000 servrar. Majoriteten, 40000, driver deras tjänst EC2.

Minuterna senare fick vi rapporter om att Amazon har haft rejäla  problem i helgen som gick. Vissa kunder har rapporterat om hela 19 timmars nertid. Bla har Web Host Industry Review skrivit en intressant artikel som beskriver mer i detalj vad ett antal användare har sagt och rapporterat in. Viktigt att påpeka är att detta är isolerade fall av nertid men uppenbarligen känsliga punkter för Amazons tjänst.

Här kan du läsa om företaget Bitbuckets frustration både via twitter kontot och bloggen där Jesper Nøhr beskriver mer i detalj både om vad som hände och dialogen med Amazon support. Uppenbarligen tog det tid för Amazon att gå med på att det faktiskt var problem med tjänsten. Det kan diskuteras om det faktiskt var Amazons fel. Det var i slutändan en DDoS attack som var isolerad. Jesper anser dock att det gick så pass lång tid med så mycket onaturlig trafik att något borde gjorts långt innan och framförallt – identifieringen av problemet borde gått snabbt. Detta kan vi hålla med om. 19 timmar nertid är extremt länge för en tjänst som denna. Dock tror vi inte någon tjänst är helt immun mot DDoS attacker. Man kan skydda sig mer eller mindre väl.

Intressant läsning och en realitetscheck för oss alla. Även med miljoner nerplöjda gäller det att ha koll på sitt nätverk. Amazon säger att de tar ytterligare steg för att förhindra liknande saker att ske igen.

Om du är intresserad av mer information kan du finna ytterligare en artikel här från The Register.

  • http://sulo.se/ Jonathan Sulo

    Det är värt att notera slutet på den detaljerade lägesrapporten hos Bitbucket:

    And to re-iterate, the problem wasn’t really Amazon EC2 or EBS, it was isolated to our case, due to the nature of the attack. All the UDP traffic was conveniently spoofed, so we can’t tell where it originated.

    Det var mao inget fel med Amazons tjänster.

  • http://sulo.se/ Jonathan Sulo

    Det är värt att notera slutet på den detaljerade lägesrapporten hos Bitbucket:

    And to re-iterate, the problem wasn’t really Amazon EC2 or EBS, it was isolated to our case, due to the nature of the attack. All the UDP traffic was conveniently spoofed, so we can’t tell where it originated.

    Det var mao inget fel med Amazons tjänster.

  • http://www.citynetwork.se johan

    Helt klart Jonathan. Som vi sa var detta isolerade fall och en DDoS attack vilket vem som helst kan få och egentligen inte någon helt skydda sig från. Vi hade en själva bara för ett par tre veckor sedan och tyvärr skapade nertid i någon halvtimme för vissa kunder. Utöver det verkar Amazon vara mycket snabba att komma igång med supporten – vilket ju är riktigt bra.

    Det som jag tror Jesper var extremt frustrerad med är 19 timmars nertid och kombinationen med visst motstånd att inse att något var fel. Kanske insåg man felet snabbare men kunde helt enkelt avvärja attacken?

    Få kommer säga att det inte är leverantörens fel när nästan ett dygn har gått – även om det var en attack. Lite extremt kan man kanske jämföra med att strömmen gick (heller inte leverantörens fel) – och man hade inte generatorer – är det driftspartners fel? Ja i mina ögon är det det då de borde ha detta. I Amazons fall tar jag faktiskt för givet att de hanterar en sådan här attack på klart kortare tid än 19 timmar. Det finns dock extrema fall där dessa attacker är enormt svåra. Kanske var detta ett sådant fall?

    Hur länge anser du det är “ok” att vara nere för att det sker en DDoS attack? Kan vi som leverantörer säga med god min att det var inte vårt fel hur länge som helst?

  • http://www.citynetwork.se johan

    Helt klart Jonathan. Som vi sa var detta isolerade fall och en DDoS attack vilket vem som helst kan få och egentligen inte någon helt skydda sig från. Vi hade en själva bara för ett par tre veckor sedan och tyvärr skapade nertid i någon halvtimme för vissa kunder. Utöver det verkar Amazon vara mycket snabba att komma igång med supporten – vilket ju är riktigt bra.

    Det som jag tror Jesper var extremt frustrerad med är 19 timmars nertid och kombinationen med visst motstånd att inse att något var fel. Kanske insåg man felet snabbare men kunde helt enkelt avvärja attacken?

    Få kommer säga att det inte är leverantörens fel när nästan ett dygn har gått – även om det var en attack. Lite extremt kan man kanske jämföra med att strömmen gick (heller inte leverantörens fel) – och man hade inte generatorer – är det driftspartners fel? Ja i mina ögon är det det då de borde ha detta. I Amazons fall tar jag faktiskt för givet att de hanterar en sådan här attack på klart kortare tid än 19 timmar. Det finns dock extrema fall där dessa attacker är enormt svåra. Kanske var detta ett sådant fall?

    Hur länge anser du det är “ok” att vara nere för att det sker en DDoS attack? Kan vi som leverantörer säga med god min att det var inte vårt fel hur länge som helst?

I samarbete med: Social Factory