Drift logg |
![]() |
Ordforklaring på utrykken brukt i denne loggen. Vi har valgt å ha en åpen dialog med våre kunder om våre problemer. Da mangel på informasjon ofte er verre en problemene i seg selv. Alle vil ha noen problemer, spesielt med DDoS angrep, da det ikke fins noe forsvar mot et 20Gb/s DDoS angrep. Det er hvordan man behandler det som skiller. Vi mener det å informere om feilen og gi erstatning er bedre en å late som om ingen ting har hent, derfor har vi denne offentlig tilgjengelig loggen.
2003Juni22.06.03 Vi har byttet datasenter. Alle serverene våre ble i natt i all hast flyd til et nytt datasenter. De står nå på linje fra Global Crossing . Global Crossing er en tier 1 levrandør med det som antagelig er verdens største IP netverk, se her for kart. Komer tilbake med mere info om alt dette snart.
MaiApril04.04.03 Ingen nyheter er som regel gode nyheter! Ingen problemer på lenge nå. Ser ut som å bytte til Williams, og å droppe Cisco routerene var riktig.
MarsOppetid for Mars ble på 100%
FebruarOppetid for Februar ble på 100% 05.02.03 Etter en del testing har den nye GigE linjen fra Williams blitt aktivert. Subnettet våre servere står på har nå byttet over fra blandingen av Hurricane Electric og Internap levert av Digital WireWorks Inc, som vi brukte tidligere, til Williams. Dette gir oss raskere responstid fra Europa da nettet deres strekker seg helt til London. Videre håper vi dette vil gi oss bedre oppetid og færre problemer med DDoS angrep da Williams skall ha et mere stabilt nett en Digital WireWorks. Se kart over Williams nettverk her. Dette ble gjort uten noen nedetid.
JanuarOppetid for Januar ble på 99.98% 31.01.03 To nye Foundry BigIron core routere er installert. En som hoved og en backup skulle hoved routeren feile. I denne forbindelsen ble det også gjort en del andre forbedringer på router arkitekturen i data senteret. Ved å bruke Foundry i steden for Cisco brytes 100% Cisco policyen. Foundry BigIron har vist seg å ha høyere stabilitet, og bedre pris/ytelse en andre 4 genrasjons routere. Vi har også hatt en del stabilitet problemer med eksisterende Cisco routere (derfor de ble byttet ut nå), derfor ble det valgt å bryte 100% Cisco policyen. Dette førte til to korte nettverksbrudd på ca 5 min hver. 02.01.03 Feil med et kort i en Cisco router for en OC-48 linje hos PAIX i Palo Alto, California førte til høyt pakkatap, og lengere lastetid på sidene hostet på våre servere den 02.01.03. Selv om det var andre linjer operative klarte ikke disse å ta unna all trafikken da OC-48 linjen med sine 2.488 Gbps utgjør en så stor del av nettverket. Det er allerede bestilt en link til Equinix i San Jose som vil gjøre at vi har en alternativ link i framtiden skulle PAIX linken feile igjen. Heldigvis skjedde dette på natten Norsk tid slik at færrest mulig ble berørt. Dette er problemer forbundet med at datasenteret der vi har våre servere har vokst for raskt. Problemet er at fiberoptiske kabler må graves ned når de trekkes til et datasenter, både graving og å innhente de nødvendige tillatelser for å grave tar tid, slik at det kan være vanskelig å altid ha nok fiberkabler til å ta over skulle en få problemer. Problemet ble rettet kl 04:50 etter 2 timer og 28 minutter. Da dette
ikke førte til brudd, men bare litt lengere lastetid vil vi ikke
regne dette som nede tid i vår månedlig oversikt. 2002DesemberOppetid for November ble på 99.92% Kommentar om problemene i November og tidlig Desember: Vi hadde
en del problemer i november, men vi informerte om det og betalte tilbake
20% av alle hosting avgiftene til våre kunder. Siden det har vårt
datasenter satt i verk flere tiltak. Blant annet har man begynt blokkering
av enkelte porter (som IRC) på core router nivå, installert
to nye core routere og bestilt en ny GigE linje fra Williams som snart
vil være oppe. Noe som gjør at vi vil være mindre sårbare
for DDoS. 05.12.02 Et særdeles sofistikert DDoS angrep ble rettet mot wworks.net (Digital WireWorks Inc) som leverer Internett linjer til datasenteret hvor vi har våre servere. wworks.net ble truffet med mere en 20Gbps som tok ned regionale ruterene hos RCN, SBC, PAIX, Internap og deler av AT&T. Angrepet førte til at våre servere ble utilgjengelig i ca 35 minutter inntil DDoS trafikken ble null rutet. Som erstatning vil alle kunder berørt av dette få tilbakebetalt 10% av hosting avgiften for Desember.
NovemberOppetid for November ble på 99.6.%
OktoberOppetid for Oktober ble på 99.77.% 25.10.02 Datasenteret vi hoster i ble utsatt for et massivt Ddos
angrep i natt, dette førte til høyt pakketap og at noen
sider ble utilgjengelige i opptil 1 time og 23 min. Ddos trafikken ble
rutet om og alle systemer fungerer normal igjen fra kl 04.19.
Ordforklaring
|
Backbone
|
||||
|
|
||||
[Core router]
|
||||
/
|
\ | |||
[Fordelings switch]
|
[Fordelings switch]
|
|||
/
|
|
|
\ |
|
|
\ |
[Tilgang switch]
|
[Tilgang switch]
|
[Tilgang switch]
|
[Tilgang switch]
|
[Tilgang switch]
|
Core routerene er de routerene som er nermest Internett, de fordeler netverket ut til fordelingsswitchene som igjen fordeler til tilgangsswitchne som er de de individuelle serverene er koblet til.
Når data sendes over Internett deles det opp i mange små biter, kalt pakker. Ved feil kan det skje at ikke alle disse pakkene kommer fram, dett er pakketap. Det er mekanismer som skall fange opp at dette skjer og sende pakkene på nytt, men de nye pakkene kan også forsvinne.