Archief voor June 29th, 2005

Hits-mysterie ontrafeld

User agents

Ik zit al enkele maanden met gigantisch veel hits op mijne site. Ik heb ne kalender gemaakt voor de mensen uit mijn jaar op school zodat ze die in deftig formaat kunnen raadplegen (.ics). Nu moet ge weten dat de lessen al MAANDEN gedaan zijn en dat die files ook al MAANDEN van mijn webspace verdwenen zijn. Toch krijg ik gigantisch veel hits op die files (zoals ge op onderstaande screenshot kunt zien). Al wa ge ziet is whacker, behalve de 2 middenste lijntjes, da is den bavo.

Evolution spamt mijne site

Dankzij mijn host ben ik aan de logfiles van mijn website geraakt (iets da ze standaard ni prijsgeven). Nu blijkt da de mannen da mijnen host quasi DOS‘en niemand anders zijn dan bavo en whacker, aka dumb and dumber (niet noodzakelijk in die volgorde :p). Zoals ge op de screenshot (ik weet het, “het” shot, ma da klinkt ni) refresht bavo met zijnen Evolution de kalenders (die nota bene al MAANDEN WEG ZIJN!) om de 30 minuten. Aanvaardbaar. Hij volgt 2 (ex-)kalenders en zorgt dus voor:

  • 4 hits per uur
  • 96 hits per dag
  • 2976 hits per maand

De whacker, da is een ander verhaal. Dienen billie heeft er ni beter op gevonden dan de 2 kalenders die hij volgt om de 20 seconden te refreshen. Ne kalender die nota bene ooit misschien ene keer ging aangepast worden, ni elke seconde. De whacker zorgt dus voor:

  • 6 hits per minuut
  • 360 hits per uur
  • 8640 hits per dag
  • 267840 hits per maand

En dan de joke van de dag:

Wa hebde gij daar nu last van…

total sites

Hier een kleine som voor de mensen die nu nog altijd aan ‘t lezen zijn. Enkel voor de whacker dees maand: 185673 KBytes, ofte 185 meg aan 404’s, enkel berekend op da klein stukske stats. Het is dus eigenlijk nog nen hoop meer. Sterk.

Bijna 40% van mijn hits komen van dumb en dumber, met hunnen Evolution. Ge moet het maar doen.

Wilde ullen boecht afzetten? That would be swell.

[UPDATE]
Heb rap een perl-scriptje geschreven en daaruit blijkt da whacker enkel deze maand 308590734 bytes verzet heeft (308 meg), ENKEL met zijnen evolution en op die kalenders. Enkel aan 404’s dus :)

Hier is voor de perl-liefhebbers trouwens de regex waarmee ik de apache log-lijn parse:

my ($host, $date, $method, $url, $mode, $returncode, $size, $referrer, $agent) =
$line =~ /^(\S+) - - \[(\S+ \+\d{4})\] "(\S+) (\S+) ([^"]+)" (\d{3}) (\d+|-) "(.*?)" "([^"]+)"$/;

Feel free om ze te rippen, is handig als ge door de logs wilt parsen zonder moeite.
[/UPDATE]

7 commentaren June 29th, 2005


Kalender

June 2005
M T W T F S S
« May   Jul »
 12345
6789101112
13141516171819
20212223242526
27282930  

Posts per Maand

Posts per Categorie