Blogcensus und die Daten
Die Blogosphäre zu vermessen, das ist nach eigenen Angaben das Ziel des Projekts unter www.blogcensus.de. Die Blogs sollen alle aktuelle, deutsche Weblogs sein. Dazu werden sie per Hand bzw. Auge begutachtet. Die plakative Aussage:
blogcensus kennt zur Zeit 132.054 deutschsprachige Blogs.
ist dabei scheinbar nur ein Augenfänger. In dem eigenen Blogposting vom 18.06. sagen die Betreiber, dass sie bislang über 10.000 Blogs angeschaut haben, “aber noch ziemlich weit davon entfernt sind, alle Blogs unter die Lupe genommen zu haben.” Also ist die obere Zahl eine Hochrechnung. Schade, dass das nicht dabei steht.
Sven wirft in den Kommentaren die Frage auf, woher die Daten kommen. Und bei der berechtigten Frage, wie denn die Stichprobe gezogen wird, ist nur zu lesen:
Warum sollen wir das veröffentlichen? Damit sich Trittbrettfahrer einklinken?
Jeder wissenschaftlich arbeitende Mensch weiß, dass die Art und Weise, wie die Stichprobe aus der Grundgesamtheit gezogen wird, zentral wichtig ist für die Aussagen, die aus den Daten heraus gemacht werden. Nimmt man eine falsche, verzerrte oder nicht repräsentative Stichprobe, dann sind die Aussagen die darauf gemacht werden auch nur (sehr) begrenzt aussagefähig.
Eine Vermutung zur Datenerhebung von Blogcensus sei hier gemacht. In einem Interview bei Politik-Digital.de sagt Jens Schröder: “Die 140.000 Blogs, die wir bei Blogcensus gefunden haben, sind Blogs, die seit dem Start des Projekts Anfang Mai aktualisiert wurden.” Es liegt nahe, dass die Betreiber die Technorati-API oder ähnliches nutzen, um die seit Mai aktualisierten Blogs bzw. deren Postings abzufragen.
Zum Stichwort Grundgesamtheit ist da übrigens auch noch die Unklarheit, was denn überhaupt ein Blog ist und was nicht. “Ob eine Website ein Blog ist, oder nicht, hängt nicht von technischen Gegebenheiten ab. Es gibt aber auch keine festen Regeln […]”.
Fazit:
Ich finde das Projekt Klasse, eine gute Idee. Allerdings befindet sich das Projekt meiner Meinung nach irgendwo in einer Grauzone zwischen Hobbyprogrammierung und Pseudowissenschaft. Was zumindest von wissenschaftlicher Seite einmal dringend benötigt würde, wäre eine methodisch fundierte und verlässliche Erhebung. Dass diese nicht trivial ist, weil die Grundgesamtheit aller deutschen Blogs einfach nicht zu erfassen ist, ist klar. Aber den Weg, den Blogcensus meiner Meinung nach mit der jetzigen, abschottenden Haltung geht, ist nicht förderlich. Schade.
No comments yet. Be the first.
Leave a reply