Was wäre ein Sonntag ohne ein wenig Statistik.. ;-)
In den Kommentaren zum Beitrag über die ARD/ZDF-Onlinestudie sind Fragen zur Stichprobengröße aufgekommen, auch im Vergleich zum TNS-(N)Onlineratlas. Hier mal ein paar Rechnungen zu den Stichproben ((Hoffentlich haben sich keine Fehler eingeschlichen – ich bin kein ‚Hardcore-Statistiker’…)):
- ARD/ZDF und TNS-(N)Onliner machen beide Angaben über die deutsche Bevölkerung ab 14 Jahren. TNS nennt explizit die „deutsche Bev. ab 14 mit Festnetztelefon“, das sind 64,8 Mio. Dieser Wert kommt auch raus, wenn man die ARD/ZDF-Werte entsprechend umrechnet. Ich geh im Folgenden also davon als Grundgesamtheit aus.
- ARD/ZDF treffen Aussagen auf der Grundlage von 2574 Befragten, davon 1802 kompletten Interviews (siehe van Eimeren/Frees, S. 331). Das macht einen ‚margin of error‘ von +/- 1,93 bzw 2,31 Prozent. ((Bei 95% Irrtumswahrscheinlichkeit. Anders gesagt: Wenn man die Befragung oft genug wiederholt, liegen in 95% aller Fälle die ermittelten Werte innerhalb von +/- 2,31 Prozent um den wahren Wert. Kann man auf dieser Seite auch selbst berechnen.)
- TNS trifft die Aussage auf Grundlage von 52.500 Befragten (die Studie sagt nicht, ob das die Angerufenen, oder die komplettierten Interviews sind). Das macht eine margin of error von +/- 0,43. Falls die 52.500 nur die angerufenen Personen sind und auch hier ca. 30% abgesprungen wären (wie bei ARD/ZDF), hätte man eine komplett befragte Stichprobe von 36750, und einen margin of error von +/- 0,51.
Das gesagte gilt für die Hochrechnungen auf die Grundgesamtheit aller ab 14jährigen. Wie sieht es mit den Hochrechnungen für die Internet-Nutzer aus?
- Der Anteil der zumindest gelegentlichen Nutzer ist bei beiden Studien in etwa gleich hoch: 65,8% vs. 65,1%, das sind etwa 42,5 Mio Menschen.
ARD/ZDF hat hier 1186 Befragte, der margin of error ist +/- 2,85.
TNS müsste 34100 Onliner unter ihren Befragten gehabt haben, das ergibt einen margin of error von +/- 0.53.
Das heißt: Zumindest aus den verfügbaren Infos zum jeweiligen Vorgehen lässt sich schließen, dass die TNS-Studie geringere statistische Fehlermargen hat. Die ARD/ZDF-Studie deshalb „nur für qualitative Aussagen“ zu verwenden oder komplett zu verwerfen, halte ich allerdings für eine Fehleinschätzung – wenn die Stichprobenziehung keine systematischen Fehler produziert, sondern zufällig geschieht, kann und sollte man die Ergebnisse durchaus als Annäherung an die tatsächlichen Verteilungen in der deutschen Bevölkerung sehen. Man muss halt das bei Hochrechnungen immer vorhandene „Schwankungsfenster“ mit berücksichtigen.
Having said all that: Viel entscheidender für möglicherweise abweichende Werte für Nutzer bestimmter Dienste halte ich konkrete Frageformulierungen – die leider in der Regel nicht offen gelegt werden. Ein Beispiel: Bei komplett identischen Stichproben würde es vermutlich einen großen Unterschied machen, ob ich frage: „Führen Sie selbst ein Weblog?“ oder „Führen Sie selbst ein Weblog, zum Beispiel auf Seiten wie mySpace, LiveJournal oder myblog.de?“. Im zweiten Fall dürften die ermittelten Anteile deutlich höher sein, weil hier auch Befragte zu den Blognutzern „gemacht“ werden, die sich bei der allgemeinen Frage evtl. nicht als Blogger verstehen würden. Eigentlich müsste man also, um Werte unterschiedlicher Umfragen vergleichen zu können, neben der jeweiligen Stichprobengröße und -ziehung auch die Frageformulierungen kennen…
Hi jan,
würdest du nach wie vor davon ausgehen, dass die Anzahl der deutschen Blogs bei ca. 1,4 liegt bzw. aktiven Blogs bei 400.000 bis 500.000, wie du auf Bamblog mal geschrieben hast? Oder muss diese Zahl jetzt eher runterkorrigiert werden?
Die ARD/ZDF-Studie sagt ja anscheinend nur etwas über die Weblog-Nutzung aus, nicht direkt über das Betreiben von Weblogs. Aber der Trend könnte dennoch nach unten zeigen.
@Fabian: Gute Frage.. :) Ich bin grad in Eile, vielleicht schreib ich nachher nochmal was ausführlicher dazu – auch hier stellt sich das Problem nach dem Verständnis von „Blog“. Im engeren Sinn (stand-alone und explizite „Blog-Hoster“) verstanden, sind es wohl weniger; im weiteren Sinn (s.o.) sind es wohl mehr.
No worries. Eilt ja nicht.
Vielleicht kannst du aber noch einmal erläutern, was für dich Blogs im weiteren Sinne sind?
Ich mein, sicherlich gibt es Unterschiede in der Fragestellung ob sich jemand als Blog-Betreiber wiedererkennt oder nicht, aber selbst wenn sich jemand gar nicht als Blogger versteht, betreibt er doch einen Blog (also ein Webseite mit umgekehrt chronologischen Beiträgen). Wieso braucht man insofern eine Unterscheidung von Blogs im engeren und im weiteren Sinn? Geht es nicht vielmehr um genaue oder ungenauere Erfassung?
wollte nur kurz anmerken, dass der link zur americanresearchgroup ins nirwana führt.
@Peter: Danke, da hatte sich noch ein Klammerzeichen eingeschlichen – ist korrigiert.
@Fabian: Das „Blog im weiteren Sinn“ in meiner Antwort sollte keine exakte Kategorie sein. Ich hab mich damit auf Angebote bezogen, bei denen Nutzer Beiträge schreiben und von anderen kommentieren lassen können, dies aber nicht unbedingt im Mittelpunkt der Aktivitäten steht und evtl. auch nicht als „Blog“ gekennzeichnet ist. Myspace wäre so ein Beispiel – da heißt die entsprechende Funktion zwar auch Blog, aber in der Wahrnehmung der Nutzer ist myspace möglicherweise eine „Community“ o.ä.; sie würden also eine ungestützte Frage nach „Nutzt Du Blogs?“ vielleicht gar nicht mit „ja“ beantworten.
mehr zum „margin of error“ auch hier:
http://www.raosoft.com/samplesize.html