Die Unstatistik April ist wieder einmal ein Korrelationskoeffizient – der zwischen dem weltweiten Bestand an Regenwald und dem Vorkommen von tiergetriebenen (von Tieren ausgehenden oder durch Tiere übertragenen) Infektionskrankheiten wie der aktuellen Corona-Pandemie. Dieser Korrelationskoeffizient ist negativ: je weniger Regenwald, desto mehr Infektionskrankheiten. So eine in deutschen und internationalen Medien vielzitierte Studie der französischen Biomediziner Serge Morand und Claire Lajaunie.
Die beiden Forscher hatten für 27 Jahre, von 1990 bis 2016, einen steten Rückgang der mit Regenwald bedeckten Erdoberfläche zusammen mit einem ebenso steten Anstieg von Infektionswellen an verschiedenen von Tieren ausgehenden Krankheiten konstatiert. Daraus wurde dann in einigen Medien ungeprüft und ohne weitere Indizien eine Kausalbeziehung hergeleitet. Beginnend im März, bis in den April hinein berichteten u.a. derstandard.de („Eindeutiger Befund: Abholzung fördert Ausbreitung von Infektionskrankheiten“), blick.ch („Waldrodung begünstigt Tierkrankheiten“) und tag24.de („Studie zeigt: Holzen wir weiter ab, wird es mehr Infektions-Krankheiten geben“).
Einige Berichte weisen auf die Notwendigkeit weiterer Studien zur Etablierung einer Kausalbeziehung hin, die meisten aber nicht. Eine solche Kausalbeziehung kann aus den Daten der zitierten Studie nicht abgeleitet werden (und wird von den Autoren auch nicht behauptet). Die möglichen negativen Effekte einer Abholzung von Regenwald auf Mensch und Umwelt wollen wir keinesfalls bestreiten. Allein die dadurch bewirkte Reduktion der Biodiversität ist für viele Missstände verantwortlich. Aber nicht alle Übel dieser Erde gehen auf den Rückgang des Regenwaldes zurück. Genauso könnte man beweisen, dass der verschwindende Regenwald für die Zunahme an Einbruchsdiebstählen in der Bundesrepublik oder die steigende Staatsverschuldung weltweit verantwortlich ist. Diese ungeprüften Rückschlüsse von Korrelation auf Kausalität gehören zu den häufigsten statistischen Fehlern überhaupt. So gibt es etwa bei Männern eine negative Korrelation zwischen dem Einkommen und der Anzahl der Haare auf dem Kopf: je weniger Haare, desto mehr Geld. Diese Korrelation entsteht dadurch, dass bei Männern im allgemeinen mit wachsendem Alter die Haare ausfallen und das Einkommen steigt.
Zeitreihen können unabhängig voneinander in die gleiche Richtung laufen
Der häufigste Grund für solche Nonsens-Korrelationen sind gemeinsame Trends: Zwei Zeitreihen, die ganz gleich aus welchen Gründen in die gleiche Richtung gehen, sind immer automatisch hoch positiv korreliert. So gibt es etwa in Deutschland eine perfekte Korrelation zwischen den Apfelsinenimporten aus Portugal und den Belegungszahlen der bundesdeutschen Trinkerheilanstalten. Beide Zeitreihen sind seit dem Zweiten Weltkrieg angestiegen. Deshalb käme aber niemand auf die Idee, nun Apfelsinen aus Portugal zu verbieten. Genauso sind zwei Zeitreihen mit entgegengesetzten Trends immer automatisch hoch negativ korreliert, wie hier die Fläche an Regenwald und die Infektionsinzidenz.
Die Statistik kennt durchaus Verfahren, zwischen Korrelationen und Kausalitäten zu unterscheiden. In der Studie von Morand und Lajaunie sucht man diese allerdings vergebens.
Mit der „Unstatistik des Monats“ hinterfragen der Berliner Psychologe Gerd Gigerenzer, der Dortmunder Statistiker Walter Krämer, die STAT-UP-Gründerin Katharina Schüller und RWI-Vizepräsident Thomas K. Bauer jeden Monat sowohl jüngst publizierte Zahlen als auch deren Interpretationen. Alle „Unstatistiken“ finden Sie im Internet unter www.unstatistik.de und unter dem Twitter-Account @unstatistik.
Unstatistik-Autorin Katharina Schüller ist zudem Mit-Initiatorin der „Data Literacy Charta“, die sich für eine umfassende Vermittlung von Datenkompetenzen einsetzt. Die Charta ist unter www.data-literacy-charta.de abrufbar.