Unstatistik des Monats: Zahlen zur Corona-Warn-App

Eine statistische Zahl hat in den vergangenen Tagen zu vielen Diskussionen geführt: die 60 Prozent Nutzer, die die Corona-Warn-App angeblich benötigt, damit sie zur Eindämmung der Pandemie wirksam beitragen kann. Diese Zahl stammt aus einer Simulations-Studie von Forschern der Universität Oxford, die mögliche Entwicklungen der Pandemie mit einem komplexen mathematischen Modell zur Verbreitung von Corona abschätzt. Vor dem Start der App galt diese Zahl als harte, von Experten errechnete Schwelle. Passenderweise erklärten sich in verschiedenen Umfragen, etwa vom NDR oder vom Nürnberg Institut für Marktentscheidungen (NIM), 60 bis 70 Prozent der Befragten bereit, die App zu installieren.

Eine Woche später haben rund 12 Millionen, also 15 Prozent der Deutschen die App heruntergeladen. Werden wir nun den Kampf gegen Corona verlieren, weil wir nicht bereit sind, unsere Handys dafür zur Verfügung zu stellen? Nein, lesen wir in zahlreichen Medien, die 60 Prozent seien ein Mythos, nur gültig, wenn wir Corona komplett ausrotten wollen und dafür auf alle anderen Vorsichtsmaßnahmen verzichten. Wirken würden schon 15 Prozent, schreibt der „Stern“.

„Gültig, wenn“. Diese zwei kleinen Worte machen deutlich, dass wir viel weniger wissen, als es den Anschein erweckt. Wir befinden uns in einem Szenario der „radikalen Unsicherheit“, schreiben John Kay und Mervyn King im britischen Prospect-Magazin. Radikale Unsicherheit trete dann auf, wenn wir etwas wüssten, aber nicht genug, um darauf vertrauend handeln zu können.

Diese Unsicherheit thematisieren die Autoren der Oxford-Studie durchaus – aber man muss sich die Mühe machen, ihre Veröffentlichung auch gründlich zu lesen, und darf sich nicht von den mathematischen Formeln abschrecken lassen.

Datenqualität bestimmt statistische Ergebnisse

Niemand mag Unsicherheit. Vielleicht ist das einer der Gründe, warum diese Werkzeuge in der Oxford-Studie sehr detailliert mit ihrem präzisen „Bauplan“ (dem mathematischen Modell) beschrieben sind, während die unsicheren Datengrundlagen nur kurz erwähnt sind.

Dabei ist die Mischung aus Daten und Annahmen, die man in solche Modelle steckt, um sie in Betrieb zu nehmen, viel problematischer. Zahlreiche Annahmen entscheiden darüber, wie diese Modelle mit Daten gefüttert werden. Diese Annahmen verändern gewissermaßen die Parameter und damit die „Werkseinstellungen“ dieser mathematischen Werkzeuge. Die Qualität des Rohmaterials „Daten“ entscheidet über die Qualität des resultierenden Produkts „Statistik“.

Annahmen sind zu Beginn einer neuen Situation oft mehr oder weniger realistische Erfahrungswerte. So rechneten die ersten Pandemie-Modelle für Corona typischerweise mit einer Reproduktionszahl von 2 bis 4. Je mehr Daten vorliegen, umso stärker lassen sich Annahmen daraus ableiten. Es gibt also eine Art „Meta-Modell“, mit dem die Einstellungen des Pandemie-Modells justiert werden, damit letzteres wiederum andere Daten durch das Modell verarbeiten kann.

In den Anhängen der Oxford Studie finden wir beispielsweise Hinweise darauf, dass der für das mathematische Modell notwendige Parameter der täglichen Wachstumsrate der Infektionsfälle aus den chinesischen Fallzahlen zwischen dem 25. Januar und dem 4. Februar geschätzt wurde. Ein weiterer Parameter, die Generationszeit, ist ein Meta-Modell-Ergebnis, das auf 40 Übertragungspaaren beruht, bei denen der Zeitpunkt der Infektion und der ersten Symptome bekannt war.

Das sind ganz schön wenige Daten. Und wie gut Daten aus China die Realität weltweit oder auch nur in Großbritannien repräsentieren, geschweige denn in Deutschland, wird in der Studie nur am Rande thematisiert.

Modelle und ihre Annahmen helfen lediglich bei der Risikoabschätzung

Dafür nutzt die Studie eine andere Möglichkeit, mit der Unsicherheit umzugehen: Ein Prototyp des Pandemie-Modells steht frei zugänglich im Internet und lädt dazu ein, mit seinen Einstellungen zu spielen. Angenommen, die Reproduktionszahl liegt bei 2, die Verdopplungszeit liegt wie die Inkubationszeit bei fünf Tagen, nur 60 Prozent der Infizierten haben Symptome, sind aber zehnmal so ansteckend wie die Symptomfreien. Außerdem werden zehn Prozent der Infektionen über die Umwelt – also beispielsweise über Türgriffe – übertragen und das Virus hält sich dort für drei Tage. Wer Symptome bekommt, wird unverzüglich isoliert und seine Kontakte begeben sich sofort in Quarantäne. Wenn all das gilt, müssen 60 Prozent der Bevölkerung die App nutzen, damit die Reproduktionszahl unter 1 sinkt und sich somit kontinuierlich immer weniger Menschen anstecken.

Das sind ganz schön viele Annahmen. Aber wie gut diese Annahmen die Realität abbilden, müssen wir nicht entscheiden, weil wir sie variieren können. Nur heißt das eben eines: Expertenräte, Politiker, aber auch wir als Bürger, die wir unseren Beitrag im Kampf gegen Corona leisten, müssen selbst entscheiden, was wir glauben. Allerdings hilft ein solches Modell, zu überprüfen, welche Entwicklungen aus bestimmten Annahmen folgen. Und was passiert, wenn wir mit unseren Annahmen eben nicht recht haben: Sind symptomlos Infizierte vielleicht deutlich ansteckender? Dann braucht es womöglich 75 Prozent App-Nutzer. Ist die Generationszeit zwischen Infektion und ersten Symptomen deutlich länger? Dann reichen vielleicht 30 Prozent aus oder noch weniger, wenn wir weiterhin einen Mundschutz tragen und uns regelmäßig die Hände waschen.

So lässt das Modell aus Oxford beispielsweise außen vor, wie belastbar die Risikoeinschätzungen der Corona-Warn-App eigentlich sind. Für diese Einschätzungen errechnet ein Algorithmus einen Indexwert aus vier Risikofaktoren, die miteinander multipliziert werden. Sie bilden ab, wann ein Kontakt zu einer infizierten Person stattgefunden hat, wie nahe man ihr für wie lange Zeit gekommen ist und wie ansteckend diese Person mutmaßlich war. Diese Faktoren lassen sich nur mit einer gewissen Unschärfe messen, etwa weil der Austausch über Bluetooth die Abstände zwischen zwei Menschen nicht präzise genug erfassen kann. Oder sie können überhaupt nur geschätzt werden, so wie die Infektiosität einer Kontaktperson.

Im Kampf gegen Corona bringt auch die App keine absolute Sicherheit

Deshalb gilt, ähnlich wie bei den Antikörpertests, dass die App womöglich keinen Alarm auslöst, obwohl man sich angesteckt hat, oder dass sie einen Fehlalarm auslöst, obwohl man nicht infiziert ist. Weil praktisch keine Daten zu den genannten Faktoren vorliegen, können wir über die Wahrscheinlichkeit solcher Fehler nur Annahmen treffen und ausprobieren, was wäre, wenn diese Annahmen zutreffen.

Zu diesem Zweck hat die Statistik-Professorin Marlis von der Hude ein Simulationswerkzeug programmiert. Sie teilt die Nutzer in vernünftige, die ihre Kontakte beschränken, Hygieneregeln beachten und deshalb wenig ansteckend sind, und unvernünftige Nutzer ein, die Corona stark verbreiten. In einem Beispielszenario stecken zwei vernünftige Nutzer einen weiteren Menschen an, jeder unvernünftige Nutzer hingegen sechs. Wenn sich 85 Prozent der Nutzer vernünftig verhalten, dann sind in diesem Szenario 58 Prozent der Alarme falsch. Je größer der Anteil unvernünftiger Nutzer, umso geringer ist der Anteil der Fehlalarme – was daran liegt, dass sich mehr Menschen infizieren. Außerdem steigt die absolute Zahl von Alarmen und Fehlalarmen, so dass eine erheblich größere Anzahl an Menschen in Quarantäne muss, und das zu weiten Teilen irrtümlich.

Das macht deutlich, dass die App alleine kein Mittel ist, sich vor Ansteckungen zu schützen. Sie ist nur ein weiteres Hilfsmittel, um die Pandemie zu bekämpfen. Weitere Maßnahmen, wie Abstand, Mundschutz und umfangreiche Tests sind weiterhin notwendig. Eine komplexe Situation wie die Corona-Pandemie lässt sich nicht mit einfachen Mitteln bekämpfen. Der Erfolg unserer Strategie gegen Corona hängt davon ab, dass wir zusammenhalten und die Mittel ausschöpfen, die unsere Gesellschaft mit einem weitgehend funktionierenden Gesundheitssystem und den Möglichkeiten der Digitalisierung bietet.

Ja aber, mag man einwenden, es ist doch gar nicht sicher, dass das alles so funktioniert. Darum geht es nicht. Eine der großen Erkenntnisse aus Corona wird sein, dass Sicherheit in einer komplexen, globalisierten und digitalisierten Gesellschaft eine Illusion ist – wenn wir sie überhaupt jemals hatten. Auch wenn uns Digitalisierung und Datafizierung glauben machen, man könne alles messen und berechnen, so gilt heute mehr denn je: eine Zahl allein ist nutzlos und mehr Zahlen bedeuten nicht automatisch mehr Wissen. Erst Kontext und Interpretation durch Experten, die die Bedeutung von Zahlen und Daten richtig einordnen können, schaffen daraus Wissen und – hoffentlich – richtige Entscheidungen in einer Krise.

Mit der „Unstatistik des Monats“ hinterfragen der Berliner Psychologe Gerd Gigerenzer, der Dortmunder Statistiker Walter Krämer, die STAT-UP-Gründerin Katharina Schüller und RWI-Vizepräsident Thomas K. Bauer jeden Monat sowohl jüngst publizierte Zahlen als auch deren Interpretationen. Alle „Unstatistiken“ finden Sie im Internet unter www.unstatistik.de und unter dem Twitter-Account @unstatistik.