1. Corona Virus unter Kontrolle?
Stand 17.4.2020 haben wir von den „Hohen Priestern“ des RKI gehört, die Dynamik der Verbreitung des Virus verlangsamt sich erheblich. Das Gesundheitssystem wird mit großer Wahrscheinlichkeit die Herausforderungen in der vorhersehbaren Zukunft meistern. Und die Politik hat am Vortag das Signal gegeben: Restriktionen werden gelockert und ein vorsichtiger Rückweg in die Normalität ist am Horizont sichtbar.
Hier ein kurzer Zwischenruf aus methodischer Sicht als Warnung und Hilfestellung an die Politik.
Es ist erstaunlich, dass nach Monaten der Corona Virus Krise verbunden mit schwersten gesundheitlichen, ökonomischen, finanziellen, sozialen und psychologischen Risiken, die politischen Entscheidungsträger von der Wissenschaft ungenügend unterstützt werden. Wir haben weiterhin erhebliche Erkenntnis-Lücken hinsichtlich des Ausmaß der Betroffenheit vom Virus und in der Messung zentraler Effekte (Sterblich durch den Virus) sowie in der Interpretation des vorliegenden Zahlenmaterials. Auch der wichtige Indikator für die zukünftige Entwicklung der Pandemie, die Reproduktionszahl, weist erhebliche Mängel auf. Hierbei ist beobachten, dass sich die Politik eher instinktiv in die richtige Richtung gebebt, indem sie mehr und systematischere Tests fordert. Wenn diese Tests mit einem intelligenten Forschungsdesign verbunden würden, könnte man erheblich Wissensfortschritt machen.
Wenn man vom Idealtyp einer „evidence based policy“ ausgeht, dann verdient die Politik besseres. Dies schließt auch einen Blick über die Grenzen mit ein, vor allem wenn es neuere Forschungen in Norditalien, einer der am meisten betroffenen Regionen Europas, gibt.
2. Dramatische Ergebnisse einer neuen Studie zur tatsächlichen Verbreitung aus der Lombardei: Über 900.000 oder 21%
Lassen Sie uns zuerst einmal einen Blick auf neuste Schätzung der Verbreitung der Pandemie nach Norditalien werfen. Neueste Untersuchungen des TWIG Instituts in Mailand/Bergamo schätzen die Zahl der vom Corona Virus Betroffenen und die in Folge des Virus gestorbenen erheblich höher ein als die offiziellen Zahlen der „Regione Lombardia“. Die Untersuchung schätzt die Zahl der tatsächlich Infizierten auf 972.000 während die Zahl der offiziell bestätigten Fälle (3.4.20) bei 47.000 Fällen liegt. Die Zahl der offiziell gemeldeten Toten, der in Verbindung mit diagnostiziertem Corona gestorben, liegt offiziell bei 8300. Die Studie kommt zu einer Schätzung von circa 15.000 Toten. (Mehr Detail:
Bricht man diese Zahlen nach einzelnen Provinzen in der Region Lombardei runter und betrachtet man den Infektionsgrad relativ zur Bevölkerung, so sind in der Provinz Bergamo 27%, in der Provinz Cremona 23%, in der Provinz Brescia 14% und in der Provinz Pavia 13% der Bevölkerung infiziert. Für die gesamte Lombardei wird eine Betroffenheit von 21% geschätzt.
Den methodischen Ansatz möchte ich anhand der Provinz Brescia deutlich machen. Ausgangspunkt ist eine realistische Schätzung der Todesfälle durch oder in Verbindung mit dem Corona Virus im Zeitraum Februar und März 2020. Um dies zu ermitteln wurden sämtliche Gemeinden in der Provinz (Standesämter) kontaktiert, um neuste Todeszahlen zu erfassen. Gleichzeitig wurden zusätzliche Informationen in relevanten Veröffentlichungen lokaler Medien, vor allem Zeitungen (hier Giornale di Brescia) erfasst.
Hiernach ergaben sich im Februar-März 2020 in der Provinz Brescia 3700 Todesfälle. Im Vorjahr erfasste man hingegen 1000 Tote. Dies war ein Anstieg von 2700 Todesfällen im Vergleich zu den Todesfällen im gleichen Zeitraum des Vorjahres. Offiziell beträgt die Zahl der an Corona diagnostizierten Toten jedoch nur 1500. Die Autoren interpretieren den Anstieg der Todeszahlen gegenüber den Werten des Vorjahres als Corona induziert. Damit läge die Zahl der nicht erfassten Fälle bei 32,5% oder einem Drittel aller Fälle.
Der hohe Anteil von nicht registrierten erklärt sich nach Ansicht der Autoren damit, dass häufig Verstorbene in Altersheimen oder Verstorbene in ihrer Privatwohnung und Haus von der offiziellen Statistik nicht erfasst wurden.
Diese so ermittelten geschätzten Todeszahlen werden jetzt zur Schätzung der tatsächlichen Verbreitung von Corona herangezogen. Nach Ansicht der Autoren ergibt auf der Basis von Untersuchungen des „Imperial College“ London eine Todesrate aufgrund einer Corona Infektion von 1,57%. D.h. von 100 Infizierten sterben hiernach im Durchschnitt 1,57 Personen. Diese tasso di letalità oder Sterblichkeitsrate wird jetzt zur Berechnung der Verbreitung herangezogen. Die Formel lautet jetzt die Provincia die Brescia: Infizierte (Geschätzt) = 2700/0,0157= ca. 172.000. Für die gesamte Lombardei würde sich somit eine Gesamtzahl von geschätzten Infizierten von ca 955.000 ergeben. Nach meiner Berechnung ergeben sich somit leicht reduzierte Zahlen im Vergleich zu TWIG von 190.000 respektive 972.000.
3. Übertrag dieser Ergebnisse auf die Situation in Deutschland: Nur (?) 0,5%
Wenn man wie in der Lombardei davon ausgeht, dass man die Zahl der Corona relevanten Toten um 80% erhöhen muss, so käme man bei 4300 Todesfällen, so käme man auf eine geschätzte Zahl von 7800 Fällen. Wenn man jetzt auf diese Zahl von geschätzten Toten die Sterblichkeitsrate von 1,57% anwendet, so ergäbe sich hieraus eine Zahl von 497.000 Infizierten in Deutschland oder von knapp über 0,5% der Gesamtbevölkerung.
4.Einschätzung der Methode: Erhebliche Unsicherheiten; aber es gibt Alternativen
Können wir hieraus was lernen? Hier wäre mein Urteil zwiespältig. Eine Adjustierung der Sterbefälle in Deutschland wäre sicherlich auch wünschenswert. Möglicherweise oder sehr wahrscheinlich würden sich hierbei geringere Abweichungen als in Italien finden, wenn man auf die mit Corona verbundenen Sterbefälle schaut. Eine Abgleichung der faktischen Sterberate mit der durchschnittlichen Sterberate ist sicherlich eine sinnvolle Schätzmethode, um nicht erfasste Fälle einzuschließen. Dennoch, ist auch diese Methode nicht dazu in der Lage genau zu bestimmen, wer aufgrund von Corona als Hauptmortalitäts-Auslöser gestorben ist.
Der wohl problematischste Punkt in der Untersuchung ist der angewandte universell gültige „Mortalitätsfaktor“. Dieser wird in keiner Weise validiert und hinterfragt. Welchen Einfluss haben die Qualität des Gesundheitssystems und der Umfang der gesundheitlichen Versorgung auf die Sterblichkeit von Infizierten? Wie wirkt sich eine unterschiedliche Altersstruktur der Bevölkerung und der Infizierten auf die Sterblichkeit aus? Wie wirkt sich eine präventive und vorsorgende Gesundheitspolitik, die rechtzeitig notwendige Ressourcen bereitstellt, auf die Sterblichkeit aus?
Im Folgenden wird ein alternativer Forschungsansatz propagiert, der belastbare Ergebnisse über die Inzidenz des Virus in der Gesamtbevölkerung und in relevanten Teilgruppen ermöglichen würde.
5. Verbreitung des Virus in Deutschland: „Bestätigte Fälle“ statt Inzidenz
Hier zuerst einmal die Position des RKI, als führender Regierungsberater: „Naturgemäß (?) kann niemand die tatsächliche Anzahl der heute oder in der vergangenen Woche erfolgten Infektionen genau wissen oder bestimmen. Erst wenn die betroffenen Personen positiv (?) getestet wurden, kann deren Anzahl in einem Erhebungssystem erfasst und analysiert werden…..(Schlussfolgerung) …. so dass kein Erhebungssystem (?), und sei es noch so gut, ohne zusätzliche Annahmen und Berechnungen eine Aussage über das aktuelle Infektionsgeschehen machen kann“. (RKI, Epidemiologisches Bulletin 17 |2020 Online vorab: 9. April 2020)
Stattdessen wird vom RKI, der Politik und den Medien Bezug genommen zu den „Bestätigten Fällen“.
Hier die Definition: Es werden die bundesweit einheitlich erfassten und an das Robert Koch-Institut (RKI) übermittelten Daten zu bestätigten COVID-19-Fällen dargestellt. COVID-19-Verdachtsfälle und – Erkrankungen sowie Nachweise von SARS-CoV-2 werden gemäß Infektionsschutzgesetz an das zuständige Gesundheitsamt gemeldet. Es werden nur Fälle veröffentlicht, bei denen eine labordiagnostische Bestätigung (unabhängig vom klinischen Bild) vorliegt.
Dieser Sachverhalt wird vom Gesundheitsstatistiker Gerd Bosbach, wie folgt kommentiert (NachDenkenSeiten 20.3.2020): „Es ist inzwischen als Sachverhalt bekannt, dass wir die Gesamtzahl der Infizierten gar nicht kennen. Wer keine Symptome hat, wird nicht getestet, andere auch nur sehr eingeschränkt. Das wissen wir. Aber sobald wieder Zahlen genannt werden, tun wir wieder so, als würden wir diese genau kennen. Was wir kennen, ist die Zahl der positiv Getesteten. Die Zahl der Infizierten ist auf jeden Fall deutlich höher, aber niemand kann sagen, um welchen Faktor. Um dies zu beantworten, bräuchten wir eine repräsentative Stichprobe aus der Bevölkerung. Das ist zurzeit mangels Testkapazitäten in Deutschland nicht machbar“. Anschließend an die richtige Einschätzung von Bosbach möchte ich seinen Gedanken weiterführen und zuerst einmal den möglichen Nutzen einer solchen Inzidenz Erhebung kurz darstellen. Anschließend möchte ich abweichend von Bosbach, seine Annahme in Frage stellen, dass die Testkapazität in D nicht ausreicht.
6. Sinn und Nutzen einer genauen Inzidenz Bestimmung für zentrale politische Entscheidungen
Es ist offensichtlich, dass eine wichtige Informationslücke in der Einschätzung der Bedeutung der Corona Pandemie momentan fehlt.
Was könnte eine Inzidenz Schätzung leisten. Hier einige Hinweise:
- Einschätzung des Gesamtrisikos von Corona und
der Breite und Tiefe von Gegenmaßnahmen und die daraus folgende Strategie:
- Geringer Verbreitung: Isolierung der Betroffenen
- Größerer Verbreitung: Kontrollverlust und Herden-Immunisierung
- Messung der Dynamik der Verbreitung des Virus
via Inzidenz:
- Bessere Evaluierung der Wirksamkeit der getroffenen Maßnahmen
- Realistische Messung der Reproduktionszahl
- Exaktere Berechnung des Mortalitätsrisikos mit
Bezug auf die Gesamtinzidenz
- Hiermit wird natürlich die Unschärfe, dass nur die mit Corona und nicht durch Corona gestorbenen gezählt werden
- Information über besonders betroffene oder
weniger betroffene Gruppen, um diese besonders schützen zu können bzw., um
Maßnahmen zu lockern. Beispiele:
- Betroffenheit, Infektion bei Kleinkindern: Öffnung von Kindergärten
- Betroffenheit, Infektion von Schulkindern unterschiedlichem Alter: Öffnung von Schulen
- Betroffenheit von spezifischen Gruppen von Älteren: Empfehlungen zur freiwilligen Selbstbeschränkung
- Information über besonders betroffene Regionen:
Beispiele
- Geringere Betroffenheit: Mehr Freiräume
- Höhere Betroffenheit: Weniger Freiraum und z.B eingeschränkte regionale Mobilität
7. Mängel der bisherigen Statistik und deren Gebrauch
Wie oben gesagt: In Deutschland gibt es keine Inzidenz Indikatoren
- Nicht für die Gesamtheit
- Nicht für Regionen
- Nicht für Gruppen
Die Definition von Corona Toten bleibt ungenau. Hier noch einmal die angewandte Definition:Todesfälle in Zusammenhang mit (!!!) diagnostizierten (!!!) COVID-19-Erkrankungen
Offen bleibt:
- Ist Corona die Todesursache?
- Ist es die wesentliche Todesursache?
- Wie groß ist die Zahl derjenigen, die an Corona sterben ohne diagnostiziert zu sein?
- Tote außerhalb des Krankenhauses
- Tote in Altenheimen?
- Tote, die zu Hause sterben?
Die relative Sterblichkeit durch oder mit Corona bleibt infolgedessen wage, wenn die angewandte
Definition betrachtet: Zahl der mit (nicht durch!) Covid 19 gestorbenen dividiert durch die Zahl der bestätigten Fälle (nicht die Zahl der von Corona erkrankten)
Die Nutzung von absoluten Sterbezahlen und absoluter Betroffenheit in den Medien und durch die Politik hat nur einen beschränkten Aussagewert:
- Es wären sinnvoller relative Zahlen im Verhältnis zur Gesamtbevölkerung zu benutzen
- Hiermit wäre auch eine regionale und internationale Vergleichbarkeit möglich
Des Weiteren wird in manchen Bericht zu viel Gewicht auf absolute Zahlen gelegt. Zur Einschätzung der Dynamik sind Zuwächse der einzig relevante Indikator
8. Mangelnde Vorhersagkapazität für die zukünftige Entwicklung: Schlechte Schätzung der Reproduktionszahl (R)
Nicht zu Unrecht gibt die Politik dem Indikator der zukünftigen Reproduktionszahl des Virus eine große Bedeutung. Durch das RKI wird dies wie folgt definiert: Die Reproduktionszahl ist die Anzahl der Personen, die im Durchschnitt von einem Fall angesteckt werden. Diese lässt sich nicht aus den Meldedaten ablesen, nur schätzen. Die Reproduktionszahl wird aktuell auf R = 1,0 (95%-Konfidenzintervall: 0,8-1,2) geschätzt. Diese Schätzung basiert auf den übermittelten COVID-19 Fällen mit Stand 14.04.2020 und der Annahme einer mittleren Generationszeit von 4 Tagen. Lediglich Fälle mit Erkrankungsbeginn in den 3 Tagen vor dem aktuellen Datenstand wurden nicht berücksichtigt, da sie noch nicht in ausreichender Zahl übermittelt wurden und zu instabilen Schätzungen führen würden. Mehr im Detail in (RKI, Epidemiologisches Bulletin 17 |2020 Online vorab: 9. April 2020, S.13f)
Dies ist ein Schätzmethode für die zukünftige Entwicklung auf der Basis einer historischen Zeitreihe täglich gemeldeter bestätigter Fälle unter Berücksichtigung von time lags. Dies ist eine sehr gebräuchliche Methode der Zeitreihenanalyse. Hier werden auch Konfidenzintervalle und Wahrscheinlichkeiten bestimmt. Hierzu ist einiges anzumerken:
Erstens: Die Politik muss darauf aufmerksam gemacht werden, dass es eine Fehlerwahrscheinlichkeit von 5% gibt und dass das Ergebnis im o.g. Fall zwischen 0.8 und 1.2 schwanken kann. Letzteres wäre eine nicht unwesentliche Beschleunigung der Verbreitung und würde auf beachtliche zukünftige Risiken hindeuten.
Zweitens: Auch diese Schätzmethode bleibt höchst unvollständig, da sie nur die Reproduktion der „gemeldeten Fälle“ aber nicht die Reproduktion der Erkrankten anzeigt. Die Unzulänglichkeit dieses Ansatzes macht das RKI selbst deutlich in folgender Feststellung: „Ein Grund dafür, dass der Rückgang
der Neuerkrankungen trotz der gravierenden Maßnahmen nur relativ langsam passiert, ist, dass sich das Virus nach dem 18. März stärker auch unter älteren Menschen ausbreitet und wir zunehmend auch Ausbrüche in Pflegeheimen und Krankenhäusern beobachten. Ein weiterer Aspekt ist aber auch, dass in Deutschland die Testkapazitäten deutlich erhöht worden sind und durch stärkeres Testen ein insgesamt größerer Teil der Infektionen sichtbar wird. Dieser strukturelle Effekt und der dadurch bedingte Anstieg der Meldezahlen, kann dazu führen dass der aktuelle R-Wert das reale Geschehen etwas überschätzt. Eine Adjustierung für die höheren Testraten ist nicht ohne weiteres möglich, da keine ausreichend differenzierten Testdaten vorliegen“ (RKI. s.o. 14f). Der s.g. „strukturelle Effekt“ sind direkte (mehr Altersheime) oder indirekte (mehr Tests) Effekte auf das Ergebnis, die sich daraus ergeben, dass die tatsächlich relevante Grundgesamtheit für die Vorhersage – nämlich die Inzidenz aller Betroffenen – nicht erfasst wird. Damit erkennt das RKI selbst, die Schwäche seines zentralen Messinstruments für die zukünftige Entwicklung des Virus an.
Drittens: Noch wichtiger als die beiden vorhergehenden Überlegungen ist die Tatsache, dass historische Zeitreihen umstandslos in die Zukunft als Trend weiter fortgeschrieben werden. Das ist zwar leider alltägliche Praxis in vielen Untersuchungen und darauf basierender politischer Beratung, dies macht aber die Sache nicht besser. Ausführlich hierzu u.a. N Talleb „The Black Swan“. Dies vor allem in einer sehr volatilen Situation, wo die Verbreitung und die Wirkungen des Virus schwer vorhersehbar sind. Des Weiteren in einer Situation, die durch permanente politische Intervention geprägt ist, deren Wirkung in der Zukunft schwer einschätzbar ist.
9. Inzidenz Bestimmung durch eine repräsentative Stichprobe in Deutschland
Im Gegensatz im RKI handelt es sich bei dieser Problemstellung nicht um ein “naturgemäß“ gegebenes Informationsdefizit, was mit keinem Erhebungsinstrument überkommen werden kann. Das ist blanker Unsinn und beim Ernst der Lage relativ verantwortungslos als policy advice!!!! Ich stimme Bosbach vollkommen zu: Die Lösung ist eine repräsentative Stichprobe für D, die in Bezug auf die Stichprobengröße bestimmte Bedingungen erfüllen muss:
- Hypothetische Inzidenz
- Aussagefähigkeit für die regionale Inzidenz
- Aussagefähigkeit für gruppenspezifische Inzidenz
- etc
Möglicherweise braucht man hierzu eine größere repräsentative Stichprobe von vielleicht 15.000-20.000 oder mehr, wenn zum Beispiel eine Verbreitung 1 % zugrunde legt. Alle Teilnehmer würden dann einem Test unterzogen in Kombination mit einem face-to-face Fragebogen. Die Kosten kann ich nicht abschätzen; vielleicht 10-12 Mio Euro?
Um die Dynamik der Verbreitung oder ihrer Eindämmung zu bestimmen, wäre des Weiteren sinnvoll im Jahr 2020 drei oder vier Wiederholungsuntersuchungen vorzunehmen.
10. Machbarkeit: Kein Mangel an Labour Kapazität
Bosbach hält eine repräsentative Studie nicht für Machbar, da die Testkapazitäten in Deutschland nicht ausreichen würde. Dies würde ich in Frage stellen: Nach Auskunft des Berufsverband „Akkreditierte Labore in der Medizin“ in Deutschland (ALM e.V.) mit mehr als 200 Laboren und 900 Fachärzten ergibt sich tagesaktuell in Deutschland folgende Situation: Die Kapazität der zuletzt 107 Labore, die sich an der ALM-Datenerhebung beteiligt haben, wurde auf 110.000 Tests täglich gesteigert. Macht insgesamt 550.000 Tests pro Woche. Durchgeführt wurden in der Karwoche aber nur 294.000 Tests.
ALM-Vorstand Doktor Michael Müller sagt: „Die verfügbaren Testkapazitäten übersteigen den Versorgungsbedarf aktuell deutlich. Es gibt noch Potenzial für zusätzliche Testungen.“ Was auch daran liege, dass sich viele Menschen bereits haben testen lassen, alleine seit Anfang März über 1,3 Millionen. Einen Rückgang um 50 Prozent an Laboruntersuchungen verzeichnet die ALM.
11. Machbarkeit: Umsetzung der Umfrage
Ein weiterer Aspekt bezieht sich auf das Design und Umsetzung der Umfrage. Stichproben Design und Fragebogen Design könnte man innerhalb von 10 Tagen erstellen. Für die Durchführung von Tests und Befragung sollte man mit 3 Wochen auskommen. Innerhalb von 6 Wochen könnten bei extremen Ressourcen-Einsatz erst Ergebnisse vorliegen.
Dr Hubert Krieger, Ehemaliger Research Manager in einem EU Think Tank in Dublin von 1987 bis 2012. Politikberatung; Wahlberichterstattung und Umfragen bei Infas, Bonn von 1981-1987
Ausbildung in empirischer Sozialforschung Zentralarchiv und Uni Köln (Diplom Volksw.), Essex University, Europäisches Hochschulinstitut in Florenz und Uni Köln (Promotion) und UCD Dublin (MSc). Leiter zahlreicher vergleichender Studien zur Lebensqualität und Gesundheitssituation in Europa für die Europäische Union.
Bildquelle: Pixabay, Bild von Alexandra_Koch, Pixabay License
Guten Tag,
danke für den informativen Artikel. Wünsche ihm viel Verbreitung.
Frage an Herrn Krieger: Wo soll die ich (Gerd Bosbach) denn die Machbarkeit einer repräsentativen Stichprobe wegen der Testkapazitäten verneint haben? (Wenn überhaupt vor Mitte März, da es da nur wenige Möglichkeiten gab.)
Dann gäbe meine Forderung nach der Stichprobe auch keinen Sinn. Ist also unlogisch.
Gruß
Gerd Bosbach