Miroslav Singer: Kam nás vede nepochopení čísel a dat kolem covidu

Miroslav Singer: Kam nás vede nepochopení čísel a dat kolem covidu Zdroj: Profimedia.cz

Ilustrační foto
Restaurace čekající na zákazníky
Do českých restaurací se pomalu začne vracet život, (15.04.2020).
Koronavirus a otevření restaurací 25. května: Přípravy v pivnici v centru Brna
Zdravotníci 6. listopadu 2020 přivážejí do pražské Fakultní nemocnice v Motole nosítka s pacientem nakaženým koronavirem. Sanitky přivezly pět pacientů z nemocnic ve Zlíně, Uherském Hradišti a Kroměříži.
8 Fotogalerie

Miroslav Singer: Kam nás vede nepochopení čísel a dat kolem covidu

MIROSLAV SINGER

Bývalý guvernér České národní banky Miroslav Singer je přesvědčen, že špatná interpretace dat kolem covidu a jejich elementární nedostatek zavádějí moderní společnosti na hranu ekonomické katastrofy a pravděpodobně k většímu počtu obětí, než kdyby se k viru postavily s větším porozuměním podstaty pandemie.

Celý svůj profesní život se zabývám nepřesnými čísly. Ve svém akademickém období jsem se specializoval na modelování a odhadování parametrů složitých modelů, pracujících s daty získanými ze souborů, které nevznikly z hlediska statistiky ideálním způsobem – tedy náhodným výběrem. Právě „covidová čísla“ jsou nehezky vzniklým příkladem toho, jak podobná čísla umějí ovlivňovat náš život a jaké máme problémy s jejich interpretací. Dovolím si tedy několik komentářů k nim a k problémům, jimiž jsou zatížena.

 

Data zatížená šumem

Jednou z nejčastějších chyb, které u covidu předvádějí prakticky všichni, kdo o něm mluví, je přehnaný důraz na mezinárodní srovnávání posledních čísel. Denní či týdenní statistiky o covidu jsou data zatížená velkým šumem, tedy nejistotou a náhodností. K tomu se přidávají metodické rozdíly v testování a interpretaci výsledků. Již jen testů je víc a každý z nich je nejen zatížen jinými chybami, ale není všude prováděn stejným způsobem. Pozitivní výsledek testů pak může, ale také nemusí vést k tomu, že statistika dané země vzroste. I zkušenost, kdy se Česko ze země vzorně zvládající krizi po necelém půlroce proměnilo ve stát s nejhoršími covidovými čísly na světě, by nás neměla vést k depresi. Místo toho bychom měli být spíše opatrní a ostražití při srovnávání našich čísel s těmi zahraničními. A podotýkám, že přichází nový typ testů, který způsobí, že se význam časových řad o vývoji pandemie opět změní.

Šest týdnů za světem

Dokonce i data o úmrtnosti, což by měla být jistější čísla, než je počet pozitivních případů covidu, se interpretují docela obtížně. Ukazuje to mimo jiné také debata o vyšší úmrtnosti ve Švédsku v porovnání s ostatními skandinávskými zeměmi: Je odrazem méně restriktivní strategie boje s covidem, nebo horší demografické situace? Neznáme přesnou odpověď. Nicméně u českých dat o úmrtnosti stojí za mimořádnou pozornost jejich jiný aspekt. Minulý týden nám statistický úřad přinesl údaje za 36. týden tohoto roku, přitom evropský web údajů o úmrtnosti však má od zemí, které na studii spolupracují, k dispozici 42. týden. Což je v době, kdy vám banka dokáže do dvou dnů od vašeho úmrtí zablokovat účet, dost nepochopitelné. Jak je možné, že máme celková data o úmrtích k dispozici s šestitýdenním zpožděním vůči většině evropských zemí?

Ještě méně je pochopitelné, že při množství všech komentářů na téma „covidovská čísla“ a oběti covidu jsem zřejmě prvním, kdo tento problém ve veřejném prostoru reflektuje.

Nezapočítaní ve statistikách

I medicínským vzděláním nedotčený laik už dnes ví, že covid je problémem především proto, že se velmi rychle šíří a přináší starším lidem v porovnání s běžnějšími virovými nákazami významnější zdravotní rizika. Právě pro tu rychlost je modelování parametrů jeho šíření a důsledků tohoto šíření mimořádně významné. Nejde jen o dnes snad každému známé reprodukční číslo R a faktory, které ho ovlivňují: dobu nakažlivosti, počet kontaktů během této doby a pravděpodobnost přenosu. Jde i o to, jak se v důsledku šíření nákazy naplňují nemocnice, ale třeba i o to, jak zasahuje jednotlivé segmenty obyvatel. Hlavním výstupem takových modelů jsou samozřejmě předpovědi šíření nákazy.

Modelování a obecněji statistické zpracovávání pandemie se však nejen u nás setkávají s několika problémy. Základní problém spočívá v tom, že vzorek údajů, nemocných a nakažených není náhodný. Natož aby představoval reprezentativní vzorek populace. Vždy bude část obyvatel Česka, která se díky své výbavě nemůže nakazit (i vůči černému moru byla část tehdejších obyvatel Evropy evidentně imunní), a do takového vzorku se tudíž nedostane. Proto budou všechna čísla o smrtnosti, zdravotních důsledcích nemoci nadhodnocená. Tím více, čím menší část obyvatel bude pozitivní. To jsme také mohli pozorovat na tom, jak údaje o těchto zcela základních parametrech covidu v čase klesaly. Celková smrtnost se odhadovala v procentech, dnes pod procentem, v debatě o smrtnost u mladých lidí lze již najít odhady pod úrovní jednoho promile. Navíc je velmi pravděpodobné, že se ztrátou schopnosti trasovat nakažené existuje skupina lidí, kteří by sice v testu vykázali pozitivitu, ale nic jim není a ani netuší, že jsou nakaženi. Je-li jich v době, kdy tohle píšu, 250 tisíc (zhruba počet identifikovaných nakažených), můžeme všechny vypočtené statistiky rizik rovnou dělit dvěma.

Změna metodiky

Dalším problémem, jenž vývoj modelů zatěžuje, je změna obsahu dat, změna toho, co popisují časové řady. Jen dva příklady z naší praxe. V druhé polovině září registrujeme významný nárůst poměru pozitivních testů na celkovém počtu testů. To je přičítáno ztrátě schopnosti hygienických stanic trasovat podezřelé, která je způsobena tím, že k testům chodí mnohem větší poměr těch, kdo vykazují symptomy, a jsou tedy z větší části nakaženi. Jenže stejně tak se na nárůstu procent pozitivních testů odráží i to, že jde o období, ve kterém se při absenci příznaků přestal pro odchod z karantény vyžadovat druhý negativní test. Tím samozřejmě automaticky klesl poměr negativních testů. Je určitě poněkud tragické, že ani varování před podobným posunem, natož jeho kvantitativní odhad nebyly naše oficiální autority pro analýzu pandemie, primárně ÚZIS (Ústav zdravotních informací a statistiky), schopny předem komunikovat.

Kde se vzal pokles?

Druhý příklad je pro mě osobně bolestnější. Kolem konce září to vypadalo, že se u nás po letním vzestupu dostává covid pod kontrolu. Přírůstky nakažených začaly relativně i absolutně klesat. I já jsem učinil chybu, když jsem v několika textech konstatoval, že opatření i opatrnější chování firem a lidí začínají zabírat a že to nejhorší je za námi. Jenže pak jsem s novým překvapením selhavšího prognostika pozoroval od druhého týdne v říjnu další explozi počtu infikovaných a vše, co s tím souvisí.

Dodnes není jasné, co se vlastně stalo. Nejcyničtější vysvětlení nabídl „apoštol covidové zkázy“, evoluční biolog Jaroslav Flegr, jenž naznačil, že pokles může souviset s potřebou lepších čísel před senátními volbami. Mohl. A určitě se také zčásti přelila nákaza od neidentifikovaných přenašečů bez symptomů na ostatní. Jenže nejspíš i proto, že kvůli restriktivním opatřením zůstala najednou část již nakažené mládeže bez symptomů sedět se svými rodiči a prarodiči večer doma. Projevil se také návrat lidí po prázdninách do měst a po dovolené do práce. Rozhodně je ale jisté, že podstata toho, jak se časová řada počtu identifikovaných infikovaných chová s vývojem nákazy, se změnila.

Další selhání ÚZIS

Dalším odrazem problémů s interpretací dat je debata o mrtvých „na“ nebo „s“. A návazně, kolik let mohly oběti covidu, kdyby se nenakazily, ještě žít. Je evidentní, že i odpověď na tento typ otázek se mění, mění-li se distribuce nákazy přes různé ročníky populace českých občanů. Což se děje. V podzimní vlně identifikujeme proporcionálně více mladých nakažených lidí a je velmi pravděpodobné, že u neidentifikovaných nosičů nákazy bude tato změna ještě mnohem výraznější.

Trochu smutné je, že na onen posun musela ty, kdo nepracují s údaji o jednotlivých nemocných, upozornit studie investiční banky JPMorgan, a ne informace z centra ÚZIS. Obecně ona studie názorně ukazuje, jaké informace bychom také měli ve veřejné sféře v rychle dostupné formě mít. Jenže nemáme.

„Skvělé“ mladé oběti

Což mě vede k údajům o počtu úmrtí a k těm, kdo na covid umírají. Rozumím tomu, že je atraktivní i výchovné upozorňovat na rizika, která v souvislosti s covidem hrozí i mladým. A jistě se vždy najde i fotografie „skvělé“ mladé oběti. Jenže mladých obětí je skutečně minimum, ono to ani s těmi riziky pro nás, padesátníky, není nijak významné. Rizika covidu jsou prostě dramaticky posunuta v neprospěch starších nad 65 let. Snad jen dva údaje ilustrující tento fakt: na přelomu září a října z více než 70 tisíc pozitivně identifikovaných studentů bakalářského studia v USA potřebovali nemocniční péči jen tři. Neumřel nikdo. Naopak při průměrném věku, v němž občané České republiky umírají, tedy 78,6 roku, je průměrný věk, ve kterém se umírá „na“ covid, 79,6 roku. Tedy vyšší, než je průměrný věk, v němž nás naši spoluobčané opouštějí. Povědomí o této skutečnosti také umožňuje pochopit, proč – na rozdíl od jara, kdy se báli skoro všichni – se mladší populace snaží restrikce alespoň zčásti obcházet. Nejen u nás.

Smrt a ekonomika

U ožehavého tématu smrti ale ještě chvíli zůstanu. Obecně si v dnešní, „superbezpečné“ době neumíme dát údaje o úmrtí do kontextu. Nechceme je znát, a neumíme s nimi tudíž pracovat. Takže až zase budeme poslouchat údaje o stovkách, či dokonce tisících obětí covidu: v posledních pěti letech v České republice zemřelo v průměru něco přes 111 tisíc lidí ročně, údaj přitom kolísá v řádu více tisíců. V této dekádě je minimum 105 tisíc, maximum asi 113 tisíc. V průměru každý den odejde přes 300 našich spoluobčanů. Tím neříkám, že smrt není v drtivé většině případů bolestná tragédie, ale chci upozornit, že smrt je mezi námi přítomnější, než titulky o pandemii naznačují.

Cesta špatná a ještě horší

Což mě vede k dalšímu odstavci, nad nímž se nejspíš mnozí pohorší. Mnohokrát a mnohými bylo zmiňováno, že by nekontrolovaný průchod covidu českou populací způsobil stejné a hrozné ekonomické škody, jaké způsobuje snaha covid zadržovat. Není tomu tak. Odhady počtů obětí v případě takového scénáře, zahrnující i přeplněné nemocnice a nutnost některým pacientům odepírat potřebnou péči, se začínají pro naši zem stabilizovat někde na úrovni kolem 20 až 30 tisíc obětí. I extrémnější Jaroslav Flegr zmiňoval na jarních, výrazně nadhodnocených odhadech rizik postavenou studii pracující s 50 tisíci oběťmi. Chápu, že nejen u nás má většina občanů a voličů pocit, že si dnešní bohatá společnost takový scénář nesmí připustit. A že stejně přemýšlejí ti, kdo nesou za covid odpovědnost.

Odpusťte, ale čistě ekonomicky ani takový scénář případného zvýšení úmrtnosti během jednoho roku o méně než polovinu – spíše méně než čtvrtinu – průměrné hodnoty není schopný ekonomiku, jakou dnes máme, osudnějším způsobem poškodit. Na rozdíl od toho, jaká opatření činíme proti covidu dnes.

Okrádání budoucnosti

Ještě horší je, že nepochopení docela elementárních souvislostí a kontextu dat o pandemii nám v situaci, kdy zažíváme největší globální „průšvih“ zhruba za poslední půlstoletí, minimálně blokuje schopnost o ní racionálně uvažovat. Navíc v době, kdy přicházejí levnější a rychlejší testy. V době, kdy stále větší množství lidí proti covidu získalo imunitu, což by jim umožnilo bez významnějšího rizika pečovat o starší. Řada debatérů si ale právě i kvůli neschopnosti zařadit si „covidovská čísla“ do kontextu neuvědomuje, na co jim příznivé časy umožnily zapomenout: Život se neskládá jen z nabídky výběru z řady dobrých nebo lepších alternativ, jako: hrát si s dětmi, jít s kamarády na pivo nebo pracovat na svém projektu. Občas, naštěstí v poslední době ne tak často, před nás klade i situace, v nichž žádná dobrá alternativa výběru není.

Snad už se blíží řešení covidové krize, nejspíš v podobě očkovací vakcíny. Nemá ale cenu si namlouvat, že cesta, kterou současnou pandemií většina vyspělého světa prochází, je cestou efektivní a cestou bez významnějšího počtu obětí. Není. Ekonomické důsledky budou hrozivé a oběti, jež tvrdými restrikcemi a omezeními přesouváme od starší populace na mladší, představující naši budoucnost, jen zatím nevidíme.