Još od proljeća 2020. bilo je jasno da su anti-COVID mjere donošene na brzinu, bez provjera, pod utjecajem širenja panike i teško shvatljivog ugledanja u Kinu kao uzor. Unatoč tome vjerujem da su u ožujku 2020. postojali razlozi ne samo za strah nego i za eksperimentiranje s mjerama (ne nužno na način kako je to učinjeno). O virusu se znalo malo, a postojale su dovoljne indicije da bi mogao biti jako opasan.
No već u travnju, mnogo prije opuštanja tada oštrih mjera, bilo je jasno da zaraza jako usporava, da je mortalitet COVID-19 manji nego što se u početku sumnjalo i da slijedi popuštanje.
Komentatori su se tada oštro podijelili između onih koji su vjerovali da je usporavanje širenja zaraze s proljećem posljedica restriktivnih mjera i onih koji su smatrali da je usporavanje posljedica sezonske promjene ponašanja ljudi i jačanja imuniteta. Takva podjela je i danas aktualna iako smo u protekla dva mjeseca u Hrvatskoj i još nekim zemljama svjedočili svojevrsnom “prirodnom eksperimentu”. Drugi val je početkom prosinca zaokrenuo prema dolje, a treći val polako zaokreće sada, iako čvrstog lockdowna u oba slučaja nije bilo. Unatoč tome, dijelu ljudi koji su impregnirani strahom i apriornim vjerovanjima to nije dovoljno da bi preispitali svoj pro-lockdown stav koji je doktrinoran i svodi se na to da su uvijek potrebne oštrije mjere bez obzira kakve su trenutno. Takav stav pronalazi uporišta u hipotezi da čak i zaokreti bez lockdowna ne isključuju mogućnost da je broj umrlih mogao biti manji da su mjere uvedene na vrijeme i da su bile snažnije.
Sukobi o ovoj temi će se nastaviti. Kontra-fakti „argument“ (što bi bilo da je bilo) je jako teško opovrgnuti. Stoga hipoteza o zakašnjelom lockdownu ostaje u zraku, te će se obistiniti godinu dana staro predviđanje da će (od tada) proći 2-3 godine prije nego što se kroz stotine istraživanja kristalizira slika o tome što se događalo i što je funkcioniralo, a što ne.
Tada sam zapisao da za formiranje konačnog većinskog stava neće biti dovoljna istraživanja epidemiologa i virologa. Proces kroz koji smo prošli je enormno kompleksan i uključuje socijalne aspekte ljudskog ponašanja, te ga neće biti moguće shvatiti bez doprinosa psihologa, komunikologa, sociologa, ekonomista i drugih struka koje se bave političkim odlukama i ponašanjem ljudi.
Ekonomska metodologija istraživanja
Ekonomist Christian BjØrnskov sa Sveučilišta u Aarhusu u Danskoj nedavno je objavio istraživanje pod nazivom Je li lockdown funkcionirao? Međunarodna usporedba jednog ekonomiste. Pronašao je neučinkovitost restriktivnih mjera, barem kada je riječ o mjerama koje su izmjerene uz pomoć poznatog Oxfordovog indeksa restriktivnosti i kada je riječ o njihovom utjecaju na mortalitet.
Autor je promatrao tjedni mortalitet u 24 europske zemlje (podaci Eurostata) po dobnim skupinama (0-39; 40-59; 60-79; 80+). Mene je istraživanju privukao upravo pristup modeliranja viška mortaliteta za koji sam u barem pet tekstova tumačio da je superioran u odnosu na modeliranje službenog broja umrlih od COVID-19.
Činjenica da je autor ekonomist ne umanjuje zanimljivost analize. Ekonomisti se u svom poslu susreću s metodološkim problemima koji su srodni problemima epidemioloških intervencija: (a) koriste se panel podaci (matrice podataka koji imaju i prostornu i vremensku dimenziju), (b) varijable ne moraju biti normalno distribuirane, (c) postoje brojne izostavljene varijable koje mogu biti bitne i (d) jako je teško utvrditi uzročnost (npr. ono što slijedi ne mora biti posljedica nekog ranijeg uzroka, kao u slučaju kada se restrikcije pojačavaju tek nakon što epidemija ubrza).
Nastojeći ovladati ovim metodološkim problemima BjØrnskov je modelirao relativan višak mortaliteta (promjene u odnosu na isti tjedan prethodne godine, ali relativno u odnosu na promjene u drugim zemljama) i uveo tri vrste fiksnih efekata (za zemlju, godinu i tjedan), čime je spriječio da na zaključak utječu razlike u zdravstvenim sustavima, znanju i institucijama među zemljama i eventualne promjene tih faktora u vremenu. Ti faktori su „uhvaćeni“ fiksnim efektima.
Zanimljiv je i način kako je Danac uveo jednu instrumentalnu polit-ekonomsku varijablu u model. Pretpostavio je da stupanj restriktivnosti mjera zavisi (i) o ustavnom uređenju zemlje. Naime, jedan od (političkih) motiva za uvođenje restriktivnih mjera je očekivanje mogućeg daljnjeg zaoštravanja. Taj politički motiv je prirodan, a kontrolirati ga može samo ustavno uređenje koje ograničava izvršnu vlast. Drugim riječima, hipoteza glasi da će restrikcije više zavisiti o očekivanoj moći odnosno ustavnom uređenju, nego o samome tempu očekivanog mortaliteta. Tek kad se svi takvi (kompleksni) odnosi uzmu u obzir može se gledati je li preostao neki (nazovimo ga: proaktivan) učinak restrikcija na usporavanje mortaliteta.
Najveća mana istraživanja je u tome što podaci završavaju na polovini 2020. tako da su rezultati relevantni samo za prvi val pandemije koji nije ozbiljnije zahvatio istok Europe.
Rezultati
BjØrnskov prvo pronalazi da je eskalaciji mortaliteta u početku pandemije u Europi prethodilo razdoblje vrlo niskog mortaliteta što je moglo pogoršati ishode. Ne mogu sakriti zadovoljstvo ovim autorovim zapažanjem, jer kada sam u nekoliko navrata to bio napisao u svojim tekstovima, bio sam žestoko kritiziran. Ipak nisam vidio bijele miševe.
Nadalje, zemlje s tvrdim lockdownom u prosjeku su imale veći mortalitet. To naravno ne znači ništa u pogledu efikasnosti mjera. Ako vlasti zakasne s mjerama to ne znači da mjere ne bi radile da su uvedene na vrijeme (sjetite se problema kontra-fakti „argumenta“ iz uvoda). Tajming je ključan kada su mjere u pitanju, barem tako glasi hipoteza. Stoga je ovo tek deskriptivna statistika koju vrijedi zabilježiti i ići dalje u potragu za rezultatima.
Rezultati počinju zagonetkom. Učinak mjera na višak mortaliteta vidi se s vrlo kratkim vremenskim pomakom od tjedan do dva. To je nevjerojatno kratak vremenski pomak s obzirom da mjere trebaju prvo djelovati na usporavanje zaraze (za što je potreban barem jedan tjedan), a usporavanje zaraza opet s vremenskim pomakom djeluje na usporavanje mortaliteta. Za to su potrebna oko tri tjedna, dakle ukupno barem četiri tjedna vremenskoga pomaka, a ne tjedan do dva. Međutim, na pomaku od tri do četiri tjedna mjere nemaju značajan učinak na mortalitet. Autor je ispitao i eventualnu asimetriju razdoblja prije i poslije vrhunca zaraze i potvrdio da restrikcije nisu utjecale na mortalitet u razdoblju od tri do četiri tjedna nakon vrhova epidemijskih krivulja.
Ograničenja
Jedan od najvažnijih postupaka ozbiljne znanosti je preispitivanje, kritika. To je sušta suprotnost apologiji i pozivanju na apstraktni znanstveni autoritet per se. Postupak kontrole i preispitivanja je institucionaliziran kroz recenzije znanstvenih objava i rangiranje publikacija, no ozbiljnog znanstvenika prije svega čini unutarnji dijalog – inherentna psihološka sposobnost unutarnje kritike, koja počiva na razdvajanju pronalazača i njegovog kritičara u sebi. Unutarnji skepticizam poboljšava kvalitetu rezultata prije nego što isti bude podastrijet mentorima ili recenzentima, iako istraživač koji je pretjerano sklon unutarnjim kočnicama riskira pad u zamku gubitka samopouzdanja i težnje neostvarivom perfekcionizmu. Koliko, dakle, Danac preispituje svoje rezultate i što je sve u stanju zamisliti kao suprotan argument i preispitati to?
BjØrnskov dopušta da takozvani problem endogenosti nije riješen na zadovoljavajući način. Pretpostavlja da u samom epidemijskom procesu postoji nešto neotkriveno zbog čega restrikcije nakon 1-2 tjedna prividno umanje relativan mortalitet ali veza potom nestaje zbog tog nečeg nepoznatog što izvana upravlja procesima zaraze, donošenja mjera i mortaliteta. Zaključuje: kada bi postojao neotkriveni „faktor X“, instrumentalne varijable (sjetite se polit-ekonomskog faktora ustavnih odredbi o kontroli izvršne vlasti) ne bi bile značajna objašnjenja, a u analizi je upravo to slučaj – instrumentalne varijable su značajna objašnjenja u periodu od prva tri tjedna kada bi trebalo djelovati to nešto što nije uključeno u model.
Drugo, i tajming mjera treba uzeti u obzir: kao što je ranije rečeno, ako su restriktivne mjere posvuda zakašnjele, ne očekujemo da će one predstavljati bitnu odrednicu mortaliteta. Učinak očekujemo samo ako su mjere donijete na vrijeme. Utjecaj tajminga je kontrolirao varijablom interakcije intenziteta mjera i vremena njihova uvođenja koje je određeno brojem dana od prvog slučaja i od prve službene smrti od COVID-19. Glavni nalaz se potvrdio i nakon kontrole efekta tajminga; rani lockdown nije pomogao izbjegavanju kasnijeg zaoštravanja mjera i smanjenju mortaliteta.
Naposljetku, ukupan mortalitet možda nije dobra zavisna varijabla koju želimo objasniti ako se daleko najveći dio umrlih pojavljuje u najstarijoj dobnoj skupini. Analitički postupak je ponovljen na mortalitetu najstarije dobne skupine i nije dobivena značajna promjena rezultata i zaključaka. Štoviše, pokazalo se da su lockdowni povezani sa značajno većim relativnim mortalitetom u dobnoj skupini od 60 do 79 godina.
Budimo realni …
Analiza ima četiri značajna ograničenja. Prvo, odnosi se samo na prvi val. Rezultati za drugi val mogu se razlikovati od prvog vala (mogu, ali ne moraju; vidjet ćemo kad se prikupe podaci i naprave analize).
Drugo, metoda ocjene parametara je jednostavna (OLS s fiksnim efektima). Nalazi su dovoljno intrigantni pa možemo biti sigurni da će netko poželjeti replicirati rezultate s promijenjenim uzorcima država, razdoblja i metodama ocjene. Tek tada ćemo znati koliko su zaključci robusni.
Treće, zavisna varijabla (promjena relativnog mortaliteta) može se definirati na druge načine koji (možda) mogu utjecati na rezultat. Netko će to sigurno ispitati, kao i alternativne specifikacije varijabli i modela. Ono što modelu sigurno nedostaje je jasnija kontrola efekta očekivanja.
Istraživači s pro-lockdown stavom vjerojatno će postaviti hipotezu da 1-2 tjedna vremenskog pomaka učinka mjera na mortalitet nije prekratko razdoblje ako ljudi mijenjaju ponašanje 2 tjedna prije restrikcija u očekivanju njihova uvođenja. To znači da sama mogućnost (prijetnja) lockdowna može imati anticipativni učinak. Međutim, toj tezi se može prigovoriti na dva načina. Prvo, tako dugačak efekt anticipacije nije realan, osobito u prvom valu kada se sve odvijalo jako brzo (i bilo je posve novo); sjetimo se da je Vili Beroš potkraj veljače izjavio kako je riječ o uobičajenoj sezonskoj respiratornoj bolesti, a Rudan je 1.3. u NU2 uspoređivao rizike s prometnim nesrećama dok je Štagljar računao vjerojatnosti koje su slične kao kod gripe. Slično je bilo i u drugim zemljama. Tko je očekivao „kineski pristup“ dva do tri tjedna ranije? Drugi prigovor efektu anticipacije je taj što ga je lako zamijeniti s efektom samoregulacije i samodiscipline. Kad se zaraza počne širiti i ljudi su informirani o tome spontano će postati oprezniji bez obzira na anticipirani intenzitet restrikcija koje će uslijediti za dva tjedna. Treći efekt anticipacije koji nije obuhvaćen istraživanjem tiče se predviđanja samih kreatora politike koji donose mjere. Prava zavisna varijabla trebala bi biti konstruirana tako da se modelski generira predvidiv mortalitet bez mjera i onda se analizira učinak mjera na razliku stvarnog i očekivanog mortaliteta. Jako komplicirano, ali moći će se implementirati u istraživanjima drugog vala.
Četvrto, modeli na panel podacima uprosječuju parametre za pojedine zemlje. Prave jedinice analize su države i regije i najbolje informacije ćemo dobiti ako radimo modele za pojedine države i regije koje mogu imati vrlo različite dinamike. A onda se otvara mogućnost za modeliranje prirodnog procesa zaraze i odstupanja koja su eventualno izazvana mjerama.
U svakom slučaju, utrka za spoznajom tek počinje. U sljedećih godinu dana će eksplodirati. BjØrnskovovo istraživanje ne treba tumačiti kao kraj nego kao početak rasprave u koju će se, što mi je osobito drago, konačno uključiti i ekonomisti.
Najvrjednijim zaključkom smatram autorovo zapažanje da se rezultati dobiveni ovakvim pristupom mogu značajno razlikovati od intuicije koja je razvijena na temelju medijskog praćenja pandemije pod utjecajem političkih i inih manipulacija i jednostavnih deskriptivnih statistika. Cherry-picking statistika koje potvrđuju apriorna uvjerenja ne vodi nikuda, jer za svaku Njemačku koju iz šešira izvlače pripadnici pro-lockdown kampa protivnici izvuku jednu Češku, za svaku Austriju postoji Slovenija, a za svaku Belgiju Irska (u drugom valu). Takvo se navođenje može nastaviti unedogled, a da se ne pronikne u skrivenu stvarnost procesa.
Ni sve mjere ni sve zemlje nisu iste, a neke stvari sigurno funkcioniraju
Očekujem da će različita istraživanja i dalje pokazivati različite rezultate i da će debata još dugo trajati. Jedan od razloga bit će sam problem mjerenja. Na početku pandemije, „zahvaljujući“ Kini, lockdown je prezentiran kao crno-bijela mjera, 0 ili 1, ili si za (full zatvaranje, „zero-covid“) ili si protiv („antivaxer“, „bioterorist“). Ta totalitarna (i po definiciji ne-znanstvena) perspektiva pronašla je snažne zagovornike upravo u dijelu znanstvene zajednice koja je propagandistički stala iza kineskog pristupa povukavši za sobom dobar dio glavnostrujaških medija i, posljedično, horde sljedbenika na društvenim mrežama. Zbog toga smo u jednom trenutku zaplesali na rubu nekog novog pandemijskog fašizma koji se na zastrašujući način prelilo na ukupan društveni ambijent, i koji je do dan-danas ostao teško zaražen netolerancijom (iako je situacija, barem u Hrvatskoj, neusporedivo lakša u usporedbi s proljećem 2020.).
Ima i nastavak kada već radimo retrospekciju: s pojavom Oxfordovog indeksa restriktivnosti (vrlo brzo nakon početka pandemije), čiji su elementi korišteni i u ovom istraživanju, te usporedo s rastom spoznaje o tome koliko se s mjerama i procjenama u početku lutalo, rasprava je postala malo rahlija i mekša, ali su stvarne restrikcije i njima inducirana ponašanja (koji su vjerojatno utjecali na tempo pandemije i smrti od COVID-19) ostali izvan domašaja socijalnih mjernih instrumenata. Lutajući u takvom polumraku, sociolozi i politolozi su relativno rano postavili hipotezu da su vrlo restriktivne mjere kontraproduktivne ako dovode do društvenih otpora i podjela (resentiman?), jer je učinkovita društvena homogenizacija u borbi protiv pandemije moguća samo ako ljudi imaju povjerenje u vlast i mjere – ako im je jasno što se i zašto radi. Oštra polarizacija i zahtjevi za ekstremnom represijom stoga vjerojatno nisu pomogli učinkovitosti mjera.
Zaključno, još uvijek je puno loptica u zraku; mnoge mogu neočekivano pasti. Ako bih trebao zaključiti priču o ovome papiru, rekao bih da sadrži indicije o tome da lockdown mjere nisu bile učinkovite na početku pandemije te da dileme i mjere koje su nam tada bile predstavljene nisu bile predstavljene na razborit način.