De modellering van de tweede golf door het SIMID COVID-19 team

In een aantal vorige posts hebben we gezien hoe ergens een biostatisticus van mijn botten voorspellingen maakte voor de tweede golf, niet gebaseerd op enige data of enig eigen model maar op de resultaten van deze paper: Modeling the early phase of the Belgian COVID-19 epidemic using a stochastic compartmental model and studying its implied future trajectories. Hier wordt een iets complexer (understatement) model gebruikt dan simpelweg een Gausscurve door de data te fitten. Ik vind de inhoud van deze paper zeer interessant en wil deze even bespreken.

Methodologie

1. Wiskundig model

In deze paper wordt een SEIR-model gebruikt. Dit is een model  waarin personen door vier stadia gaan: Susceptible (S) oftewel ontvankelijk, Exposed (E) oftewel blootgesteld, in de incubatiefase, Infected (I) oftewel geïnfecteerd en Recovered (R) oftewel hersteld / immuun. Doodgaan is natuurlijk ook een mogelijkheid. Zie Wikipedia voor wat meer info. 

In deze paper wordt een iets meer uitgewerkt model gebruikt waarin men na de incubatieperiode in E eerst door een presymptomatische fase gaat in I_presym, daarna ofwel asymptomatisch is in I_asym ofwel symptomatisch met milde symptomen in I_mild. Dan bestaan er twee mogelijkheden: ofwel kan men hiervan herstellen (naar R - recovered gaan) ofwel ernstige symptomen ontwikkelen in I_sev. Bij de ernstige symptomen wordt weer opgesplitst in twee takken: men komt in het ziekenhuis terecht als gewone patiënt in I_hosp of op de intensive care unit in I_icu. Elk van deze twee takken biedt dan weer twee mogelijkheden: herstel in R of dood in D. 

Dit wordt in de paper in onderstaande figuur geïllustreerd en de wiskundige vergelijkingen worden gegeven die de snelheid en kans bepalen om van de ene toestand in de andere over te gaan. Dit zijn allemaal gekoppelde eerste orde differentiaalvergelijkingen en dus niet zo complex. Er wordt wel gewerkt met tien aparte leeftijdscategorieën (0-9, 10-19, ..., 90-99+) dus zijn S, E, I, R en dergelijke wiskundig gezien vectoren met grootte 10.

In de rood gekleurde compartimenten wordt men besmettelijk verondersteld. In de incubatieperiode niet en in het ziekenhuis ook niet wegens geen echt contact meer met de ruimere omgeving.

Een heel belangrijke vector uit bovenstaande figuur waarvan de waarde ietwat verstopt zit in één van de appendices, is p, die de kans aanduidt dat een presymptomatische besmetting een asymptomatische wordt. We zien dat in de leeftijdscategorie van 0 tot 30 jaar dit zowat 90% van de mensen is en pas boven de 50 jaar echt snel onder de 50% zakt. Er wordt weliswaar verondersteld dat asymptomatische mensen slechts 51% zo besmettelijk zijn als symptomatische, maar gezien van 0-30 jaar 90% van de gevallen asymptomatisch zijn, lijken asymptomatische besmettingen in deze paper de hoofdmotor van de  epidemie. Vermoedelijk omdat dit een nogal controversieel politiek en wetenschappelijk topic is met de WHO die het tegendeel beweert, wordt dit hier wat weggemoffeld.

Appendix B.2


2. Sociale contactgegevens

De vergelijkingen die aangeven hoe iemand besmet raakt, vereisen gezien de tien leeftijdscategorieën een 10 x 10 matrix voor hoe de leeftijdscategorieën met elkaar interageren. Deze gegevens over sociale contacten, komen uit een Vlaams onderzoek van 2010.

Verder wordt verondersteld dat symptomatische mensen zich anders gedragen dan asymptomatische, gezien symptomatische mensen door ziekte bv. niet meer naar het werk of school gaan (de bijdrage van de contactmatrix voor school en werk zakt tot <9% van de oorspronkelijke waarde, de waarden voor α,  β en ρ worden helaas niet gegeven). Ook dit lijkt dus weer aan te geven dat asymptomatische mensen de motor van de epidemie zijn. De precieze waarde van de submatrices voor school, werk, ontspanning, transport en andere wordt helaas niet gegeven in deze paper, maar de matrix voor de asymptomatische besmettingen vallen toch terug te vinden, weer enigszins verstopt in de appendices. 





Als we de waarden in de matrices voor de sociale contacten bekijken van asymptomatische mensen, dan zien we de hoogste waarden logischerwijze op de hoofddiagonaal aangezien mensen vooral interageren met mensen binnen eenzelfde leeftijdscategorie. Het aantal sociale contacten neemt eveneens te verwachten boven de leeftijd van 20 jaar stelselmatig af met de leeftijd. Gezien jonge mensen het meeste sociale contacten hebben, in 90% van de gevallen asymptomatisch zijn en de waarden in de asymptomatische contactmatrix stukken hoger zijn dan in de symptomatische contactmatrix, is duidelijk dat asymptomatische mensen de hoofdmotor van de epidemie zijn ondanks dat ze slechts 51% zo besmettelijk zijn, ook al wordt dit nergens in deze paper vermeld.

Het zou interessant zijn geweest, mochten de auteurs in hun broncode hebben bijgehouden hoeveel besmettingen asymptomatische mensen veroorzaken. Het zou mij niet verwonderen dat dit makkelijk 90% tot (gezien het exponentieel multiplicatief proces) 99+% van de besmettingen zijn. Vermoedelijk vermits dit politiek en wetenschappelijk controversieel is, wordt dit niet vermeld. Het is eveneens onmogelijk de volledige bevolking die geen symptomen vertoont systematisch te testen.

3. Infection Fatality Rate (IFR)

De Infection Fatality Rate werd bepaald op basis van bloedtesten uit antistoffen en zit ook ergens in een appendix. Hier wordt zelfs voor 90+ ers een IFR van ~5% gegeven. De totale IFR ligt hiermee rond de ~0.5%. De reden lijkt te zijn omdat de epidemie in de wzc's als een aparte epidemie en de mensen in de wzc's hier niet in zijn meegerekend.


Infection Fatality Rates van o.a. Geert Molenberghs en Niel Hens wordt dit verduidelijkt dat de IFR voor de mensen in de rusthuizen gaat van 41 tot 73% voor mannen en van 24 tot 37% voor vrouwen. Dit lijken toch wel extreem hoge cijfers. In ieder geval doet hiermee rekening houden, naar verluidt de IFR stijgen van ~0.5% naar ~1.25% voor de gehele bevolking.


4. Interventiemaatregelen

Deze paper wil verder - bij gesloten scholen - het effect onderzoeken van het percentage contactreductie van werk en transport, bij een reductie van 90% van ontspanningsactiviteiten en andere activiteiten om de beste exitstrategie te bepalen, alsook het percentage reductie van contacten dat het best fit met de reële data tot dan toe.

Het is daarom echter zeer jammer dat de onderzoekers wel de sociale contactmatrices geven voor asymptomatisch besmetten, maar niet de submatrices C_home, C_work, C_transport, C_leisure en C_other in een appendix ergens. Dit had een meerwaarde kunnen zijn.

Resultaten 

1. Baseline scenario

Er wordt gevonden welk scenario van contactreductie het best past bij de huidige situatie, dit om dan het effect van verschillende exitstrategieën te kunnen bepalen. Dit wordt geïllustreerd in onderstaande figuur. Merk op dat het aantal doden veel lager ligt dan in werkelijkheid. Dit is omdat enkel de doden die niet in de rusthuizen vielen, worden meegerekend. De overlijdens in de rusthuizen worden door de onderzoekers immers beschouwd als een aparte epidemie. Dit is ook enigszins terecht, aangezien zowel de dodelijkheid, timing en verloop compleet verschillend zijn.

Aangezien de onderzoekers echter geen toegang hebben tot gegevens voor de ziekenhuisopnames al dan niet afkomstig uit de wzc's, zitten deze dan weer wel in de hospitalisaties opgenomen. Dit geeft duidelijk de beperkingen aan van dit soort simulaties om ook kwantitatief voorspellingen te doen als de data gebrekkig zijn.
De waarden voor de verschillende parameters die het best passen worden gegeven. Hierbij valt weinig op te merken, tenzij dan dat als beste waarde voor het aantal dagen tussen infectie en hospitalisatie een waarde van ongeveer 10 dagen wordt gevonden, terwijl mijns inziens ~13 à 14 dagen toch veel beter past. Iets wat ook uit simulaties van een andere onderzoeker volgt.

2. Exitstrategieën

Uitgaande van het baseline scenario, werd onderzocht van de verhoging van het aantal contacten, eerst bij gesloten scholen. Uit deze simulaties bleek vanaf welk niveau dit zou zijn. Wat wel vrij vreemd is, is dat in de andere simulaties, de epidemie niet volledig uitsterft. Dit lijkt weinig waarschijnlijk tenzij het reproductiegetal echt zeer extreem weinig boven 1 zou liggen, gezien het exponentieel toenemend aantal hospitalisaties bij een waarde boven 1.

Vervolgens werd het effect van een gedeeltelijke heropstart van de scholen gesimuleerd. Gezien de hoogste waarde voor het aantal sociale contacten in de sociale contactmatrix voor 10-19 jarigen is, valt te verwachten dat een (volledige) heropening van de scholen een zeer sterk effect zal hebben. Dit valt ook te zien in de simulaties. Ook hier is het weer zeer vreemd dat na half juli het aantal hospitalisaties niet terug exponentieel daalt en de epidemie stilvalt. 

 

Daarna werd het effect gesimuleerd van een heropening van de scholen op langere termijn, na 1 september. Interessant om zien, is dat de piek bij een hogere percentage heropening lager ligt, omdat het aantal mensen dat vatbaar is voor covid-19 lager ligt als al begin juni tot half juli een deel wordt opgebruikt. Vanuit dit oogpunt lijkt het mij een vergissing te zijn geweest om begin juni de scholen niet volledig te heropenen, aangezien het toch maar tot eind juni geweest zou zijn en dit een gunstig effect zou kunnen gehad hebben zowel op de mate van stijging van de hospitalisaties als de hoogte van de piek op het moment van schrijven midden oktober.
Ook hier geldt weer dat het extreem vreemd is dat de hospitalisaties half juli stabiel op hetzelfde niveau blijven, wat een waarde van het reproductiegetal zo extreem dicht bij 1 (gezien de exponentiële invloed) suggereert dat die totaal niet realistisch is.

Persoonlijke conclusies

  1. Asymptomatische, jonge mensen lijken de hoofdmotor van de epidemie in deze paper, alhoewel de onderzoekers dit vermoedelijk liever niet expliciet gezegd zien.
  2. Zelfs deze paper met een complex model met tien leeftijdscategorieën en sociale contactgegevens kan geen kwantitatieve voorspellingen doen, vermoedelijk gezien het gebrek aan data over hospitalisatie van mensen uit de wzc's en een gebrek aan kennis over hoe de epidemie daar start en verloopt. De epidemie in de wzc's wordt door de onderzoekers (terecht) als een aparte epidemie beschouwd.
  3. Het was beter geweest de scholen volledig te heropenen in juni, dit had een tragere stijging en lagere piek van de hospitalisaties nu als gevolg kunnen hebben.
  4. Het is jammer dat de afzonderlijke contactmatrices niet gegeven worden, anders zou bv. kunnen geëvalueerd worden of het aantal contacten beperken tot 3 in bv. C_leisure en C_other veel zou uithalen. Via de referenties valt te achterhalen dat deze in de tool op socialcontactdata.org te vinden zijn.
Update 03/11/2020: ik was oorspronkelijk van plan dit model dat zeer interessant leek, zelf te implementeren in Excel. Ik begon met de sociale contactmatrices over te nemen van socialcontactdata.org en stelde hiermee de "next-generation matrix" uit de paper op. Uit de berekening van de hoogste eigenwaarde volgt hieruit vervolgens de R0 waarde. Deze bleken echter niet overeen te komen met reële cases. In een interview uit de Knack van 28/10 lijkt dit ook geïnsinueerd te worden door biostatistici betrokken in deze paper.

Comments

Popular posts from this blog

Wie doxte de gegevens van de familieleden van de Reuzegommers?

Sloop de Humo betaalmuur, geprogrammeerd door mongolen voor mongolen

Lees De Morgen gratis (Chrome)