Kurt Barbé en zijn modellen. Deel 2 : de modellen

Waar zijn nu eigenlijk Kurt Barbé zijn modellen op gebaseerd? Op zijn Facebook pagina alsook in de Artsenkrant en de Apotheker schermde hij met termen als zou hij de vergelijkingen van Kermack-McKendrick oplossen. Op Wolfram Mathworld kan u terugvinden dat dit een model is van drie gekoppelde, niet lineaire differentiaalvergelijkingen. Gekoppelde differentiaalvergelijkingen zijn vaak niet analytisch op te lossen en vereisen een numerieke oplossing (=typisch dus via de computer met een bepaald rekenschema). Het Kermack-McKendrickmodel is één van de eenvoudigste SIR modellen, SIR modellen zijn modellen om het verloop van een epidemie te modelleren.

Begin april ergens ontdekte ik de Facebook pagina van professor Barbé. Ik maakte bepaalde kritische opmerkingen over de gebruikte data (zie deel 1, de problematiek met actieve besmettingen) en vroeg verduidelijking naar het gebruikte model aangezien ik naast burgerlijk ingenieur van opleiding ook .NET programmeur ben en zelf bepaalde modelleringen eens wou uitproberen. Mijn opleiding en doelstelling vermeldde ik er echter niet bij en vermoedelijk omdat professor Barbé mij te dom achtte om er een snars van te begrijpen, stuurde hij mij in een privé bericht een drie pagina's tellend pdf-document door met zijn gebruikte modellering. Hier heb ik onderstaande afbeelding van gemaakt:

Het originele model : trek gewoon een gaussiaan door de data.
Op niveau beginnende ingenieursstudenten / wetenschapsstudenten zal ik proberen samen te vatten wat hij hier juist doet: in een eerste stap blijkt hij via één of andere onduidelijke "reparametrisatie" / hocus pocus waarbij tussenstappen worden overgeslagen de drie gekoppelde Kermack-McKendrick differentiaalvergelijkingen te reduceren naar één enkele vergelijking.



Dan maakt hij een veronderstelling (zonder bronverwijzing of andere rechtvaardiging) dat I(t) kan vereenvoudigd worden tot een polynoom:

Dan stelt hij: simpel is beter en hupsakee zegt hij dat een polynoom van de eerste graad maar moet voldoen. Dan bekomt hij onderstaande differentiaalvergelijking die hij om de één of andere reden numeriek wenst op te lossen met een Euler differentie schema.


Die differentiaalvergelijking is echter perfect analytisch oplosbaar aangezien die gewoon een niet-canonische vorm is van de differentiaalvergelijking voor een normale distributie. Dit betekent dat de oplossing een Gaussiaan is van de onderstaande vorm (x te vervangen door t):


Wat verderop strooit hij nog met Levenberg-Marquardt en de Nelder-Mead simplex methode om via de kleinste kwadratenmethode de curve te vinden die het best door de data past. Wanneer ik opmerk dat:

  1. dit helemaal geen echt gebruik is van de Kermack-McKendrick vergelijkingen
  2. dit hele verhaal eigenlijk supersimpel neerkomt op de drie parameters a, b en c te vinden van een Gaussiaan die het best passen bij de geobserveerde data
  3. dat daar een dozijn andere methodes voor bestaan
  4. om het erger te maken zelf op een paar tiental minuutjes een C# programma schrijf om hetzelfde te doen maar brute force op een 3D rooster de optimale a, b en c bepaal met least square fitting
ontsteekt Barbé in een woedende colère dat ik zijn werk minimaliseer en dat de secret sauce zit in de Levenberg-Marquardt en de Nelder-Mead simplex methode en blokkeert hij mij op Facebook. 

Enfin, nu u weet dat hij gewoon overal gausscurve door probeert te tekenen, kunnen we eens bekijken en analyseren wat hij al allemaal aan pseudo-wetenschap heeft uitgekraamd. Dit is een herhaling van deel 1 maar nu we zijn "model" kennen, kunnen we beter analyseren welke overduidelijke fouten en simplificaties ons VUB orakel heeft gemaakt.

Een eerste grafiek die we herbekijken, is deze bij het HLN artikel van 14 maart. Het is overduidelijk voor wie er iets van kent, dat een best fit Gausscurve modelleren door het oplopende deel links, zeer gevoelig is aan de juistheid van de data en de ruis erop. Origineel was het zeer moeilijk om getest te worden en later was het aantal testen zwaar onvoldoende wat tot politieke discussies leidde. Dat was toen al allemaal gekend dus zijn bewering van 45.000 positieve tests met een piek begin mei ergens was een bullshit voorspelling en dat besefte hij waarschijnlijk zelf. Vier dagen later al paste hij zijn voorspelling aan naar 25.000 positieve tests maximum. Dit waarschijnlijk op arbitraire wijze zonder dat de bijkomende datapunten noemenswaardig andere resultaten gaven.

Het orakel van de VUB voorspelt piek 45.000 besmettingen begin mei, 20 maal hoger en 3 weken later dan in werkelijkheid 
Een tweede grafiek is zijn waardeloze voorspelling voor de "actieve positieve besmettingen" van op zijn Facebook (linkergedeelte), naast de uiteindelijke reële curve (rechtergedeelte). De reële curve ging nooit terug naar nul aangezien er gewoon geen data worden bijgehouden in dit land van genezingen (enkel het aantal ontslagen uit de hospitalen) en dat wist Barbé eigenlijk ook wel. Dit model is dus eveneens waardeloos.


Links de voorspelling op zijn Facebook die rond 11 april nog goed leek, rechts het uiteindelijke resultaat 

Een derde grafiek is zijn voorspelling in het HLN artikel van 14 april voor het aantal overlijdens. Nu in dit deel aangetoond is dat hij een gausscurve met drie parameters best probeert te passen door de data en gezien de welbekende eigenschap dat deze curve symmetrisch is, kan eigenlijk het kleinste kind de uitkomst van dit model voorspellen: het zal ongeveer twee maal de waarde zijn van het geobserveerde cumulatief aantal doden tot de piek. Hier is dus geen computerberekening voor nodig.


Tenslotte is er de grafiek met de beruchte apocalyptische voorspelling voor de tweede golf / het tweede rimpeltje. Hier is duidelijk dat hij overgestapt is op een andere modellering voor de eerste rode curve die over de werkelijke data gefit is. Ik ben op dit confidentieel document gestoten en het lijkt erop dat hij eindelijk door heeft wat ik hem al lang geleden heb gezegd op Facebook: dat de analytische oplossing inderdaad een gausscurve is en dat door lockdownmaatregelen (en eigenlijk ook zonder, zie Zweden) de curve niet noodzakelijk op dezelfde manier naar beneden gaat als die naar boven is gegaan. Zijn "nieuwe" aanpak lijkt erin te bestaan gewoon twee aparte gausscurves aan elkaar te plakken om ook skewness mee te kunnen nemen. Zie de rode grafiek die duidelijk een skewness heeft.

De zwarte grafiek voor de tweede golf is echter nog steeds een symmetrische gausscurve. Zowel de rode curve die de data moet fitten als de zwarte die de tweede golf moet voorstellen, lijken verder vermenigvuldigd te zijn met een functie (1 + A*sin(B*t + C)). Indien ik eens tijd zat heb (en dat heb ik in tijden van technische werkloosheid), zal ik eens zelf proberen zowel de rode als zwarte curve na te bootsen en te kijken welke functie en parameters hij heeft gebruikt voor de bijkomende golving.

Comments

Popular posts from this blog

Wie doxte de gegevens van de familieleden van de Reuzegommers?

Sloop de Humo betaalmuur, geprogrammeerd door mongolen voor mongolen

Lees De Morgen gratis (Chrome)