En analyse av korona-data i Norge (oppdatert)

TM: Jeg fikk dette innlegget tilsendt av en leser. Forfatteren har doktorgrad i miljøtoksikologi, men foretrekker å være anonym.  (Jeg har ikke spurt hvorfor, men mange av helseekspertene jeg har sitert i tidligere artikler har påpekt at den tilsynelatende faglige enigheten skyldes at mange kolleger velger å ikke si noe fordi de frykter stygge konsekvenser for karrieren.)

Artikkelen her om det statistiske grunnlaget er godt kildebelagt og gjennomtenkt. Skal man kritisere den, så gjør det på grunnlag av spesifikke feil i analysen.

Skrevet 28. mars 2020, sist oppdatert 7. mai 2020

Siden vi hører så mye forskjellig om korona har det blitt vanskelig å finne ut hvem og hva man kan og skal tro. Her kommer derfor min vurdering basert på de tallene vi får hver dag fra Folkehelseinstituttet (FHI).

Før man går i gang med å lage statistikk, må man alltid spørre hvor tallene kommer fra, hva de sier. I tilfellet med korona-tallene er det slik at det er egentlig umulig å lage statistikk, siden det er en del grunnleggende problemer allerede før tallene blir generert:

1. Selve testen for “å teste for korona” som blir brukt i hele verden – en PCR-test – kan ikke finne et virus. PCR finner delstykker av DNA eller RNA. For å finne RNA av et bestemt virus, må man vite basesekvensen RNA-en vil inneholde, og så lage en primer som har den komplementerende sekvensen. De som lagde testen skriver i den originale publikasjonen (1) at de brukte seks forskjellige koronaviruser fra samme familien til å lage en primer og at testen finner dermed «relatively distant members of the SARS-related CoV clade suggest[ing] that all Asian viruses are likely to be detected».

Altså: ikke bare korona-viruset SARS-CoV-2 som den heter, for det er ikke mulig å isolere et virus med denne metoden. PCR har utrolig høy sensitivitet, dvs. den finner svært små konsentrasjoner av DNA eller RNA.

Men: testen finner absolutt alt som har akkurat den valgte basesekvensen og et kjent og faktisk omstridt problem med PCR er at den finner mange falske positive resultat. Det vil si, PCR gir positivt resultat når primeren har bundet seg til et DNA eller RNA-stykke, helt uten at det nødvendigvis var fra hva man lette etter.

Selv når PCR riktig finner et virus-RNA-stykke, kan testen ikke si om viruset er intakt eller infeksiøst. Testen sier rett og slett bare at et DNA- (eller RNA) stykke ble funnet som har akkurat den komplementere sekvensen som primeren. Ofte er dette nok for å kunne støtte en hypotese om at et bakterium eller virus er til stede, men det er ikke nok for å kunne bevise det. Den testen som nå blir brukt ble aldri klinisk (dvs. med ekte pasienter) validert og ble godkjent i all hast av WHO kun få dager etter den originale publikasjonen kom ut.

2. Så langt ble bare personer som viste symptomer testet. Dermed er det umulig å si noe om hvordan viruset sprer seg i befolkningen fordi kun en svært liten del av befolkningen ble valgt ut til testing. Den delen av befolkningen som blir testet representerer ikke hele befolkningen (Figur 1).

3. Døde og syke havner i korona-statistikken uten at det blir verifisert om koronaviruset var årsaken til at de ble syke eller døde (2). Det kan like så godt være at PCR-testen viser et positivt resultat mens pasienten er syk pga. av f.eks. en akutt bakteriell infeksjon eller en influensa-infeksjon. Med de aktuelle tallene blir også de telt som «korona-døde» som mest sannsynlig døde av andre alvorlige sykdommer men viste positivt i korona-testen.

4. Vi mangler differensialdiagnostikk for personer med symptomer. Dette er viktig for å kunne si noe om forekomst av korona-viruset (hyppighet sammenliknet med andre viruser som gir luftveissymptomer).

5. Tallene har vært offentlig i veldig kort tid og ble kanskje ikke dobbelsjekket.

Figur 1: En oversikt over hvem ble tatt prøver av: blå (l) inneliggende pasienter, oransje (P) helsepersonell og (U) «andre» (ikke nærmere spesifisert). Grafikken ble publisert i FHI’s korona-ukerapport den 19.03.2020.

 

Men, uansett, jeg skal prøve å lage litt statistikk. Alle tall bør ses i relasjon til befolkningen i Norge (3), som er 5,3 millioner. Av de har vi så langt testet kun 1,5% (28.03.2020).

Folkehelseinstituttet (FHI) publiserer hver dag antall testete og antall positive (4). Se Figur 2 nedunder.

Det som er fint er at FHI har tegnet en kurve med prosentandel positive prøver i det samme diagrammet. Det har forundret meg at denne kurven faktisk ikke er uavhenging av hvor mange prøver ble tatt: i helgene (14./15. og 21./22. mars) ble ikke mange testet og prosentandelen positive går opp de dagene. Omvendt er prosentandelen positive lavere når mange ble testet (f.eks. 15.-20. mars). Det viser oss at vi bør betrakte alle positive tilfeller som blir meldt hver dag i relasjon til hvor mange ble testet – fordi den variablen ikke er uavhenging, som det heter.

Helt konkret: vi bør se på antallet positive i prosent av det totale antallet testet. Og siden de to variablene er relatert med hverandre er det lurt å lage et diagram med x-aksen total antallet tilfeller og y-aksen prosentandelen positive (med andre ord: antallet positive tilfeller i avhengighet av hvor mange som ble testet). Det alltid er lurt å vite hva som kan forventes før man ser resultatet.

Figur 2: Hentet fra FHI4.

Hva kan vi forvente når vi tegner et diagram med prosentandelen positive tilfeller i avhengighet av antall prøver tatt? Det finnes fire muligheter (Tabell 1, Figur 3):

Tabell 1: Mulige scenarioer når prosentandelen positive prøver er fremstilt i avhengighet av totalt antall prøver.
Scenario Mulig tolkning
1) Vi ser en datasky helt uten mønstre. Variablene er ikke relaterte. For eksempel kan dette skjer når testen er uegnet.
2) De kan vise seg at forløpet er konstant. Prosentandelen positive går hverken opp eller ned uansett hvor mange vi tester hver dag. Begge variabler er i lineært sammenheng med hverandre. Et eksempel: når vi tester 400 får vi 40 positive (10%) og når vi tester 3-ganger så mange, 1200, får vi 120 positive (10%). Når dette er tilfellet, kan vi med sikkerhet si at viruset ikke sprer seg eksponentielt, for da ville vi har sett en økt prosentandel positive (eksponentiell betyr at økningen øker!). En annen mulig interpretasjon er at det finnes allerede immunitet i en del av befolkningen, dog ikke hos alle.
3) De kan vise seg at kurven går opp. Prosentandelen positive stiger med økt antall testete. Jo flere vi tester, jo flere positive resultat finner vi, men utover det proporsjonale. For eksempel: vi tester 400 og får 40 positive (10%), vi tester 1200 og får 240 positive (20 %). Når dette er tilfellet, så snakker vi om eksponentiell vekst. Hvis tallene viser dette, så er det egentlig for sent for å gjøre noe, for da vil spredningen allerede har skjedd (ellers ville vi ikke ha kunnet oppdage det). Men: et slik forløp vil også vises når det er et høyt antall av falske positive prøver (grunnet selektivt prøvetaking eller falske positive testrestultater).
4) De kan vise seg at kurven går ned. Jo flere vi tester, jo mindre positive finner vi. Er dette tilfellet, kan vi trolig si at viruset sprer seg ikke (lengre). Variablene er negativ korrelert med hverandre. Siden et virus ikke plutselig dør, er den eneste forklaring på et scenario som dette at det finnes immunitet i befolkningen (dvs. immunsystemet «kjenner» viruset). Men: et slik forløp vil også vises hvis kun friske personer blir testet eller testen viser falske negative resultater (testen er negativ selv om den skulle ha vist positiv).

Se på Figur 3 som illustrerer mulighetene hvordan prosentandelen positive kan være avhengig av antall tester totalt.

Figur 3: Tre mulige scenarioer for hvordan andelen av positive prøver kan være relatert til antallet prøver tatt totalt. A) Er andelen positive prøver konstant, så er antall positive prøver proporsjonalt til antallet prøver tatt. B) Er andelen positive prøver stigende (lineært eller ikke-lineært), så er dette indikasjon for eksponentielt økning. C) Faller kurven og tilnærmer seg en grenseverdi, er variablene negativ korrelert med hverandre.

De publiserte tallene fra FHI viser at prosentandelen positive prøver blir mindre jo flere prøver ble tatt (Figur 4). I statistisk fagspråk kalles dette at variablene er negativ korrelert. Fra 16. mars ble en stor andel helsepersonell testet (5) og derfor kan disse dataene ikke direkte sammenlignes med tall fra før (derfor plottet med ulik farge i Figur 4). Uansett viser begge kurvene det samme bildet.

Dette betyr at verdien positive prøver vil trolig bevege seg mot en grenseverdi som vil ligge ved eller under 2% jo flere vil bli testet (se i figur nedenfor: omtrent 2% positive prøver når mer enn 6000 prøver ble analysert).

Andelen positive kan kun tilnærme seg en grenseverdi hvis antall positive er mindre enn proporsjonal til det økte antallet tester (f.eks: 40 av 400 er positive (10%), men når 4000 ble testet er kun 200 positive (5%) – et proporsjonalt resultat ville bety at vi forventer 400 positive når vi tester 10 ganger så mange). Dette er kun mulig hvis det er immunitet i deler av befolkningen (immunitet betyr at det menneskelige immunsystemet klarer å ødelegge viruset før den sprer seg voldsomt i kroppen, slik at det ikke gir symptomer og stykker av virusets RNA kan ikke påvises med en PCR-test), siden på det tidspunktet, hvor kun mennesker med symptomer blir testet, kan vi med sikkerhet går ut fra at denne observasjonen ikke skyldes at kun friske ble testet (som ville ha ført i større grad til funn av negative prøver) eller at testen har dårlig sensitivitet og viser alt for mange falske negative (motsatt, PCR har svært høyt sensitivitet).

figur4
Figur 4: Prosentandel positivt testete i avhengighet av hvor mange ble testet. Tallene for de grå punktene er direkte tatt fra Figur 1 fra FHI. Svarte punktene viser data fra FHI daglige korona-rapporter (4) fra 16. mars 2020 med nye testprioriteringer.

 

 

Åpenbart er dette ikke bare et norskt fenomen. Tallene fra Island viser faktisk det samme bilde (Figur 5).

Island
Figur 5: Island: Prosentandel positive prøver i avhengighet av hvor mange ble testet.

 

 

Men, hvorfor da ser vi alle de eksponentielle kurvene i media? Svaret er simpel: fordi tallene ble vist som absolutte tall og kumulativt (oppsummert dag for dag) og ikke som prosentandel positive av alle testete. Dermed forsvinner hvor mange ble testet helt – HELT! Men, som vi jo kan se helst fra FHIs egne rapporter (Figur 2) har det veldig mye å si hvor mange blir testet hver dag. Med akkurat de samme tallene som i Figur 2 kan jeg produsere det bilde vi får sett i media (Figur 6).

 

Figur6-Norway_cumulative_positives
Figur 6: Antall positiv testete (kumulativ).
Sykehusinnleggelser

En vurdering av farligheten av et virus ta hensyn til både (a) hvor mange blir smittet og hvor raskt og (b) hvor mange får symptomer og/eller blir syke.

Farligheten er alltid en kombinasjon av patogenitet (i hvilken grad et virus kan forårsake en sykdom) på den ene siden og kroppens immunforsvarsreaksjon på den andre siden. I tilfellet SARS-CoV-2, vet vi alt for lite om det. En fransk studie påpeker at SARS-CoV-2 ser ut til ikke å være mer farlig enn andre kjente koronavirus: «SARS-CoV-2 infection cannot be described as being statistically more severe than infection with other coronaviruses in common circulation».(6)

Prøvetakingen på dette tidspunktet er, som sagt, ikke representativ (så langt, per 28.3.2020, er kun 1,5% av befolkningen testet). Kun få som ikke har symptomer blir testet. Derfor er det mest hensiktsmessig på dette tidspunktet nå å se på (i) om antall innlagte på sykehuset med luftveissymptomer og positiv SARS-CoV-2-test stiger og (ii) om dødeligheten overstiger tallene fra de siste årene i samme tidsrom.

Trolig ble inntil nå hovedsakelig personer på sykehus og sykehjem testet. Mest interessant er å se på om flere pasienter enn vanlig på denne årstiden (med eller uten sesongbetont influensa) trenger intensivbehandling. For å kunne gjøre det, ville en trenge tall over mange ble intensivbehandlet med luftveissymptomer i de årene før – men de tallene er ikke tilgjengelige. Derfor er det lite meningsfullt å se på absolutte tall av korona-innlagte.

Det eneste som kanskje kan gi oss litt informasjon er å se på tidsforløpet av andelen innlagte av alle som tester positivt (%), slik at tallene kan sammenliknes over tid (siden antall positive er avhenging av hvor mange som ble testet, er det nødvendig å se på prosentandelen positivt testete innlagte). Denne måten å analysere innleggelsestall på er begrenset, siden en positiv PCR-test ikke nødvendigvis er årsaken til intensivbehandling. For å så kunne se om antallet positivt testete intensivinnleggelser øker over tid, må ikke kumulative tall, men helst tallene av daglig nyinnlagte vurderes. Disse daglige tallene bør settes i relasjon til alle som er positiv testet (dvs. daglig sum over alle positivt testete), men minus alle friskmeldte, døde og allerede innlagte på intensivavdelinger. Dette er nødvendig for å ta hensyn til at alle som tester positivt teoretisk sett kunne bli alvorlig syk. Samtidig bør man se hvordan prosentandelen som tester positivt av alle testete utvikles over tid.

Figur7_hospitalized
Figur 7: Andelen pasienter innlagte på intensivavdelinger av alle som testet positivt (minus friskmeldte, døde og allerede innlagte) (svarte punkter) og prosentandelen positiv-testete (kumulativt) av alle testete så langt (grå). Til høyre: Andelen av intensiv-innlagte pasienter i et eget diagram.

I et såpass kort tidsrom (med data fra 14.3.-27.3.2020) har en slik analyse veldig begrenset verdi. Uansett vil man dog kunne oppdage trender. Ser vi på figur 6 og prosentandelen positiv-testete innlagte på intensivavdelinger, kan vi ikke ser hverken stigning eller nedgang. Det kan har årsaken i at pasienter som har blitt alvorlig syke med Covid-19 havner på intensivavdelinger først etter noen dager. En annen grunn kan være at nyinnlagte på intensivavdelinger ble testet positiv for SARS-CoV-2, men er i intensivbehandling på grunn av andre årsaker og antallet daglig nyinnlagte positiv-testete viser den naturlige variasjonen i intensivinnleggelser.

Prosentandelen med positiv test som daglig blir innlagt på intensivavdelinger, viser ikke noen trend så langt. Samtidig minsker prosentandelen av positiv-testete som del av alle testete (kumulativt) i perioden 16.-23. mars) og så stiger igjen til 4,7%. Hadde det vært en sammenheng mellom antallet som testet positivt og antallet som testet postivt på intensivavdelinger, så ville de to kurvene har vist samme forløp med litt tidsforskyvning. Det vil si: ser vi en stigning i prosentandelen av positiv testete av alle testete, skulle dette ha som konsekvens at litt senere også prosentandelen positiv-testete innlagte på intensiv skulle øke. Dette ser vi så langt ikke.

Dødelighet

Så langt (28.3.2020) er det meldt 20 dødsfall med en positiv SARS-CoV-2 testresultat. Gjennomsnittsalderen til de avdøde er 84 år. Dødsårsaken er ikke nevnt.

I Norge har gjennomsnitts-antall dødsfall3 over de siste tre årene vært 40742/år, tilsvarende 784 døde per uke. Siden dette er et gjennomsnittsverdi, kan jo antall av dødsfall per uke variere betraktelig, men de gir et verdi vi kan sette de aktuelle tallene av “korona-døde” i relasjon til. 20 Dødsfall på 2 uker tilsvarer 1,28% av alle ukentlige dødsfall som statistisk sett kan forventes. Med andre ord: tallene er langt fra bekymringsverdige.

Konklusjon

Korona-tallene for Norge – selv om de ikke kan stoles på viser ikke antydning til en epidemisk situasjon. Dødeligheten har ikke økt og antall pasienter innlagt på intensivavdelinger har så langt ikke vist seg å være i sammenheng med antallet som testet positivt.

Men: vi må følge nøye med utviklingen fremover, først og fremmest fordi Norge har veldig begrenset kapasitet på intensivsenger (kun 4,7 per 100.000 innbyggere)6.


Kilder:

1) https://www.who.int/docs/default-source/coronaviruse/wuhan-virus-assay-v1991527e5122341d99287a1b17c111902.pdf?sfvrsn=d381fc88_21

2) [accessedhttps://www.nrk.no/norge/er-bekymret_-diabetesforbundet-vil-vite-hvorfor-ofrene-dor-av-korona-1.14961837 03.04.2020]

3) www.ssb.no

4) https://www.fhi.no/sv/smittsomme-sykdommer/corona/dags–og-ukerapporter/dags–og-ukerapporter-om-koronavirus/

5) https://www.fhi.no/contentassets/ca5914bd0aa14e15a17f8a7d48fa306a/vedlegg/ukerapporter/2020-03-21-ukerapport-covid-19.pdf

6)https://www.nrk.no/vestland/mener-helsemyndighetene-overdriver-intensivkapasiteten-i-norge-1.14938514

(accessed 28.03.2020)

https://www.sciencedirect.com/science/article/pii/S0924857920300972

 

 

3 kommentarer

Legg igjen en kommentar til Norsk anonym spesialist: Ingen tegn til Korona-epidemi i Norge. - Derimot Avbryt svar

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut /  Endre )

Google-bilde

Du kommenterer med bruk av din Google konto. Logg ut /  Endre )

Twitter-bilde

Du kommenterer med bruk av din Twitter konto. Logg ut /  Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut /  Endre )

Kobler til %s