top of page
Search
  • jujukol

Tässähän alkaa tarvita jo datanlukutaitoja

Updated: Mar 29, 2021

(Editoitu 29.3.2021 klo 13:30 vaalien siirtoon liittyvän THL:n ennusteen osalta. Kiitos lukijoille palautteesta!)


Helsingin sanomat uutisoi tänään (Husin ja THL:n ylilääkärit: Tartuntamäärät ovat edelleen liian korkealla tasolla Uudellamaalla - Kotimaa | HS.fi) että covid19-tartunnat ovat edelleen liian korkealla tasolla - viimeaikaisista sulkutoimista huolimatta.


Haastatelluista HUS:in tartuntatautien ylilääkäri Asko Järvinen kommentoi mm. ”Jo ennen maaliskuun sulkutiloja tartuntojen nousukulma lähti taittumaan Uudellamaalla. Sen jälkeen on tultu tähän tasaiseen tilanteeseen tartuntamäärissä. Nyt kuitenkin näyttää siltä, että rajoitustoimet eivät ole riittäneet taittamaan tartuntamääriä selvään laskuun”. Samanhan hän kertoi eilen Ylen ykkösaamussa (Asko Järvinen | Ykkösaamu | TV | Areena | yle.fi) kommentein "[Nyt] vaikuttaa siltä, että kauhean paljon alaspäin [tartuntamäärissä] ei tulla, jos vertaamme tätä viikkoa edeltävään”.


Katsotaanpa hieman dataa. Kun olen jo jonkin aikaa suhtautunut kriittisesti päättäjiemme ja median datanlukutaitoihin, rakensin noin viikko sitten scriptit joilla saan THL:n julkistaman datan (Tilastot ja data - THL) suoraan koneelleni. Siten pystyn (analyytikoille tiedoksi: R-koodin avulla) tuottamaan siitä järkevää analyysiä. Tällä hetkellä olen seurannut vasta viikoittaista uusien tartuntojen määrää, mutta pienin koodimuutoksin mm. rokotusdatan saa uimaan vastaavasti.


Tällä hetkellä analyysini rullaavat siis covid19-tartuntoja viikkotasolla, kunnittain ja sairaanhoitoalueittain. Katsotaanpa miltä asiat oikean datan valossa näyttävät.


THL:n data (kuva 1) kertoo varsin hyvin että jälkimmäisen ravintolasulun (kutsun asiaa yksinkertaistaen näin, vaikka mukanahan oli muitakin toimia; eli myöhemmin tekstissä "sulku" tai "ravintolasulku") jälkeen luvut ovat lähteneet selvään tiputukseen. Viikoittaisten tartuntalukujen taso on pudonnut jo yli 20% siitä missä oltiin ennen sulkua. (Kuvasta näkee myös kevään 2020 sulkutoimien vaikutukset tartuntamääriin.)


Kuva 1. Covid19 uudet tartunnat (per viikko) koko Suomessa ja HUS-alueella



Sama kehitys on nähtävissä (kuva 2) kaikkien neljän suuren (yli 400.000 asukasta) sairaanhoitopiirin alueella. Tosin huomautuksella että Pohjois-Pohjanmaalla luvut menivät alas jo ennen sulkua. (Samassa kuvassa näkee kuinka suuret tartuntamäärät/alueen väestö eri sairaanhoitopiireissä on - erot ovat suuret)


Kuva 2. "Muutos näkyviin" (data-analyytikolle tiedoksi: method:loess, span 0,2)


Tasoittuiko kasvukulma jo ennen ravintolasulkua? Kyllä se tasoittui. Datalla ei voi sanoa miksi. Ehkä ihmiset muuttivat käyttäytymistään jo ennen sulkua. Talvilomat alkoivat. Ehkä ihmiset kävivät viimeisellä aukioloviikolla vähemmän ravintoloissa. Mutta lopputulema on että 1/tartuntamäärien kasvu tasoittui ravintolasulun aikaan, ja 2/sen jälkeen tartuntamäärät ovat pienentyneet.


Kuva 3. "Muutos näkyviin. Lokakuusta tähän päivään" (data-analyytikolle tiedoksi: method:loess, span 0,2)


Jos - tarkoitushakuisesti tai vahingossa- haluaa tarkastella tai ennustaa tartuntatilannetta pidemmällä keskiarvolla voi toki laskea asian koko vuoden aikajänteellä ja todeta että sama trendihän tässä jatkuu (kuva 4). Siinä ei kylläkään ole mitään järkeä jos halutaan tarkastella miten muutama viikko sitten toimeenpannut rajoitustoimet nyt purevat.


Kuva 4. "Ennuste suoraksi" (data-analyytikolle tiedoksi: method:loess, span 1)

Hallitushan on juuri parhaillaan päättämässä jatkaa ravintolasulkua 3:lla viikolla (Hallitus esittää: Ravintoloiden sulku jatkuu 18.4. saakka (valtioneuvosto.fi)). Mm. Pohjois-Karjala, Keski-Pohjanmaa, Kainuu ja Pohjois-Savo eivät esityksen mukaan kuulu sulkualueeseen. Kun (kuva 5) asiaa tarkastelee niin eipä Pohjois-Karjalan ja Kainuun tartunnat/väestö missään korkeissa luvuissa olekaan. Kysymys on enemmänkin miksi Lappi sitten olisi sulkualue.


Kuva 5. HUS, Lappi, Pohjois-Karjala ja Kainuu. (Huomaa y-akselin eri skaalat)





Kannattaa nyt tsekata mitä väitetään


Sanoisin että päättäjiltä, medialta - ja valitettavasti kansalaisiltakin - vaaditaan nyt todella hyvää datanlukukykyä. Muuten meitä viedään taas kun kuoriämpäriä.


Edellisen kerranhan vietiin, kun kuntavaalien siirtopäätös tehtiin (Ministeri jätettiin yksin selittämään vaaliensiirtoa, sitten vanha sairaus varoitti – "Tankki oli aivan tyhjä" - Suomenkuvalehti.fi). Vaikuttaa siltä että ministeri Henriksson laitettiin syntipukiksi siihen, ettei kukaan asiantuntijatiimissä osannut kertoa datasta ja kuinka sitä tulisi tulkita. Kysymys myös on paneuduttiinko ennustamiseen ollenkaan asian vaatimalla laajuudella.


Oikeustieteiden opintotaustalla derivaattaa pidempää matemaattista osaamista saatikka regressiomallin osaamista ei ole tarvetta oikeusministeriltä odottaakaan. Se on niiden tehtävä jotka on opiskelleet datamaailmaa derivaattaa pidemmälle. Aivan kuten oikeusministerin tehtävänä sitten oikeustieteilijänä on kertoa meille derivaatat osaaville miten hallintolain hyvän hallinnon periaatteet asiaan liittyvät ja mitä mitä merkitystä on perustuslakivaliokunnan kannanotoilla.


Vaikuttaa siltä että THL:n asiantuntijat tarjosivat oikeusmisterillemme melkoisen "hockeystick"-käyrän (kuva 6).


Kuva 6. "Näinkin voi ennustaa". (Lähde: HS)





THL:n ennustetta ei voi ainakaan monimutkaisuudesta syyttää. Excel-taulukko jossa on 4 riviä ja 10 saraketta. Kolme lukua Exceliin ja ne kertomaan ja siinä se, ennuste. Ennuste jolla päätetään suomalaisen valtiosäännön yhdestä keskeisestä asiasta, eli siitä pääsevätkö ihmiset äänestämään. 3 skenaariota eri R-luvuilla.


Kuva 7. "Ennuste jolla kunnallisvaaleja päätettiin siirtää". Lähde THL.


Maaliskuun 5 päivänä tehdyn THL:n ennusteen mukaan alhaisimmalla skenaariolla, eli R-luvulla 1,15 oltaisiin maaliskuun lopussa, 30.3.2021, noin 1500 uuden tapauksen päivävauhdissa. Nyt 28.3.2020 ollaan muuten (viikkokeskiarvosta laskettuna) noin 600:ssa uudessa tartunnassa per päivä (Kuva 8).


Kuva 8. "Keskimääräinen (viikkotasosta laskettu) uusien tapausten päivävauhti".



Tilaaja/lukija vaan ei tainnut ymmärtää että jos 90%:n tai 95%:n luottamusväliä ei pyydä, ei sellaista saakaan. Ja tuolloin ennustajan on turvallisinta kertoa koko skaala taivaasta manalaan. Aina osuu toteuma sitten ennustehaarukkaan. Paitsi nyt ei kyllä osunut edes alimman ennusteen yläpuolelle (alin ennuste 30.3.2021 oli 1509 tartuntaa per päivä, toteuma nyt noin 600 tartuntaa per päivä).


Tuota ylintä skenaariota (11170 tartuntaa per päivä) sitten ilmeisesti säikähdettiin ja vaalit siirrettiin. Tapahtui jo, eikä sille mitään enää voi. Toimenpiteessä ei demokratian osalta ole sinällään mitään uutta, istuivathan 1936 valitut kunnanvaltuustotkin vuoteen 1946. Silloinkin ajat olivat kovat. Ei ollut edes Exceliä.


Nyt ollaan tilanteessa jossa valtioneuvosto suunnittelee Suomen historian poikkeuksellisimpia, ihmisoikeuksia merkittävästi rajoittavia sulkutoimia. (Tämä mahdollisista liikkumisrajoituksista tiedetään nyt - Politiikka | HS.fi). Oikeusoppineemme ovat koko covid-epidemian ajan osallistuneet upealla tavalla keskusteluun asiasta. Kuten Pauli Rautiainen asiasta kommentoi (Pauli Rautiainen kritisoi hallitusta (iltalehti.fi)) valmisteluasiakirjojen salaaminen on ongelmallista.


Lainsäädäntömallin vaihtoehtojen puutteisiin ja perusoikeuspunnintaan saavat oikeusoppineet ottaa kantaa, mutta oikeudellisten painien lisäksi toivon nyt että asiakirjat mallilaskelmineen ovat julkisia ja joukossa niitä hahmottamassa on joku datalukutaitoinenkin. Itseasiassa laskelmat voisi aivan hyvin ladata valtioneuvoston verkkosivuille datoineen, jolloin muutkin voisivat niitä arvioida. Data-oppineiden koulukuntaan saisi nyt pari tilastoproffaa ilmoittautua.


Ja toivoisin että joku data-analyysiin perehtynytkin ottaisi asiakseen malleja arvioida ja kommentoida. Asia on yhteinen ja poikkitieteellinen, joten data-analytiikka-väki ja ennustemalleihin perehtyneet, nyt kuulolle. Muuten käy taas henrikssonit.


En halua vähätellä covid19-epidempian merkitystä yhteiskunnallemme. Olemme maailmanlaajuisesti sellaisessa muutostilanteessa jota emme ole nähneet sitten 30-luvun laman. Ja silloin se lama jälkivaikutuksineen ei päättynyt hyvin. Joten nyt toivoisin että asioita arvioidaan faktapohjalta, poikkitieteellisesti ja laajalla asiantuntijajoukolla, ja päätösten perusteet ovat kaikille avoimet. Tsemiä suomalaiset!


Kiitos kun jaksoit lukea! t juri


(ps jos aluekohtaisia analyysejä tarvitset, niin laita postia jujukol@gmail.com)



2,764 views4 comments

Recent Posts

See All
Post: Blog2_Post
bottom of page