Oliver Saal
osaal.bsky.social
Oliver Saal
@osaal.bsky.social
Senior Specialist @ Ministry of the Interior, Finland | Passionate about quant methods, open science, and scientific reproducibility | 🇫🇮🇸🇪🇬🇧
| osaal.dev
Submitted... It's done... (for three months, until we get the reviews)
thanos from avengers infinity war says the deed is done .
Alt: thanos from avengers infinity war says the deed is done .
media.tenor.com
November 30, 2025 at 6:58 PM
Update #2: Maybe it's not delusion, and I can actually write science...?! Two days until submission 🤞🥹
November 28, 2025 at 2:25 PM
Sitrep: four days to go, slowly moving to the unknown sixth stage of delusional elation a.k.a. "I can totally do this, this is a great paper!!". Thankfully reviewer 2 will fix this state eventually.
November 26, 2025 at 2:31 PM
Hämmästyin kun luin, että kaupunki päätti poistaa ylityspaikkoja *jalankulkijoiden suojelemiseksi* (???), mutta toisaalta tuntuu, että tämä tie on vain niin menetetty peli, että kaupunkisuunnittelijoillakin nousee kädet pystyyn 🤷
November 19, 2025 at 3:09 PM
That's the Leverhulme winner spirit!
November 18, 2025 at 6:47 AM
Lakens (2025): Confidence intervals. Teoksessa Lakens, D. (2025). Improving Your Statistical Inferences. lakens.github.io/statistical_inferences/07-CI.html

Varsinkin alaluku 7.3 kertoo luottamusvälien väärintulkinnasta (VM on sama kuin LV, mutta prosenteille)
7  Confidence Intervals – Improving Your Statistical Inferences
This open educational resource contains information to improve statistical inferences, design better experiments, and report scientific research more transparently.
lakens.github.io
October 2, 2025 at 7:42 AM
Thornton ja Thornton (2004): Erring on the margin of error. jstor.org/stable/4135315

Kertoo virheen yleisyydestä ja selittää ehkä minua paremmin virhetulkinnan
Erring on the Margin of Error on JSTOR
Robert J. Thornton, Jennifer A. Thornton, Erring on the Margin of Error, Southern Economic Journal, Vol. 71, No. 1 (Jul., 2004), pp. 130-135
jstor.org
October 2, 2025 at 7:42 AM
Jos haluaa tietää lisää tästä aiheesta, avainsana on NHST, eli null hypothesia significance testing (nollahypoteesimerkitsevyystestaus).

Summa summarum: VM ei tarkoita mitä luullaan eikä kerro mitä halutaan. Todellinen tilastotiede ei käytä VM:ää testatakseen eroja 14/14

Seuraavaksi pari linkkiä!
October 2, 2025 at 7:42 AM
Käytimmekö VM:ää? Ei ollenkaan! Käytimme vain aineistossa esiintyvien vastausten määriä.

Jos kävisikin niin, että p-arvo on suuri (suurempi tod.näk.), niin emme voisi hylätä hypoteesia. Toisin sanoen, *voi* olla niin, että kannatukset ovat samat - emme pysty osoittamaan toisin. 13/14
October 2, 2025 at 7:42 AM
(Tätä kutsutaan khii neliö-testiksi, jos kiinnostaa tarkemmin!)

Laskemme suht monimutkaisen testin, jonka vastaukseksi saamme ns. p-arvon, eli todennäköisyysarvon väliltä 0-1 (mahdoton - taattu)

Jos p-arvo on hyvin matala (erittäin pieni tod.näk.) hylkäämme hypoteesin (ei luultavasti oikein) 12/14
October 2, 2025 at 7:42 AM
Asetetaan hyp., että Y:n todellinen arvo on sama kuin X:llä (4,5 %). Voimme rakentaa nelikentän: Kuinka moni vastasi Y vs. ei Y, kuinka moni vastasi X vs. ei X?

Jos hyp. on oikeassa, Y- ja X-vastausten määrä tulisi olla sama. Mitä isompi ero, sitä pienemmällä tod.näk. ovat oikeasti samoja 11/14
October 2, 2025 at 7:42 AM
Auttaako VM? Ei oikeastaan. VM on pitkän aikavälin mitta: 95 % VM:stä sisältää todellisen arvon äärettömässä määrässä samanaikaisia otoksia.

Miten sitten arvioidaan, onko kyseessä virhemittaus? Muistetaan tilastotieteen määritelmä: aineiston tod.näk. huomioiden hypoteesin 10/14
October 2, 2025 at 7:42 AM
Sanotaan seuraavaksi, että näemme seuraavat arvot: Puolue X 4,5 %, Puolue Y 5,7 %, molemmilla VM +- 2,7 %-yksikköä.

Ensimmäinen tulkinta: Y:llä kannatus on suurempaa kuin X:llä!
Mutta, mitä jos Y:n kannatus onkin virhemittaus ja oikeasti on paljon matalampi?

Tarvitaan siis jonkinlainen testi! 9/14
October 2, 2025 at 7:42 AM
Epäkorrekti: Samat arvot kuin yllä. Mikä on todennäköisyys, että todellisen ja mitatun arvon erotus on nolla, ottaen huomioon mitatut arvot? (= hypoteesin tod.näk.)

Epäkorrekti tulkinta on lähempänä arjen ajattelua, mutta edustaa todellisuudessa erityistä (bayesilaista) tilastotiedettä! 8/14
October 2, 2025 at 7:42 AM
Korrekti: Sanotaan, että puolueen X kannatus on todellisuudessa 5 %, ja mittauksessamme 4,5 % +- 2,1 %. Mikä on todennäköisyys, että saamme nämä mitat, jos oikeasti on niin, että todellisen ja mitatun arvon erotus on nolla, eli ovat samoja? (= aineiston tod.näk.) 7/14
October 2, 2025 at 7:42 AM
Korrekti tulkinta on abstraktimmalla tasolla aineiston todennäköisyys, ottaen huomioon hypoteesin. Aineisto = laskettu arvo ja VM, hypoteesi = oletus, että laskettu arvo on sama, kuin todellinen arvo

Yleinen väärinkäsitys edustaa kuitenkin hypoteesin todennäköisyyttä, ottaen huomioon aineiston 6/14
October 2, 2025 at 7:42 AM
Toinen osio VM:n määritelmästä: se koskettaa todennäköisyyttä olla todellisen arvon sisältävä, ei todennäköisyyttä sisältää todellista arvoa. Kuulostaa pilkunviilaukselta, mutta tämä on perinpohjainen piirre ns. taajuustilastotieteessä (frequentist statistics), mitä VM edustaa. 5/14
October 2, 2025 at 7:42 AM
Ongelmana kuitenkin on, että VM vaatisi muuten täydellisen samanlaiset otokset toimiakseen toistotutkimuksissa. Koska puoluekannatus vaihtelee ajan myötä, todellisessa tilanteessa eri aikoina toteutettuja VM:iä ei voida aggregoida järkevästi. 4/14
October 2, 2025 at 7:42 AM
VM edustaa teoreettista pitkän aikavälin todennäköisyyttä - ei yksittäisen otoksen todennäköisyyttä. Tiukassa tulkinnassa VM ei siis oikeasti kerro yhtään mitään yksittäisestä tuloksesta! Sen todellinen hyöty on toistotutkimuksissa, joissa kaikki VM:t voidaan koota yhteen. 3/14
October 2, 2025 at 7:42 AM
Virhemarginaali on luottamusvälin versio prosenttiluvuille. VM tulee tulkita niin, että äärettömässä määrässä samanaikaisissa otoksissa 95 % virhemarginaaleista sisältäisi todellisen arvon.

Hieman tekninen määritelmä, niin puretaan osiin! 2/14
October 2, 2025 at 7:42 AM