Welcome to Scribd, the world's digital library. Read, publish, and share books and documents. See more
Download
Standard view
Full view
of .
Look up keyword
Like this
1Activity
0 of .
Results for:
No results containing your search query
P. 1
Tarkempaa ja yhteensopivampaa tilastodataa ei-päättäjän asemassa oleville mashuppien tekijöille

Tarkempaa ja yhteensopivampaa tilastodataa ei-päättäjän asemassa oleville mashuppien tekijöille

Ratings: (0)|Views: 43|Likes:
Published by Marko Seppänen

More info:

Published by: Marko Seppänen on Oct 23, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

04/28/2012

pdf

text

original

 
K
ILPAILUTYÖ
A
PPS
4F
INLANDIN
I
DEASARJAAN
 
Tekijä
Marko Seppänen, hoito.org < smarko at hoito dot org >
Idean nimi
Tarkempaa ja yhteensopivampaa tilastodataa ei-päättäjän asemassa oleville mashuppien tekijöille
Idean kuvaus
Valtion ja kunnan organisaatiot tuottavat runsaasti kaikkien tarkasteltavissa ja usein itselleenkinladattavissa olevaa tilastomateriaalia, joka on jatkojalostamisen kannalta hyödyllistä esimerkiksi ns.
päättävissä asemissa oleville, jotka tarvitsevat erilaisia indikaattoreita ”yhteiskun
nallisten ilmiöiden
säännönmukaisuuksien” kuvaamiseen. Kun mashuppien tekijä tarkastelee samaa aineistoa, hän huomaa
pian, että eri lähteistä peräisin olevan datan yhteensovittaminen on usein mahdotonta tai liian teennäistä,sillä tilastoaineistot ovat kohdistuneet erilaisiin populaatioihin, ajanjaksot eivät ulotu yhtä pitkälle taitarkkuus loppuu kesken.Mashuppien tekijöille ei välttämättä ole erityistä perehtyneisyyttä bayesilaiseen tilastotieteeseen, eikätodennäköisesti ole monella mashupin käyttäjälläkään, mutta sopivien ohjelmistokomponenttien avulla onkuitenkin otettavissa käyttöön yhteinen visuaalinen kieli, jollaista mashuppien kehittäjä pystyymuodostamaan ja jota mashuppien käyttäjät osaavat lukea ilman erityistä kurssittautumista. Ongelmaksiesim. kahden muuttajan välistä korreloivuutta visuaalisesti tarkasteltuna voi muodostua syötteenä olleentilastoaineiston liiallinen pelkistyneisyys, mikä altistaa erheille päättelyssä.
Kenelle tästä ideasta olisi hyötyä
Tarkemmasta ja yhteensopivammasta datasta olisi hyötyä mashup-tyyppisten palveluiden laadullisessakehittämisessä, mashupin tyypin ollessa esim. jokin seuraavista (lähteenä Somuksen KommentoiTätä-palvelu):
 
yksi lähde, uusi käyttöympäristö
 
yksi lähde, uusi käyttöliittymä
 
useita lähteitä
 
käyttäjät ja yksi tai useampi lähde
 
käyttäjien jalostama dataEräs tyypillinen ongelma tilastointiaineiston hyödynnettävyydessä liittyy aluekohdistuvuuteen elikorreloivuutta on hankala osoittaa toisen tietolähteen tilaston keskittyessä maakuntatasoon, toisen
 
tarjotessa pelkästään koko valtakuntaa koskevaa tietoa ja kolmannen ollessa ajallisesti ja populaationmääritelmän kannalta muuten yhteensopivaa, mutta tarkasteltuina alueina ovatkin maakuntien sijaan esim.terveyspiirit.Yksittäiset tilastoaineiston osat toimivat sinänsä hyvinä indikaattoreina, mutta esim. THL muistuttaaTerveytemme.fi -
sivuston indikaattoreiden osalta, että ”
Mikään osoitin ei kuitenkaan ole täydellinen. Onkintärkeää tietää terveysosoittimien rajoitteet.
 Sitä ei ole tarpeen epäillä, etteikö suomalaisilla olisi kiinnostusta saada tarkempaa tietoa useista eri aiheistakulttuurista talouteen ja terveydestä koulutukseen, mutta tietyt havainnot antavat ymmärtää, että tämätahtotila tai kulttuuri ei ole riittävän vahva. Sellaista tietoa, joka on esitettävissä stabiileina numeroarvoinakuten maahantuonnin ja -viennin määrä, on helpompi tuottaa ja täten sellaista todennäköisemmin esilläonkin, tarvittaessa myös tarkemmin eriteltyinä (tavarakuljetuksen osalta toimialakohtaisesti jakohdemaittain), mutta terveysaiheiden osalta tarjolla oleva tilastotieto loppuu usein jo ennen sitä kohtaa,missä tiedon tarkkuus ei enää ole riittävää
 –
terveyden tutkiminenhan ei ole aivan eksaktia tiedettä.Esimerkkinä tästä tilastotiedoksi muutettavuuteen liittyvästä ongelmasta ja samalla myös tarkemmantiedon vaativuuden vajeesta toimii keliakia. Kun puhutaan keliakiaan sairastuneista tarkoitetaan sanoa, ettäpitäisi välttää gluteiinipitoisia ruoka-aineita, mutta edes Keliakialiitto ei käsittele asiaa sillä tarkkuudella,että mainitsisi gluteiinin olevan proteiinikomposiitti, joka koostuu gluteniini- ja gliadiiniproteiineistä, joista jälkimmäinen luokitellaan osakomponenttiensa perusteella alaryhmiin, joissa niissäkin on runsaastivariaatiota (ks. viite)
 –
eri maissa (tai maanosissa) tuotetut vehnät voivat näiltä osin erota toisistaan
merkittävästi, mutta makaronipussin kyljessä lukee silti vain ”sisältää vehnää”
. Tämä ei tarkoita sitä, ettäkaikkien pitäisi ryhtyä bioanalyytikoiksi, mutta jos yksittäinen kansalainen haluaisi tietää mitä gliadiinejahänen ruokansa sisältää ja onko jonkun muun syömässä ruoassa niiden osalta jotain samaa, ei tälläistämashuppia voisi vielä nykyään mitenkään muodostaa.Tilastoitavaa tietoa kertyy helposti liikaakin kerralla esitettäväksi, sitä enemmän mitä syvemmälleyksityiskohtiin mennään, mutta silloinkin kun tietoa on sopivanlaisesti, se on todennäköisesti laitettu esillePDF-muotoiseen raporttiin. Tuolloin tiedon joutuu etsimään erikseen käytettäväksi ilman, että tuotaetsimisprosessia voisi mitenkään automatisoida. Tästä esimerkkinä Liikenne- ja viestintäministeriön
alaisuudessa toimiva Finavia Oy, joka ”
ylläpitää ja huolehtii Suomen lentoasemaverkostosta ja
lennonvarmistusjärjestelmästä”. Finavian kuukausittainen raportti
on sinänsä helppolukuinen ja selkeä,mutta ilman erillistä pyyntöä saatava Excel-tiedosto voisi palvella paremmin sellaisen mashupin kehittäjäntarkoituksia, joka näkisi Finavian tilastoissa hyödynnettävyyttä.Saatavilla olevan tilastotiedon ei tarvitse olla reaaliaikaisesti päivittyvää, mutta ohjelmointirajapintojen taisaatavilla olevien dokumenttien täytyy olla standardoituja. Maanmittauslaitos osoittaa näiltä osin hyvääesimerkkiä: standardoidut ja versioidut rajapinnat, erilliset ilmaisdatat (mm. maakuntien ja kuntienaluerajat vektorimuodossa), aloitusmaksua lukuun ottamatta kohtuullinen ja portaittainen hinnoittelu, sekänäyteaineistot ja rajapintapalveluiden koekäyttömahdollisuus. Maanmittauslaitos perustelee aineistonosittaista avaamista (ilmaiseksi tarjoamista) mm. innovatiivisten ja uusien sovellusten syntymisenedistämisellä. Mashuppien rakentamisen kannalta esteeksi/hidasteeksi muodostuu se, että tilastotiedonesittämistä kartta-avusteisesti rajoittaa se, mitä määritettyjä alueita on saatavilla vektorimuodossa
 –
 terveyspiireistä ei vastaavia ole samaan tapaan helposti saatavilla eli ainakaan ilman erillistä pyytämistäolevia.
 
Tässä ideakuvauksessa pyritään olemaan hakematta esimerkkejä yksityisen sektorin toimijoista, muttayleisesti voidaan todeta, että yksityiskohtaisen tilastotiedon hyödynnettävyys tulee sitämerkityksellisemmäksi ja monimuotoisemmin hyödynnettävämmäksi mitä pidemmällä Internet of Thingsin(IoT) -idea levittäytyy. IoT tarkoittaa yksinkertaisimmillaan sitä, että yksittäisen esineen sijainti pystytään
paikallistamaan internetin kautta esineessä olevan pienen radiolähettimen avulla. ”Älykkäämmät esineet”
voivat kertoa ominaisuuksistaan, käyttäjistään ja kulloisestakin ympäristöstään paljon enemmän jatoimimaan interaktiossa muiden IoT -maailman olioiden kanssa. Tästä muodostuu runsaasti tilastoitavissaolevaa dataa. Julkiselta puolelta käytännön esimerkiksi voisi ottaa kirjaston, sen kirjoihin liitettyjen RFID-tagien avulla tapahtuvan kirjan yksilöimisen ja kirjaston pöytien alapinnoille piilotettujen RFID-tagienetälukijat, jotka ovat osana sitä tilastointijärjestelmää, joka seuraa kuinka kauan ja mitä kirjaston kirjojaihmiset lukevat (tai ainakin pitävät pöydän äärellä) kirjastossa, mutta eivät varsinaisesti lainaa itselleen.Tästä kertyisi monipuolisempaa tilastotietoa kuin sellaisesta tilastosta, jossa on listattuna koko valtakunnansuosituimmat lainakirjat. Siellä on kuitenkin joku Jari Tervo. Julkisena ja vapaasti käytettävänä tilastonatästä datasta olisi mahdollista muodostaa mashuppi, jonka avulla eri kirjastojen vähemmän luetut kirjatsaisivat uusia lukijoita. Tilastollisesti voisi olla myös mielenkiintoista selvittää sitäkin, korreloisivatko kirjojenfyysiset, ulkonäölliset ja sijainnilliset seikat kirjojen hyllystä ottamiseen ja tarkempaan selailuun ottamiseen.Kerääntyvän tilastotiedon julkisuus myös hälventäisi yksityisyyden tunteen menettämisen pelkoja.Varsinaisena teesinä tässä ideakuvauksessa on siis se, että sellaisen tahon kannalta, jolla on halukkuuttaluoda mashup-tyyppinen ratkaisu johonkin tarpeeseen tai tehdä jokin mielenkiintoiseksi kokemansakokeilu, jonka toimivuudesta tai lopputuloksista ei voida ennalta olla aivan varmoja, olisi tarpeellista, ettätilastodata monen julkisen sektorin toimijoiden osalta olisi asteen tai kaksi tarkempaa ja eri tahojentilastodata olisi yhteentoimivampaa. Muutoin korrelaatioiden osoittaminen muodostuu teennäiseksi (ks.
kuva ”
Sairaanhoitokorvauksien saajat vs. niukasti hedelmiä ja marjoja syövät
”).
 
Jos mahdollista, anna linkki powerpoint- tai johonkin muuhun esitykseen, joka kuvaa ideaasi
Tämän ideakuvauksen hahmottelun yhteydessä on luotu kokeellinen Android-sovellus, joka esittäämuutamia Kelan Kelastosta, THL:n Terveytemme.fi:stä ja Findikaattorista haettuja tilastotietojavisuaalisesti. Seuraavassa niistä 8 kahdeksan esimerkkiä ruutukaappausten muodossa.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->