Trafin ajoneuvotiedot Excelin tietomallissa


Trafin ajoneuvotiedot Excelin tietomallissa



Miten monta Teslaa Suomessa on ja missä ne on rekisteröity? Fiat 500:sten lukumäärä Espoossa? Autojen keskimääräinen ikä kunnittain? Mikä on suosituin Audin väri Helsingissä?

Trafi avasi liikenteessä olevien henkilöajoneuvojen tiedot julkiseen käyttöön toukokuussa (31.5.2014). Nyt ensimmäisessä vaiheessa on avattu ajoneuvojen teknisiä tietoja sisältävä pilottiaineisto ja Trafi tulee avaamaan avoimen datan palvelun vuoden 2014 loppuun mennessä. Trafi lisää aineistoja saataville vaiheittain sitä mukaan, kun aineistot ovat teknisesti valmiita julkaistavaksi.  Tässä ensimmäisessä julkaistussa aineistossa on mm. ajoneuvotyyppi, ensirekisteröintipäivämäärä, käyttöönottopäivämäärä, väri, käyttövoima, vaihteistotyyppi ja korityyppi. Ks. Avoin data Trafissa

Hienoa, että viranomaiset avaavat dataa ja mainiota, että Excelin Power Pivotin tietomalliin voi imuroida isoja data-aineistoja. Power Pivotin pakkaussuhde on huomattava (alla Trafin data.csv on ladattuna Excelin tietomalliin):

pakkaussuhde

Tein Trafin datasta valmiin Power Pivot tietomallia hyödyntävän Excel-työkirjan, jonka voit ladata itsellesi Trafin datan tutkimiseen. Jos käytössäsi on 64-bittinen Excel-versio, pystyt analysoimaan jopa koko Trafin julkaisemaa 2,6 miljoonan ajoneuvon aineistoa. Löydät blogista myös 32-bittistä Excel-versiota varten tehdyn työkirjan, johon latautuu vähemmän ajoneuvoja (2010-luvulla käyttöönotetut ajoneuvot eli hitusen yli puoli miljoonaa riviä).

Työkirjoissa on tietomallin lisäksi runsaasti valmiita pivot-taulukoita, mutta niitä sekä laskennallisia kenttiä voit luoda itse lisää. Työkirjat sisältävät vain pienen otoksen datasta, joten sinun pitää ladata aineisto myös Trafin sivuilta alla olevien ohjeiden mukaisesti.

kayttovoima

Suomen ajoneuvot -työkirja tutkittavaksi

Työkirjat on laadittu Excelin 2013 –versiolla ja tietomalli on toteutettu Power Pivotilla, joten tarvitset Excel 2013:sta jonkun seuraavista versioista: Professional Plus, Office 365 Pro Plus tai Standalone.

Datan lataus Trafin sivuilta

Lataa ja tallenna Trafin sivuilta sekä zipattu data-tiedosto (.csv) että datatiedostossa käytetyn koodiston kuvaus (.xlsx).Trafin sivut

Analysointityökirjan lataus

Lataa joko täyden datan analysointiin (vaatii 64-bittisen Excelin ja Power Pivotin) tai 2010-luvun datan analysointiin luotu työkirja (pitäisi pyöriä myös 32-bittisessä, jos työasemassa riittävästi muistia):

Huom! Näissä tiedostoissa on vain suppeat otokset varsinaisesta datasta.

Power Pivotin aktivointi Excelissä

Aktivoi Power Pivot käyttöön komennolla File > Options > Add-Ins (Tiedosto > Asetukset > Apuohjelmat). Valitse ikkunan alaosasta COM Add-Ins ja Go (Siirry). Rastita Microsoft Office PowerPivot for Excel 2013. Jos Power Pivot puuttuu ikkunasta, sinulla ei ole oikeaa Excel-versiota.

power pivotin aktivointi

Ajoneuvotyökirjan valmistelu

Avaa ajoneuvotyökirja ja salli ulkoiset tietolähteet.

enablointi

Siirry Power Pivotin puolelle valitsemalla PowerPivot-välilehdeltä Manage (Hallitse).

Valitse Power Pivotissa Home > Existing Connections (Aloitus > Olemassa olevat yhteydet) ja valitse vuorollaan molemmat ikkunan yläosassa olevat tietolähteet (Ajoneuvot ja Excel Koodisto) ja muokkaa tiedostopolku osoittamaan lataamiisi Trafin tiedostoihin valitsemalla Edit > Browse (Muokkaa > Selaa). Suorita myös molempien tietolähteiden päivitys Refresh (Päivitä) -painikkeella. Huomaa, että tietolähteiden muuttaminen sekä niiden päivitys (erityisesti ajoneuvodata) saattaa kestää useita minuutteja. Odota rauhassa, jos ikkunoiden painikkeet eivät heti vaikuta reagoivan.

sijainnit

Kun tiedot ovat päivittyneet, sulje Power Pivot -ikkuna ja testaa Excelissä olevia mallipivotraportteja. Voit luoda työkirjaan lisää pivotteja sekä lisätä laskettuja kenttiä.

Ja sitten vastauksiin:

–          Helsingissä Audin suosituin väri on musta:

Audin suosituin vari

–          Tesloja on 45 ja niitä löytyy seuraavilta paikkakunnilta:

Teslat

–          Fiat 500 viistoperiä löytyy Espoosta 110 ja minulla on niistä yksi.



Microsoft MVP (Microsoft Most Valuable Professional). Heidi toimii vanhempana konsulttina ja kouluttajana Sulavalla ja hänen keskeiseen osaamisalueeseen kuuluvat Power BI ja Excel. Hän on toiminut konsulttina, kouluttajana ja luennoitsijana yli kahdenkymmenen vuoden ajan ja kirjoittaa myös Excel ja Power BI –aiheista blogia HExcelligent.fi