Kirjoittaja Cloud1 11.10.2018 16:18
Data Scientist rikkinäistä dataa korjaamassa
Teemu Mikkonen työskentelee Data Scientistinä Cloud1:n noin kymmenhenkisessä datatiimissä. Työssään Teemu auttaa asiakkaita pääsemään käsiksi analytiikan maailmaan nykyaikaisilla työkaluilla, jotka pystyvät myös big datan prosessointiin. Ensimmäinen askel tähän voi olla esimerkiksi workshop, jossa asiakkaan datalla muodostetaan yksinkertainen koneoppimalli ja käydään läpi erilaisia tuotannollistamismahdollisuuksia.
Kaiken pohjana on kuitenkin aina järkevästi rakennettu data-arkkitehtuuri. Yleensä tämä tarkoittaa DataHub-mallin mukaan Azureen rakennettua tietovarastoa, josta data on helposti käytettävissä ja jaettavissa.
Kun datan keruu, liikkuminen ja automatisointi ovat kunnossa, mietitään datan mallinnusta sekä erilaisia analytiikkatyövälineitä, joiden avulla dataan saadaan liiketoiminnalle hyödyllisiä näkymiä.
Kuvaajat kertovat enemmän kuin tuhat sanaa
Menestyäkseen Data Scientistina henkilöllä tulee olla analyyttistä ajattelukykyä sekä halu pyöritellä dataa. Tehtävässä on lisäksi hyvä pitää asioiden visualisoinnista kuvaajien avulla.
– Graafit kertovat enemmän kuin sanat. Niillä on hankala huijata, Teemu heittää.
Tehtävässä pitää myös jaksaa siivota ja korjata rikkinäistä dataa, jotta tiedon pystyy esittämään havainnollisesti ja algoritmit saadaan toimimaan. Ehdoton edellytys on myös ajan hermolla pysyminen. Alan tutkimukset, artikkelit ja julkaisut kuuluvatkin Teemun lukulistalle.
Data Scientist taipuu moneen
Data Scientistien tehtävänkuvat voivat alalla olla hyvin vaihtelevia. Erityisesti suuremmissa yrityksissä voi olla tarpeen keskittyä syvällisesti yhteen tiettyyn osa-alueeseen. Cloud1:llä Teemu on pystynyt räätälöimään tehtävää oman kiinnostuksensa mukaisesti. Työnkuvan monipuolisuus ja laajuus palkitsevat.
– Koneoppipaletin lisäksi haluan ymmärtää data-arkkitehtuuria ja sitä, mitä tapahtuu ennen kuin data tulee tilastolliseen vaiheeseen.
Toisaalta laaja tehtävänkuva tarkoittaa myös sitä, että uuden tiedon omaksumiseen tulee panostaa. Into oman osaamisen kehittämiseen on tärkeää.
Automatisoitua analytiikkaa
Ala kehittyy vauhdilla ja automatisoidumpaan suuntaan. Hyvä esimerkki tästä on Microsoft Azure Machine Learning Studio. Se on visuaalinen drag-and-drop-verkkopalvelu, jossa voi rakentaa ja testata erilaisia ennakoivan analytiikan malleja yksinkertaisesti, lähes nappia painamalla. Machine Learning Studio sisältää valmiin funktiokirjaston, jonka yhteisöllisesti tuotettuja malleja voidaan hyödyntää ja käyttää omien sovellusten tai BI-työkalujen, kuten Excelin avulla.
Kehitys on nopeaa ja tulevaisuudessa automatisointi todennäköisesti vain kiihtyy. Yleinen kiinnostus kokeilla koneoppimista tai hyödyntää big dataa kasvaa koko ajan.
Oppimassa parhailta
Kun Teemu aloitti Cloud1:llä, hän oli ensimmäinen rekrytointi Cloud1:n datatiimiin. Nyt tiimissä työskentelee jo noin 10 henkilöä. Cloud1:lle Teemu päätyi suosittelujen kautta. Nykyisessä tehtävässään Teemu on päässyt seuraamaan alan kehitystä aitiopaikalta. Vaikka Cloud1:llä työskentelee alan huippuosaajia, riittää heillä aikaa auttaa ja tarjota asiantuntemusta myös muille talossa työskenteleville. Laaja-alainen osaaminen on yksi Cloud1:n vahvuuksista. Kysymyksiin löytyy aina vastaus.
Mahdollisuus kehittää omaa osaamista, vapaus vaikuttaa työskentelytapoihin sekä työntekijöiden arvostaminen ovat asiat, jotka merkitsevät Teemulle paljon.
– En oikeasti tiedä missä olisin voinut oppia enemmän, Teemu pohtii.
Tutustu avoimiin työpaikkoihin