Koneoppiminen käytännössä - kurssi 41 500 hieroa. IBS Training Centeristä, koulutus 24 tuntia, päivämäärä 26.11.2023.
Miscellanea / / December 02, 2023
Kurssi rakentuu useiden käytännön tapausten ympärille, jotka sisältävät taulukoita lähtötiedoilla.
Jokaisessa tapauksessa käymme läpi koneoppimisprojektin koko elinkaaren:
tutkimus, puhdistus ja tietojen valmistelu,
valitaan tehtävään sopiva koulutusmenetelmä (lineaarinen regressio regressiolle, satunnainen metsä luokitteluun, K-keskiarvot ja DBSCAN klusterointiin),
koulutus valitulla menetelmällä,
tulosten arviointi,
mallin optimointi,
tuloksen esittely asiakkaalle.
Kurssin keskusteluosassa pohditaan opiskelijoiden käytännön ongelmia, jotka voidaan ratkaista käsitellyillä menetelmillä.
Käsitellyt aiheet:
1. Tehtävän arvostelu (teoria – 1 tunti)
Mitä ongelmia koneoppiminen ratkaisee hyvin ja mitä ongelmia ne yrittävät ratkaista?
Mitä tapahtuu, jos palkkaat tietotutkijan sijasta alan ei-asiantuntijan (vain kehittäjän/analyytikon/päällikön) sillä odotuksella, että he oppivat prosessissa.
2. Valmistelu, siivous, datatutkimus (teoria – 1 tunti, harjoitus – 1 tunti)
Liiketoiminnan lähdetietojen ymmärtäminen (ja yleisesti mahdollisen järjestyksen havaitseminen)
Käsittelyn järjestys.
Mitä voidaan ja pitäisi delegoida domain-analyytikoille ja mitä Data Scientist itse tekee parhaiten.
Prioriteetit tietyn ongelman ratkaisemiseksi.
3. Luokittelijat ja regressorit (teoria - 2 tuntia, käytäntö - 2 tuntia)
Käytännön osio - hyvin muotoiltuja tehtäviä valmiilla tiedoilla.
Tehtävien välinen ero (binäärinen/ei-binäärinen/todennäköisyysluokitus, regressio), tehtävien uudelleenjako luokkien välillä.
Esimerkkejä käytännön ongelmien luokittelusta.
4. Klusterointi (teoria - 1 tunti, käytäntö - 2 tuntia)
Missä ja miten klusterointi suoritetaan: datatutkimus, ongelmanselvityksen tarkistaminen, tulosten tarkistaminen.
Mitkä tapaukset voidaan pelkistää klusteriksi.
5. Mallin arviointi (teoria - 1 tunti, käytäntö - 1 tunti)
Liiketoiminnan ja tekniset mittarit.
Luokittelu- ja regressioongelmien metriikka, virhematriisi.
Klusterin laadun sisäiset ja ulkoiset mittarit.
Ristiinvalidointi.
Uudelleenkoulutuksen arviointi.
6. Optimointi (teoria - 5 tuntia, käytäntö - 3 tuntia)
Mikä tekee yhdestä mallista toista paremman: parametrit, ominaisuudet, kokoonpanot.
Asetusten hallinta.
Ominaisuuden valintakäytäntö.
Katsaus työkaluista parhaiden parametrien, ominaisuuksien ja menetelmien löytämiseen.
7. Kaaviot, raportit, työskentely reaaliaikaisten tehtävien kanssa (teoria – 2 tuntia, harjoitus – 2 tuntia)
Kuinka selittää selkeästi, mitä tapahtuu: itsellesi, tiimille, asiakkaalle.
Lisää kauniita vastauksia merkityksettömiin kysymyksiin.
Kuinka esittää kolme teratavua tuloksia yhdellä dialla.
Puoliautomaattiset testit, joita prosessin ohjauspisteitä todella tarvitaan.
Livetehtävistä täydelliseen T&K-prosessiin ("T&K käytännössä") - tehtävien analysointi ja analysointi yleisöltä.