Yleistetyt lineaariset mallit - kurssi 3600 hieroa. alkaen Avoin koulutus, koulutus 3 viikkoa, noin 6 tuntia viikossa, Päivämäärä 29.11.2023.
Miscellanea / / December 01, 2023
Yksi perinteisten lineaaristen mallien sovellettavuuden edellytyksistä on havaintojen riippumattomuus toisistaan, joiden perusteella malli valitaan. Käytännössä on kuitenkin usein tilanteita, joissa materiaalinkeräyksen suunnittelu on sellainen, että tämän ehdon rikkominen on väistämätöntä. Kuvittele, että päätit rakentaa mallin, joka kuvaa fyysisen kasvatuksen suorituskyvyn ja opiskelijoiden älykkyysosamäärän tulosten välistä suhdetta. Tämän ongelman ratkaisemiseksi teit useita näytteitä useissa laitoksissa. Onko mahdollista yhdistää tällaiset tiedot yhdeksi analyysiksi, joka on rakennettu perinteisen kaavan mukaan? Ei tietenkään. Kunkin yliopiston opiskelijat voivat olla jollain tapaa samanlaisia. Jopa tutkittavien määrien välisen suhteen luonne voi olla hieman erilainen. Tämäntyyppiset tiedot, joissa on ryhmän sisäisiä korrelaatioita, tulisi analysoida lineaarisilla sekamalleilla. Näytämme, että jotkut ennustajat tulisi sisällyttää malliin ns. "satunnaistekijöinä". Opit, että satunnaiset tekijät voivat olla hierarkkisesti alisteisia. Keskustelemme siitä, kuinka tällaisia sekamalleja voidaan rakentaa riippuvaisille muuttujille, jotka seuraavat erilaisia jakaumia. Lisäksi näytämme, että mallin satunnainen osa voi olla vieläkin monimutkaisempi - siinä voi olla komponentti, joka mallintaa varianssin käyttäytymistä vasteena kovariaatin vaikutukselle. Kurssin lopusta löydät projektin, jossa voit harjoitella sekamallien rakentamista valitsemalla yhden useista tietojoukoista. Näiden tietojen analyysin perusteella voit luoda raportin toistettavan tutkimuksen perinteen mukaisesti.
Apulaisprofessori, selkärangattomien eläintieteen laitos, Biologian tiedekunta, Pietarin osavaltion yliopisto, Ph.D.
Tieteelliset kiinnostuksen kohteet: meren pohjaeliöstöyhteisöjen rakenne ja dynamiikka, spatiaaliset mittakaavat, peräkkäisyys, lajien välinen ja sisäinen bioottiset vuorovaikutukset, meren selkärangattomien kasvu ja lisääntyminen, populaatioiden demografinen rakenne, mikroevoluutio, biotilastot.
Kurssi koostuu 4 moduulista:
1) Johdatus yleistettyihin lineaarisiin malleihin
Yleistetyt lineaariset mallit (GLM: t) mahdollistavat sellaisten suureiden käyttäytymisen mallintamisen, jotka eivät noudata normaalijakaumaa. Jotta ensimmäiset askeleesi GLM: n maailmassa olisivat helpompia, analysoimme niiden rakenteen GLM: n esimerkin avulla normaalijakautuneille suureille – näin voit vetää rinnastuksia yksinkertaisten lineaaristen mallien kanssa. Opit mitä linkkifunktio on, kuinka maksimitodennäköisyys toimii ja kuinka GLM-hypoteesit testataan Wald-testeillä ja todennäköisyyssuhdetesteillä.
2) Mallin valintaongelma
Tässä moduulissa puhumme rakennusmalleihin liittyvistä metodologisista ongelmista. Malli on yksinkertaistettu esitys todellisuudesta, ja valinta eri kilpailevien yksinkertaistamismenetelmien välillä on usein analyytikon tehtävä. Tässä moduulissa opit vertailemaan malleja tietokriteereillä. Keskustelemme analyysin päävaihtoehdoista malleja valittaessa ja puhumme vaikeuksista, joita syntyy mallien piilossa olevan moninaisuuden yhteydessä. Lopuksi opetamme sinut tunnistamaan mallinvalinnan väärinkäytösten päätyypit (datan kalastus, p-hakkerointi).
3) Yleistetyt lineaariset mallit tietojen laskemiseen
Tässä moduulissa käsitellään perusmenetelmiä laskettavien määrien mallintamiseen. Ensin keskustellaan siitä, miksi perinteiset lineaariset mallit eivät sovellu tietojen laskemiseen. Laskettavien jakaumien ominaisuudet auttavat sinua ymmärtämään GLM-tyyppien eroja laskettavien tietojen ja niiden diagnostiikan ominaisuuksien välillä. Näet linkkitoiminnon toiminnassa, kun visualisoit GLM-ennusteet linkkifunktion asteikolla ja vastemuuttujan asteikolla.
4) Yleistetyt lineaariset mallit binäärivasteella
Joskus on tarpeen simuloida, onko jokin tapahtuma tapahtunut vai ei, onko jalkapallojoukkue tai menetetty, onko potilas toipunut hoidon jälkeen vai ei, onko asiakas sitoutunut ostaa vai ei. Perinteiset lineaarimallit eivät sovellu tällaisten binääritietojen (tapahtumat, joissa on kaksi lopputulosta) mallintamiseen, mutta tämä voidaan tehdä helposti yleistetyillä lineaarisilla malleilla. Tässä moduulissa opit mallintamaan tapahtumien todennäköisyyksiä esittämällä ne kertoimina. Tarkastellaan, miten logit-linkkitoiminto toimii ja miten GLM-kertoimet tulkitaan, kun sitä käytetään. Lopuksi pääset harjoittelemaan yleistettyjen lineaaristen mallien analysointia erilaisilla jakaumilla suorittamalla data-analyysiprojektin. Tämän analyysin tulokset on esitettävä raporttina html-muodossa, kirjoitettuna käyttämällä rmarkdown/knitr.
• Opi, mitä taitoja tarvitaan analytiikan ja tietotieteen aloittamiseen. • Opi käyttämään Exceliä, SQL: ää, Power BI: tä ja Google Data Studiota. tiedot ja kirjoita ensimmäinen koodisi Pythonissa• Hanki vaiheittainen opas ja opi siirtymään datatieteen alalle ja valitsemaan rooli Data Sciencessa
4,4
1 490 ₽