Lineaarinen regressio - kurssi 4900 hieroa. alkaen Avoin koulutus, koulutus 5 viikkoa, noin 2 tuntia viikossa, Päivämäärä 29.11.2023.
Miscellanea / / November 29, 2023
Jos korrelaatioanalyysi mahdollistaa kahden suuren välisen suhteen vahvuuden ja suunnan kvantifioinnin, niin regressiomallien rakentaminen tarjoaa suuremmat mahdollisuudet. Regressioanalyysin avulla voidaan kvantitatiivisesti kuvata tutkittujen suureiden käyttäytymistä ennustajamuuttujien mukaan ja saada ennusteita uudesta tiedosta. Opit rakentamaan yksinkertaisia ja useita lineaarisia malleja R-kielellä. Jokaisella menetelmällä on rajoituksensa, joten autamme sinua ymmärtämään missä tilanteissa lineaarista regressiota voidaan käyttää ja ei, ja me opetamme sinulle menetelmiä valitun diagnoosin tekemiseen mallit. Kurssilla erityinen paikka on regressioanalyysin syvällinen anatomia: hallitset operaatiot matriiseilla, jotka ovat lineaarisen regression perusta, jotta pystytään ymmärtämään monimutkaisempia lineaarisia muotoja mallit.
Jos kohtaat tarpeen etsiä ja kuvata tiettyjen kvantitatiivisesti mitattavissa olevien ilmiöiden välisiä suhteita, niin tämä kurssi on hyvä tilaisuus ymmärtää kuinka yksinkertainen ja moninkertainen lineaarinen regressio toimii, oppia näiden mahdollisuuksista ja rajoituksista menetelmiä.
Kurssi on suunnattu niille, jotka ovat jo perehtyneet R-kieltä käyttävän data-analyysin perustekniikat ja luomalla yksinkertaisia .html-dokumentteja käyttämällä rmarkdownia ja knitr.
Tieteelliset kiinnostuksen kohteet: meren pohjaeliöstöyhteisöjen rakenne ja dynamiikka, spatiaaliset mittakaavat, peräkkäisyys, lajien välinen ja sisäinen bioottiset vuorovaikutukset, meren selkärangattomien kasvu ja lisääntyminen, populaatioiden demografinen rakenne, mikroevoluutio, biotilastot.
Kurssi koostuu 5 moduulista:
1. Korrelaatioanalyysi. Yksinkertainen lineaarinen regressio
Aloitamme keskustelumme menetelmistä kvantitatiivisten suureiden välisten suhteiden numeeriseen kuvaamiseen kovarianssi- ja korrelaatiokertoimilla, joiden avulla voimme arvioida suhteen vahvuuden ja suunnan. Sitten opit, mitä lisätietoa suhteista voidaan saada rakentamalla lineaarinen malli suureiden välisestä suhteesta. Opit tulkitsemaan regressiokertoimia ja opit milloin ja miten lineaarisia malleja voidaan käyttää uuden datan ennustamiseen. Tämän moduulin loppuun mennessä opit sovittamaan lineaarisen malliyhtälön ja piirtämään sen luottamusalueen kanssa.
2. Lineaaristen mallien merkityksen ja validiteetin testaus
Lineaarisen mallin rakentaminen ja sen yhtälön kirjoittaminen on vasta analyysin alkua. Tässä moduulissa opit kuvailemaan regressioanalyysin tuloksia: miten testataan kokonaismallin tai sen kertoimien tilastollista merkitsevyyttä ja arvioidaan sovituksen laatua. Lineaarisilla malleilla (tai pikemminkin niille käytetyillä tilastollisilla testeillä), kuten kaikilla menetelmillä, on rajoituksensa. Opit mitä nämä rajoitukset ovat ja mistä ne tulevat. Graafiset diagnoosimenetelmät, joita käytämme, ovat universaaleja eri lineaarisille malleille - enemmän harjoittelua auttaa sinua tekemään päätöksiä varmemmin. Kun ymmärrät kaiken tämän, voit kirjoittaa täydellisen skriptin R-kielellä sovittaaksesi, diagnosoidaksesi ja esittääksesi yksinkertaisen lineaarisen regression tulokset.
3. Lyhyt johdatus lineaarialgebran maailmaan
Tässä moduulissa sukeltaamme lineaaristen mallien ytimeen. Tätä varten sinun on opittava tai muistettava lineaarisen algebran perusteet. Keskustelemme eri matriisetyypeistä, niiden luomisesta R: ssä ja perusoperaatioista niiden kanssa. Tarvitsemme kaiken tämän ymmärtääksemme, kuinka lineaarinen regressio toimii sisältäpäin. Opit mikä mallimatriisi on, opit kirjoittamaan lineaarisen regressioyhtälön matriisien muodossa ja löytämään sen kertoimet. Näet omin silmin hattumatriisin, jonka avulla voit saada ennustettuja arvoja, ja voit jopa laskea sen manuaalisesti. Lopuksi opit laskemaan jäännösvarianssin, varianssi-kovarianssimatriisin ja käyttämään kaikkea tätä regression luottamusvyöhykkeen rakentamiseen. Sitten tämä tieto auttaa sinua ymmärtämään monimutkaisempien mallien rakenteen: diskreeteillä ennustajilla, erilaisilla jäännösjakaumilla, erilaisilla variaatio-kovarianssimatriisin rakenteilla.
4. Useita lineaarisia regressioita
Useimmiten suureiden väliset suhteet ovat monimutkaisempia kuin mitä voidaan kuvata yksinkertaisella lineaarisella regressiolla. Useita lineaarista regressiota käytetään kuvaamaan, kuinka vastemuuttuja riippuu useista ennustajista. Kun malliin ilmestyy useita ennustajia, lineaarisella regressiolla on uusi sovellettavuusehto - vaatimus multikollineaarisuuden puuttumisesta. Tässä moduulissa opit tunnistamaan ja välttämään multikollineaarisuuden. Lopuksi useissa malleissa on usein enemmän muuttujia kuin mitä voidaan kuvata tasossa, Siksi opetamme sinulle yksinkertaisia tekniikoita, jotka auttavat sinua luomaan informatiivista grafiikkaa myös tässä tapaus.
5. Lineaaristen mallien vertailu
Useat lineaariset mallit ovat kuin rakennussarja: monimutkaisempia malleja voidaan purkaa ja yksinkertaistaa. Opit kuinka sisäkkäisten mallien vertailuja osittaisella F-testillä käytetään yksittäisten ennustajien tai ennustajaryhmien merkityksen testaamiseen. Monimutkaisemmat mallit kuvaavat paremmin alkuperäistä dataa, mutta liiallinen monimutkaisuus on vaarallista, koska tällaiset mallit alkavat tehdä huonoja ennusteita uudesta tiedosta. Käyttämällä osittaisia F-testejä voit yksinkertaistaa malleja poistamalla vähitellen ei-merkittävistä ennustajista. Yksinkertaistettuja malleja on helpompi käyttää tulosten tulkitsemiseen ja esittämiseen. Kaikki, mitä olet tähän mennessä oppinut lineaarisesta regressiosta, voidaan soveltaa suorittamalla data-analyysiprojekti, jossa sinun on rakentaa oikein optimaalinen usean lineaarisen mallin ja esittele sen tulokset käyttämällä kirjoitettua raporttia rmarkdown ja knitr.