Pandan perusteet aloittelijoille - kurssi 990 RUB. Stepikiltä, koulutus 46 oppituntia, päivämäärä 5.11.2023.
Miscellanea / / December 04, 2023
Kurssin tarkoituksena ei ole vain kertoa, vaan myös opettaa Numpy- ja Pandas-kirjastojen käyttöä.
Kulissien takana ei ole tylsä luennoitsija, vaan datatieteilijä, joka työskentelee näiden kirjastojen kanssa päivittäin. Live-viestinnän muodossa (tekijä näyttää kommunikoivan kanssasi kameran kautta) opimme työskentelemään Pandasissa.
Tietoja kurssista
1. Tiedot
Numpy perusasiat
1. Miksi tarvitset Numpya oppiessasi pandoja?
2. Harjoittelu: muoto, dtype, ndim, nollat, ykköset, järjestys
3. Tietotyypit ja niiden muuntaminen, aritmetiikka, elementtien käyttö
4. Harjoittelu: aritmetiikka, tyyppimuunnos, elementtien käyttö
5. Kaksi- ja kolmiulotteiset taulukot. Indeksien käytön opettelu
6. Harjoitus: indeksityön vahvistaminen
7. Maski ja viipalointi yhdessä, hieno indeksointi ja myös muotoileminen
8. Harjoitus: taulukon muodon muuttaminen
9. Lisää uudelleenmuotoilusta, transponoinnista, yksi- ja binäärifunktioista
10. Harjoittelu: unaari- ja binäärifunktioiden tiedon lujittaminen
11. Loogiset funktiot ja funktio funktion sisällä sekä missä ja tilastot
12. Harjoittelu: hyödyllisten toimintojen hallinta
13. Toimii mikä tahansa, kaikki, lajittelu, ainutlaatuinen, in1d. Lineaarialgebran yleiskatsaus
14. Permutaatio- ja sekoitusfunktiot. Taulukon tallentaminen tiedostoon
Johdatus Pandaan
1. Ensimmäinen tutustuminen sarjaan
2. Harjoittelu: testaa tietosi sarjasta
3. Lue lisää sarjoista: indeksit, lisäys, NaN-tarkistus
4. Harjoittele: hienouksia sarjojen kanssa työskennellessä
5. Ensimmäinen tutustuminen DataFrameen
6. Lisätietoja DataFramesta: hakemistot, sisäkkäiset sanakirjat, del ja .T
7. Harjoittelu: ominaisuuksien indeksointi
8. Toiminnot uudelleenindeksoivat, pudottavat ja indeksoivat tietokehyksessä
9. Harjoittele: vedä esiin mitä tarvitset, poista mitä et tarvitse
10. Operaattorit loc, iloc, at, iat. Useiden tietokehysten lisääminen
11. Tietokehysten lisääminen, lajittelu, aritmetiikka aukkojen kanssa
12. Kuvailevia tilastoja. Ainutlaatuisia arvoja
13. Testata
14. Testi (jatkuu)
Pandat: työskentely tietolähteiden kanssa
1. Mikä on CSV-muoto ja miten se kesytetään?
2. Lue lisää passin käsittelystä
3. Opi lukemaan suuria tiedostoja paloina
4. Kuka on JSON ja kuinka ystävystyä sen kanssa?
5. Formaattien HTML, XML, PICKLE, HDF5 tunteminen
6. Vanha kunnon Excel ja vähän tietokannoista
Pandat: puhdistus ja tietojen valmistelu analysointia varten
1. Passien käsittelyn oppiminen
2. Tarkistamme datan kaksoiskappaleiden varalta ja poistamme ne
3. Arvojen korvaamisesta ja diskretisoinnista
4. Tunnistamme päästöt ja poistamme ne asianmukaisesti
5. Matriisien luominen valemuuttujista
6. Jousien kanssa työskentely on helpompaa kuin miltä näyttää!
Pandas: Tietojen yhdistäminen ja muodon muuntaminen
1. Esittelyssä hierarkkinen indeksointi
2. Toiminnot, joissa on useita indeksejä tietokehyksissä
3. Tietokehysten yhdistäminen yhdistämisen avulla
4. Analoginen yhdistää; tietokehysten ketjuttaminen concatilla
5. Tietojen ja lomakemuunnosten yhdistäminen