Kurssi "Data Analyst" - kurssi 96 000 hieroa. Yandex Workshopista, koulutus 7 kuukautta, päivämäärä 7.12.2023.
Miscellanea / / December 02, 2023
Dataanalyytikko poimii merkityksen numeroista ja arvoista: hän näkee trendejä, ennustaa tapahtumia ja auttaa yritystä ymmärtämään asiakkaita, optimoimaan prosesseja ja kasvamaan.
Markkinat tarvitsevat asiantuntijoita, jotka osaavat käyttää dataa hyödyllisesti. Henkilöstöyhtiö Ancorin syyskuulta 2022 tekemä tutkimus osoitti, että 45 % venäläisistä yrityksistä etsii analyytikoita tiimiinsä.
Kurssilla opitut taidot
Työnimike
Analyytikko, dataanalyytikko, dataanalyytikko
Kehittämismahdollisuudet: Tuoteanalyytikko, markkinointianalyytikko, BI-analyytikko, tietotieteen asiantuntija
Tässä ovat käyttämäsi tekniikat ja työkalut:
Python
Jupyter muistikirja
SQL
PostgreSQL
Kuvaelma
A/B testit
Aloita rahan ansaitseminen analysoimalla
Aloitat junioriasemasta ja siirryt sitten vain eteenpäin. Nouset uraportaille ja kasvatat arvoasi. Ja jonain päivänä sinulle ei ole hintaa.
Suorita Data Analytics -kurssiohjelma
Päivitämme sitä säännöllisesti varmistaaksemme, että se vastaa teollisuuden ja työnantajien tarpeita.
Toisin sanoen opit vain sen, mikä on varmasti hyödyllistä työssäsi.
Ilmainen osa - 1 viikko
Ilmainen esittely: Pythonin perusteet ja data-analyysi
Opi data-analyysin peruskäsitteet ja ymmärrä, mitä dataanalyytikot ja datatieteilijät tekevät.
• Moscow Catnamycs. Tietojen näyttäminen näytöllä. CSV-tiedostot. Työskentely pöytien kanssa. Lämpökartat. Sarakkeen kertominen kokonaisluvulla.
• Virheet koodissa. Syntaksivirheet. Nimeämisvirheet. Virheitä nollalla jakamisessa. Virheet moduulin tuonnissa.
• Muuttujat ja tietotyypit. Muuttujat. Tietotyypit. Aritmeettiset operaatiot numeroilla ja merkkijonoilla.
• Kuinka tehdä hypoteeseja. Hypoteesit. HADI-syklit. Analyyttinen ajattelu. Kaavioiden lukeminen.
• Mitä datatieteilijät tekevät. Analyytikkotehtävät. Tehtävien selvennys. Hajoaminen. Projektin vaiheet.
• Konversioiden tarkistaminen. Muuntaminen. Tietojen tutkiminen. Johtopäätösten tekeminen.
• Mainoskampanjoiden takaisinmaksu. Pylväskaavio. Elementtien ero. Indeksointi sarakkeissa.
• Koneoppiminen ja tietotiede. Koneoppimisen koulutus. Yksilöllisten arvojen etsiminen sarakkeista. Looginen indeksointi. Arvojen ryhmittely taulukkoon. Ennustusvirheet.
• Viimeinen projekti. Käyttäjien segmentointi.
PythonPandasvirheetSeabornHypoteesitKonversiomuuttujatTietotyypit Lämpökartat
1 sprintti 3 viikkoa
Perus Python
Sukella syvemmälle Python-ohjelmointikieleen ja Pandas-kirjastoon.
• Muuttujat ja tietotyypit. Python kieli. Muuttujat. Tietojen näyttäminen näytöllä. Esineiden näyttäminen näytöllä. Virheen käsittelyssä, yritä... paitsi operaattori. Tietotyypit. Tietotyyppien muunnokset.
• Viivat. Indeksit riveissä. Viivan leikkaukset. Toiminnot jousille. Merkkijonomenetelmät. Merkkijonojen muotoilu, format()-menetelmä, f-merkkijonot.
• Luettelot. Indeksit luetteloissa. Listaa viipaleita. Kohteiden lisääminen luetteloon. Poistetaan luettelon kohteita. Listojen yhteen- ja kertolasku. • Listojen lajittelu. Etsi kohteita luettelosta. Merkkijonon jakaminen merkkijonoluetteloksi, merkkijonoluettelon ketjuttaminen merkkijonoksi.
• Silmukalle. Pyörät. Elementtien luettelointi. Iteroidaan elementtiindeksien yli. Listaelementtien käsittely silmukoiden avulla: elementtien summan ja tulon löytäminen.
• Sisäkkäiset luettelot. Selaa sisäkkäisiä luetteloita laskenta-arvoilla. Elementtien lisääminen sisäkkäisiin luetteloihin. Sisäkkäisten luetteloiden lajittelu.
• Ehdollinen käyttäjä. Vaikka silmukka. Boolen tietotyyppi. Boolen arvot. Loogiset lausekkeet. Yhdistetyt loogiset lausekkeet. Ehdollinen lausunto jos...elif...muu. Haaroittuminen. Listojen suodatus ehdollisen operaattorin avulla. Vaikka silmukka.
• Toiminnot. Toimintojen antaminen. Parametrit ja argumentit. Parametrit oletusarvoilla. Positiolliset ja nimetyt argumentit. Tuloksen palauttaminen funktiosta.
• Sanakirjat. Avaimet ja arvot. Arvon etsiminen avaimella. Kohteiden lisääminen sanakirjaan. Luettelo sanakirjoista. Kauniita sanakirjoja.
• Pandas-kirjasto. Csv-tiedostojen lukeminen. Datakehys. Tietokehyksen rakentaja. Tietokehyksen ensimmäisen ja viimeisen rivin tulostaminen. Indeksointi tietokehyksissä. Indeksointi sarjasarakkeissa.
• Tietojen esikäsittely. GIGO-periaate. Datakehyssarakkeiden uudelleennimeäminen. Puuttuvien arvojen käsittely. Eksplisiittisten ja implisiittisten kopioiden käsittely.
• Tietojen analysointi ja tulosten esittäminen. Tietojen ryhmittely. Tietojen lajittelu. Kuvailevan tilaston perusteet.
• Jupyter Notebook - muistikirja solussa. Jupyter Notebook -käyttöliittymä. Jupyter-muistikirjan pikakuvakkeet.
SilmukatPythonPandat MerkkijonotListatFunktiotSanakirjatTietokehysMuuttujatTietotyypitEhdollinen lause
Projekti
Vertaa Yandex Musicin käyttäjätietoja kaupungin ja viikonpäivän mukaan.
2 sprinttiä 2 viikkoa
Tietojen esikäsittely
Opi puhdistamaan tiedot poikkeavista, puutteista ja kaksoiskappaleista sekä muuntamaan erilaisia tietomuotoja.
• Työskentely passien kanssa. Muuntaminen. Keksit. Kategoriset ja kvantitatiiviset muuttujat. Kategoristen muuttujien aukkojen käsittely. Puutteiden käsittely määrällisissä muuttujissa. Kvantitatiivisten muuttujien puutteiden käsittely luokittain.
• Tietotyyppien muuttaminen. Excel-tiedostojen lukeminen. Muunna sarja numeerisiksi. Numeromoduuli, abs()-menetelmä. Työskentely päivämäärän ja ajan kanssa. Virheen käsittelyssä, yritä... paitsi operaattori. Tietokehysten yhdistäminen, merge()-menetelmä. Pivot-taulukot.
• Etsi kaksoiskappaleita. Etsi kaksoiskappaleita, kirjainkoon erottelu.
• Tietojen luokittelu. Taulukoiden hajoaminen. Luokittelu numeeristen alueiden mukaan. Luokittele useiden arvojen perusteella riviä kohden.
• Systemaattista ja kriittistä ajattelua analyytikkotyössä. Systeemi ajattelu. Tietovirheiden syyt. Kriittinen ajattelu.
PythonPandasGap-käsittelyTietojen käsittelyKaksoiskappaleiden käsittelyTietojen luokittelu
Projekti
Analysoi pankkiasiakkaita koskevia tietoja ja määritä luottokelpoisten asiakkaiden osuus.
3 sprintti 2 viikkoa
Tutkiva data-analyysi
Opi todennäköisyyslaskennan ja tilastojen perusteet. Käytä niitä tutkiaksesi datan perusominaisuuksia ja etsimällä malleja, jakaumia ja poikkeavuuksia. Tutustu Matplotlib-kirjastoon. Piirrä kaavioita ja harjoittele kaavioiden analysointia.
• Ensimmäiset kaaviot ja johtopäätökset. Pivot-taulukoiden käyttäminen. Pylväsdiagrammi. Jakelut. Aluekaavio.
• Tietoviipaleiden tutkimus. query()-metodi. Työskentely päivämäärän ja ajan kanssa. Graafisten piirtäminen plot()-menetelmällä. Occamin partaveitsi.
• Työskentely useiden tietolähteiden kanssa. Ulkoisiin objekteihin perustuva datalohko. Uusien sarakkeiden lisääminen tietokehykseen. Tietojen lisääminen muista tietokehyksistä. Sarakkeiden uudelleennimeäminen. Taulukoiden yhdistäminen merge()- ja join()-menetelmillä.
• Tietosuhteet. Sirontakaavio. Muuttujien korrelaatio. Sirontakaaviomatriisi.
• Tulosten validointi. Ryhmien yhdistäminen. Tietojen jakaminen ryhmiin.
PythonPandasMatplotlibHistogramsData SlicesData AnalysisScatterplotScatterplotData Visualization Descriptive Statistics
Projekti
Tutustu Pietarin ja Leningradin alueen kiinteistöjen myyntiilmoitusten arkistoon.
4 sprinttiä 3 viikkoa
Tilastotietojen analyysi
Opi analysoimaan datan suhteita tilastollisilla menetelmillä. Opi mitä tilastollinen merkitsevyys ja hypoteesit ovat.
• Kombinatoriikka. Yhdistelmät. Kertolasääntö. Uudelleenjärjestelyt. Permutaatioiden määrä. Sijoittelut. Sijoitusten määrä. Yhdistelmät. Yhdistelmien määrä.
• Todennäköisyysteoria. Koe. Todennäköisyysavaruus. Tapahtumat. Todennäköisyys. Leikkaavat ja toisensa poissulkevat tapahtumat. Euler-Venn kaavio. Suurten lukujen laki.
• Kuvailevia tilastoja. Kategoriset ja kvantitatiiviset muuttujat. Mode ja mediaani. Keskiarvo. Dispersio. Standardipoikkeama. Kvartiilit ja prosenttipisteet. Aluekaavio. Pylväskaavio. Taajuustiheys. Pylväsdiagrammi.
• Satunnaismuuttujat. Diskreetti satunnaismuuttuja. Diskreetin satunnaismuuttujan todennäköisyysjakauma. Diskreetin satunnaismuuttujan kumulatiivinen funktio (jakaumafunktio). Diskreetin satunnaismuuttujan matemaattinen odotus. Diskreetin satunnaismuuttujan dispersio.
• Jakelut. Bernoullin kokeilu. Binominen kokeilu. Binomijakauma. Jatkuva tasainen jakelu. Normaalijakauma. Normaali normaalijakauma. CDF ja PPF normaalijakaumaa varten. Poisson-jakauma. Jakauman likimääräisyys toisella.
• Hypoteesien testaus. Yleinen väestö. Näyte. Näytteiden jakelu. Keskirajalause. Yksipuolisia ja kaksipuolisia hypoteeseja. P-arvo. Yksi- ja kaksipuolisten hypoteesien testaaminen yhdelle näytteelle. Testataan hypoteesia kahden yleisen populaation keskiarvojen yhtäläisyydestä. Riippuvien näytteiden keskiarvojen yhtäläisyyden hypoteesin testaus.
ScipyNumpyPythonPandatMattplotlibCombinatoricsJakaumatHypoteesien testaus Todennäköisyysteoria
Projekti
Auta kasvattamaan liiketoimintaasi testaamalla skootterivuokrauspalvelun hypoteeseja.
Extra Sprint
Todennäköisyysteoria
Muista tai tunnista todennäköisyysteorian perustermit: riippumattomat, vastakkaiset, yhteensopimattomat tapahtumat jne. Yksinkertaisten esimerkkien ja hauskojen tehtävien avulla harjoittelet työskentelyä numeroiden kanssa ja ratkaisulogiikan rakentamista.
Tämä on valinnainen sprintti. Tämä tarkoittaa, että jokainen opiskelija valitsee itse yhden vaihtoehdoista:
• Opiskele 10 lyhyen oppitunnin lisäsprintti, perehdy teoriaan ja ratkaise ongelmia.
• Avaa vain haastattelutehtäviä sisältävä lohko, muista käytäntö ilman teoriaa.
• Ohita kurssi kokonaan tai palaa siihen, kun on aikaa ja tarvetta.
Python-tapahtumatTodennäköisyysBayesin lause SatunnaismuuttujatTodennäköisyysteoria Tilastollinen tietojen analyysi
5 sprinttiä 1 viikko
Ensimmäisen moduulin lopullinen projekti
Opi tekemään alustavaa datatutkimusta sekä muotoilemaan ja testaamaan hypoteeseja.
ScipyNumpyPythonPandasMatplotlibData-analyysiHypoteesitestausTietojen käsittely
Projekti
Etsi malleja pelien myyntitiedoista.
6 sprintti 2 viikkoa
Perus SQL
Opi strukturoidun kyselykielen SQL ja relaatioalgebran perusteet tietokantojen käsittelyä varten. Tutustu suositun tietokannanhallintajärjestelmän (DBMS) PostgreSQL: n työskentelyyn. Opi kirjoittamaan eritasoisia kyselyitä ja kääntämään liiketoimintaongelmat SQL: ksi. Työskentelet elokuviin ja musiikkiin erikoistuneen verkkokaupan tietokannan kanssa.
• Tietokantoihin tutustuminen. Tietokannan hallintajärjestelmät (DBMS). SQL-kieli. SQL-kyselyt. SQL-kyselyjen muotoilu.
• Dataviipaleet SQL: ssä. Tietotyypit PostgreSQL: ssä. Tietotyypin muunnos. WHERE-lauseke. Loogiset operaattorit. Dataviipaleet. Operaattorit SISÄLLÄ, TYKKÄÄN, VÄLILLÄ. Työskentely päivämäärän ja ajan kanssa. Puuttuvien arvojen käsittely. Ehdollinen CASE-rakenne.
• Aggregointifunktiot. Tietojen ryhmittely ja lajittelu. Matemaattiset operaatiot. Aggregointifunktiot. Tietojen ryhmittely. Tietojen lajittelu. Suodatus aggregoidun tiedon mukaan, HAVING-operaattori.
• Taulukoiden väliset suhteet. Taulukkoliitostyypit. ER-kaaviot. Kenttien ja taulukoiden uudelleennimeäminen. Aliakset. Taulukoiden yhdistäminen. Liitostyypit: SISÄLIITTYMINEN, VASEN LIITTYMINEN, OIKEA LIITTYMINEN, TÄYS ULKOLIITOS. Vaihtoehtoiset liitot UNION ja UNION ALL.
• Alikyselyt ja yleiset taulukkolausekkeet. Alakyselyt. Alikyselyt kohteessa FROM. Alakyselyt paikassa WHERE. Liitosten ja alikyselyjen yhdistelmä. Common Table Expressions (CTE). Pyyntöjen vaihtelevuus.
SQLDBMSPostgreSQL-alikyselytTietokastotSQL-kyselytTietojen suodatuslajittelu tietojen ryhmittely tietojen liittämistaulukotYleiset taulukkolausekkeet
Projekti
Kirjoitat sarjan vaihtelevan monimutkaisia kyselyitä tietokantaan, joka tallentaa tietoja pääomasijoittajista, startupeista ja niihin tehdyistä sijoituksista.
7 sprintti 3 viikkoa
Liiketoiminnan indikaattoreiden analyysi
Opi, mitä mittarit ovat liiketoiminnassa. Opi käyttämään työkaluja data-analyysiin liiketoiminnassa: kohorttianalyysi, myyntisuppilo ja yksikkötalous.
• Mittarit ja kanavat. Muuntaminen. Kanavat. Markkinointisuppilo. Impressiot. Napsautukset. CTR. Tuotesuppilo.
• Kohorttianalyysi. Käyttäjäprofiili. säilytysaste. Vaihtuvuusaste. Analyysihorisontti. Kohorttianalyysin visualisointi. Satunnaisten kohorttien säilytysanalyysi. Konversio kohorttianalyysissä. Mittareiden laskeminen Pythonissa.
• Yksikkötaloustiede. Mittarit LTV, CAC, ROI. ARPU, ARPPU. Mittareiden laskeminen Pythonissa. Mittareiden edistynyt visualisointi. Sharey-parametri. Liukuva keskiarvo.
• Mukautetut mittarit. Käyttäjien aktiivisuuden arviointi. Käyttäjän istunto. Anomaliatutkimus.
MittaritSuppilotTulosyksikkötalousKohorttianalyysiTuotemittaritMarkkinointimittarit
Projekti
Tietojen perusteella ymmärrä käyttäjien käyttäytymistä sekä analysoi asiakkaiden kannattavuutta ja mainonnan sijoitetun pääoman tuottoprosenttia tehdäksesi suosituksia markkinointiosastolle.
8 sprintti 2 viikkoa
Kehittynyt SQL
Suoritat lisäkurssin tietokantojen kanssa työskentelystä ja tulet entistä lähemmäksi liiketoimintaa. SQL-kielellä analysoit tärkeimpien liiketoiminnan mittareiden laskentaa, joihin tutustuit "Business Indicators Analysis" -sprintissä. Harkitse monimutkaisen työkalun, kuten ikkunatoimintojen, käyttöä. Opi muuttamaan tietokantojen sisältöä paikallisesti, ilman simulaattoria, käyttämällä erityisiä Python-asiakasohjelmia ja -kirjastoja.
• Liiketoimintaindikaattoreiden laskenta. Tietoskeema. Muuntaminen. LTV. ARPU. ARPPU. ROI. Laskenta SQL: llä.
• Ikkunatoimintojen yhdistäminen. YLI ilmaisu. OSIJOITUS ikkunaparametrilla.
• Ikkunoiden järjestystoiminnot. Ranking-toiminnot. Ikkunan ORDER BY -operaattori. ROW_NUMBER(). RANK(). DENSE_RANK(). NTILE(). Ikkunaoperaattorit sekä sijoitustoiminnot.
• Ikkunan siirtymätoiminnot. Kumulatiivinen arvo. Offset-toiminnot. JOHTAA(). LAG(). Ikkunatoiminnot ja aliakset.
• Kohorttianalyysi. Säilytysprosentti, vaihtuvuusprosentti. LTV.
• Tietokannan ja tietokantaasiakkaan asennus ja konfigurointi. Tietokannan asiakas. PostgreSQL: n asennus. DBeaverin asennus. DBeaver käyttöliittymä. Tietokannan luominen. Tietokannan vedosten käyttöönotto. Lähetetään kyselyn tuloksia. Kyselyn tulosten esittely.
SQLDBMSMetricsPostgreSQL-tietokannatSQL-kyselytIkkunafunktiotKohorttianalyysi
Projekti
Pythonin ja SQL: n avulla muodosta yhteys tietokantaan, laske ja visualisoi tärkeimmät mittarit ohjelmoinnin Q&A-palvelujärjestelmässä.
9 sprintti 2 viikkoa
Päätöksenteko liiketoiminnassa
Opit mitä A/B-testaus on ja ymmärrät missä tapauksissa sitä käytetään. Opi suunnittelemaan A/B-testausta ja arvioimaan sen tuloksia.
• Liiketoiminnan hypoteesitestauksen perusteet. Johtavat mittarit. Kokeiden perusteet. Hypoteesien luominen. Mittareiden priorisointi. Kokeen suorittamismenetelmän valinta. Kvalitatiiviset menetelmät hypoteesien testaamiseen. Kvantitatiiviset menetelmät hypoteesien testaamiseen. A/B-testien edut ja haitat.
• Hypoteesien priorisointi. RICE-kehys. Reach-parametri. Vaikutusparametri. Luottamusparametri. Pyrkimysparametri.
• Valmistautuminen A/B-testin suorittamiseen. A/A testi. Tyypin I ja II virheet. Tilastollisen testin teho. Tilastollisen testin merkitys. Useita vertailuja, menetelmiä virheiden todennäköisyyden vähentämiseksi. Otoskoon ja A/B-testin keston laskeminen. Mittareiden graafinen analyysi.
• A/B-testin tulosten analysointi. Osakkeiden tasa-arvon hypoteesin testaus. Shapiro-Wilk-testi tietojen normaaliuden testaamiseksi. Ei-parametriset tilastolliset testit. Mann-Whitneyn testi. Kumulatiivisten mittareiden vakaus. Poikkeamien ja purskeiden analyysi.
• Käyttäytymisalgoritmit. Faktoja, tunteita, arvioita. Selitä näkökulmasi.
A/B-testaus Hypoteesien priorisointi A/B-testaukseen valmistautuminen A/B-testauksen tulosten analysointi A/B-testauksen tulosten analysointi
Projekti
Analysoi A/B-testauksen tuloksia suuressa verkkokaupassa.
10 sprintti 1 viikko
Toisen moduulin lopullinen projekti
Opi testaamaan tilastollisia hypoteeseja A/B-testauksella ja laatimaan johtopäätökset ja suositukset analyyttisen raportin muodossa.
MyyntisuppiloA/B-testausTietojen käsittelyTutkimustietojen analysointi
Projekti
Tutustu myyntisuppiloon ja analysoi A/B-testauksen tuloksia mobiilisovelluksessa.
11 sprintti 2 viikkoa
Kuinka kertoa tarina datan avulla
Opit esittämään tutkimuksesi tulokset oikein kaavioiden avulla, tärkeimmät luvut ja niiden oikean tulkinnan. Tutustu Seaborn- ja Plotly-kirjastoihin.
• Kenelle, miten, mitä ja miksi kertoa. Tutkimustuloksen esittely. Kertojan kohdeyleisö. Mitä ja miksi kertoa data-analyytikolle.
• Seaborn Library. Seaborn-kirjasto Matplotlib-kirjaston jatkeena. jointplot()-menetelmä. Värivalikoimat. Kaavion tyylit. Jakaumien visualisointi.
• Juonikirjasto. Interaktiiviset kaaviot. Viivadiagrammi. Pylväskaavio. Ympyrädiagrammi. Suppilokaavio.
• Datan visualisointi geoanalytiikassa. Geoanalytiikka. Kirjasto Folium. Kartan näyttö. Merkkien asettaminen määritetyillä koordinaatteilla. Pisteryhmien luominen. Mukautetut kuvakkeet merkkejä varten. Horoplet.
• Esityksen valmistelu. Johtopäätökset tutkimuksen perusteella. Kausiluonteisuus ja ulkoiset tekijät. Absoluuttiset ja suhteelliset arvot. Simpsonin paradoksi. Esitysten rakentamisen periaatteet. Raportit Jupyter Notebookissa.
PlotlyFoliumSeabornMatplotlibPresentationGeoanalyticsDatan visualisointi
Projekti
Valmistele avoimeen tietoon perustuva markkinatutkimus Moskovan julkisista ravintoloista, visualisoi saadut tiedot.
12 sprintti 2 viikkoa
Kojetaulujen rakentaminen Tableaussa
Tässä sprintissä työskentelet Tableau BI -järjestelmän kanssa. Opi muodostamaan yhteys tietoihin ja muokkaamaan niitä, rakentamaan erilaisia kaavioita, kokoamaan kojetauluja ja esityksiä.
• Tableaun kanssa työskentelyn perusteet. BI-järjestelmät. Kuvaelma. Asiakirjan luominen. Asiakirjan tallentaminen. Asiakirjan julkaisu.
• Työskentely tietolähteiden kanssa. Tietolähteet. Tietojen yhdistäminen. Suhdemenetelmä. Liittymismenetelmä. Sekoitusmenetelmä. Unionin menetelmä. Taulukon muodon muuttaminen.
• Tietotyypit. Perustietotyypit. Mitat. Toimenpiteet. Työskentely päivämäärän ja ajan kanssa. Sarjat. ryhmät. Vaihtoehdot. Muuttujien muodon muuttaminen. Muuttujat mittaa nimet, mittausarvot, määrä.
• Taulukot ja laskelmat. Arkkien muokkausliittymä. Pivot-taulukot. Lasketut kentät. LOD-lausekkeet.
• Suodattimet ja lajittelu. Lajittelutoimenpiteet. Lajittelumitat. Sisäkkäiset lajikkeet. Lajittelu parametrin avulla. Suodattimet.
• Visualisoinnit. Visualisointisäätimet. Lämpökartat. Ympyräkaavioita. Pylväskaaviot. Histogrammit. Aluekaaviot. Sirontakaavio. Viivakaaviot. Yhdistetyt kaaviot. Aluekaaviot.
• Erikoisvisualisointeja ja työkaluvihjeitä. Kortit. Hahmo kartta. kuplakaavio. Puu kartta. Ympyränäkymien kaaviot. Bullet-kaaviot. Ganttin kaavioita. Mittanimet ja mitta-arvot visualisoinneissa. Käänteinen suunnittelu. Työkaluvinkit. Työkaluvinkkejä visualisoinneilla. Kynnysarvot kaavioissa. Analyyttiset työkalut Customissa.
• Esitykset. Lisävaihtoehdot. Tyypillisten parametrien tutkimus. Esityksen luominen.
• Kojelaudat. Tietojen lataus ja valmistelu. Visualisointien valmistelu. Kojelaudan kokoonpano. Toiminnot. Kojelaudan esittely. Hallintapaneelin julkaiseminen.
TableauDashboardsBI-työkalutBI-työkalutTietojen visualisointi
Projekti
Tutki TED-konferenssien historiaa ja luo saatujen tietojen perusteella koontinäyttö Tableaussa.
Extra Sprint
Koneoppimisen perusteet
Tutustu koneoppimisen perusteisiin ja opi koneoppimisen päätehtäviin liiketoiminnassa.
PythonPandasSklearnKoneoppiminenKoneoppimistehtävätKoneoppimisalgoritmit
Extra Sprint
Harjoittele Pythonia
Otat useita laboratoriotunteja lisätehtävillä Python-ohjelmointikielellä. Opit myös poimimaan tietoja verkkoresursseista.
Tulet:
• HTML-sivujen rakenteessa ja GET-pyyntöjen toiminnassa,
• oppia kirjoittamaan yksinkertaisia säännöllisiä lausekkeita,
• oppia tuntemaan API ja JSON,
• tehdä useita pyyntöjä sivustoille ja kerätä tietoja.
JSONPythonREST APIWeb-kaappaus
13 sprintti 3 viikkoa
Valmistumisprojekti
Vahvista viimeisessä projektissa, että olet oppinut uuden ammatin. Selvitä asiakkaan tehtävä ja käy läpi kaikki data-analyysin vaiheet. Nyt ei ole oppitunteja tai läksyjä - kaikki on kuin oikeassa työssä.
Loppusprintti sisältää projektityöt, A/B-testauksen ja SQL-tehtävät sekä lisätehtävän. Projekti sisältää ongelman selvityksen, odotetun tuloksen, tietojoukon ja niiden kuvauksen.
Tehtävä liittyy yhteen viidestä liiketoiminta-alueesta:
• pankit,
• jälleenmyynti,
• pelit,
• mobiilisovellukset,
• sähköinen kaupankäynti.
Hankkeen vaiheista ei tule tavanomaista kuvausta. Työskentelet ne itse.
SQ LPython PandasTableau Dashboards Postgre SQL Decomposition A/B -testaus