Oinarrizko datuak
- Inicio: Proximamente.
- Finalización: Proximamente.
- Créditos ECTS: 60.
- Metodología: Online.
- Idioma: Español.
Eskatu informazioa
Aurkezpena
Programazioaren, datu-analisiaren eta bistaratzearen oinarriak aztertzen ditu, Python, Pandas, Matplotlib eta Tableau tresnekin, besteak beste.
Murgildu machine learning-ean, eredu gainbegiratuak eta ez-gainbegiratuak garatuz, eta abenturatu deep learning-ean. Ezin hobea da datuak erabaki estrategiko bihurtu nahi dituztenentzat adimen artifizialeko teknika aurreratuen bidez, datuen zientziaren munduko benetako erronkei aurre egiteko.
Ikasketa plana
1. Jardunaldia Programazioari, datuei eta AAri buruzko oinarrizko kontzeptuak
AArekin lan egin ahal izateko beharrezkoak diren oinarriak landuko dira:
- AArekin lan egin ahal izateko beharrezkoak diren oinarriak landuko dira:
- AProgramazioa: AAren kodea garatzea eta exekutatzea
- Datu-baseak: AAen iturri izango diren datu-kopuru handiak biltegiratzea eta erabiltzea
- Kontzeptu orokorrak: AAren funtzionamendua eta aplikazioa
4 Moduluak
2. ATALA Datuen analisia
Datuen erauzketa eta ondorengo analisia:
- Datuen erauzketa eta ondorengo analisia:
- Python eta Pandas bezalako liburu-dendak
- Datu-meatzaritza: datu garrantzitsuak bilatzea eta erauztea
- Datu-iturrietarako sarbidea
- BD: datu-baseak
- Web scraping: webguneko datuak modu automatizatuan lortzea
- ex: robot bat orrialde desberdinetan sartu eta informazioa bertatik aterako balu bezala da
- Adibidez: Amazonen prezioen zerrenda automatikoki deskargatzea
- Estatistika deskribatzailea eta inferentziala
3 Moduluak
3. Datuak bistaratzea
Datuak modu bisualean erakusteko metodoak, hauen bidez:
- Dataframeetan liburutegiak erabiltzea datuak bistaratzeko.
- Business Inteligence oinarrizkoa da datuan oinarritutako erabaki estrategikoak hartzeko.
3 Moduluak
4. ATALA Machine Learning
Machine Learning (ikasketa automatikoa):
- Oinarrizko kontzeptu teorikoak
- Ikaskuntza bidez erabakiak hartzen dituzten ereduen diseinua eta funtzionamendua:
- Gainbegiratua
- Gainbegiratu gabea
3 Moduluak
Moduluak
1. Jardunaldia Programazioari, datuei eta AAri buruzko oinarrizko kontzeptuak
1. Jardunaldia Python-ekin programatzeko sarrera
- Python: programazio-lengoaia oso erraza eta erabilera anitzekoa da, eta asko erabiltzen da web-garapenean, datu-zientzian eta adimen lehiakorreko sistemetan. Lengoaia hori makinek ulertzen dute, haiekin komunikatu ahal izateko eta nahi duguna programatzeko.
- EX: barruko programak testu (kode) bat dira, eta aplikazioak bete behar dituen aginduak/funtzionamendua adierazten dute.
- Erabiltzen duten enpresak: Youtube, Instagram, Pinterest
- Anaconda: Pythonen AAko proiektuetan lan egiteko erabiltzen diren programen eta tresnen bilduma
- EX: Python-ek IA garatzeko aukera ematen digu, telefono batek deiak egiteko aukera ematen digun bezala. Hala ere, telefonoa ez da horretara mugatzen, eta txateatzeko, argazkiak egiteko eta abarretarako aukera ematen digu. Anaconda-k aukera ematen digu gure proiektuetan garapen-aukerak zabaltzeko.
- Erabiltzen duten enpresak: Uber, Netflix, Facebook
- Liburutegiak: Kode bat da (programa baten atalak), zure programei funtzionalitate gehiago eransteko balio duena, 0tik hasita egin beharrik izan gabe. Funtzionalitate horiek hainbat programatan berrerabil daitezke, eta, hala, tresna eta funtzio gehiago izango dituzu zure proiektuetan erabiltzeko.
- EX: tortilla bat egiteko, olioa erabiltzen duzu, baina olio horrek beste zerbait prestatzeko ere balio dezake
- EX2: Urdaiazpiko-ogitarteko bat egin nahi baduzu, ez duzu zertan ogi bat laberatu; dendara joan zaitezke, eta eginda dagoen ogi bat lor dezakezu.
- Pakete-kudeatzailea: liburutegiak deskargatzeko eta eguneratzeko tresna erabilgarria
- EX: liburutegietako google play store
2. ATALA Datu-baseak
Datuak biltegiratzeko sistemak, ondoren erabiltzeko/aztertzeko
EX: Espainiako biztanleen edo instagrameko erabiltzaileen datu guztiak datu-baseetan gordetzen dira.
- Erlazionalak: tauletan gordetzen dute informazioa (zaharragoak dira, baina enpresetan asko erabiltzen dira).
- EX: transakzioak (Amazon, AirBnb), pertsonen datuak biltegiratzea (hotelak, ikastetxeak, enpresak...).
- Ez erlazionalak: informazioa taulez bestelako formatuetan gordetzen duten datu-base modernoenak dira. Ez dute egitura finkoko taulak izan beharrik, eta, horregatik, askatasun handiagoa ematen dute, eta, beraz, gero eta gehiago erabiltzen dira.
- EX: sareetan (Twitter, Facebook) egituratu gabeko datu-bolumen handiak.
- egituratu gabeko datuak: egitura bati jarraitzen ez dioten eta beti berdinak ez diren datu solteak.
- EX: Hotel batean izena ematen dugunean, adibidez, behar dituzten datu guztiak eskatzen dizkigute, eta, beraz, datu-base erlazionalek (taulek) ongi funtzionatzen dute. Hala ere, Interneten hazkundearekin, batez ere, datu asko osatu gabe daude edo ez dute egitura bera, iturri desberdinetatik ateratzen direlako.
- EX: Demagun gure ezagun guztien izena, adina eta bizitokia gorde nahi ditugula, eta, horretarako, instagram bidez bilaketak egiten ditugu. Profil batzuek ez dute zehazten, agian, zer adin duten edo non bizi diren, baina esaldi polit bat dute. Profil horiek pribatuak ere izan daitezke, eta izena besterik ez dakigunean, edo ezizena dutenak eta benetako izena ez dakigunean. Adibidez: Koldo, 15, Bilbo / Maria, Madril / Pablo, “Life is short, make every moment”.
- Operazionalak: indizeak (liburuetakoak, adibidez) edo triggerrak (automatizazioak) dituzten mekanismoak dituzte. Datuak gehitzean, ezabatzean edo editatzean, eragiketa-abiadura handiak ahalbidetzen dituzte mekanismo horiek, eta, horregatik, egunero erabiltzeko diseinatuta daude.
- EX: produktuen salmenta erostea (Wallmart).
- Informaziozkoak: helburua da datuen kontsulta konplexuak azkar egin ahal izatea; beraz, erabilera handia dute analisiaren eta erabakiak hartzearen arloan.
- EX: erabiltzaileen datuen analisia (Netflix)
- Transakzionalak: erabiltzaileen segurtasunari eusten diote, eragiketak zorrotz kontrolatuz. Horri esker, sistemen abiadura moteldu egiten da, baina indartu. Datu-base mota hau ezin hobea da transakzio azkar eta seguruak egiteko.
- EX: produktuak online dendetan erostea (eBay)
3. SQL
Gehien erabiltzen den datu-base erlazionala kudeatzeko lengoaia
Ex: programak hizkuntza bat erabiliz sortzen diren bezala, datu-baseak ere bai.
- Taulak, indizeak eta ikuspegiak sortzea: datu-baseak diseinatzea eta sortzea
- Taulek: Excel orri baten egitura bera dute.
- Aurkibideek: liburu bateko aurkibideek bezala funtzionatzen dute
- Ikuspegiak: interesatzen zaiguna erakusteko iragazki batzuk dituzten taulak dira
- SQL kontsultak: datu-basean gordetako informazioa lortzeko erabiltzen dira (datu-bilaketa).
- EX:: datu-baseari egiten zaizkion galderak dira, eta hark duen informazioarekin erantzuten dizu, hizkuntzaren bidez
4. ATALA Datuen zientziarako eta AArako sarrera
- Analisi-motak:
- Deskribatzailea: datuak aztertzen ditu, gertatutakoa ulertzeko.
- EX: azken urteko salmenten hileko txostena.
- Prediktiboa: datuak analizatzen ditu etorkizuneko gertaerak edo joerak iragartzeko
- EX: stockik ez izateko denda baten inbentario optimoa iradokitzen duen sistema.
- Aginduzkoa: erabakiak hartzeko eta helburuak lortzeko aztertzen ditu datuak.
- EX: produktibitatea hobetzeko langileen gaitasunak aztertzen dituen sistema.
Moduluak
2. ATALA Datuen analisia
1. Datuak esploratzeko analisia Pandas-ekin
- Pandak: datuak manipulatzeko funtsezko liburutegia.
- Dataset: datu-bilduma antolatua.
- EX: Excel fitxategia.
- Dataframe: datu-taula
2. ATALA Datu-iturriak inportatzen
- Datu-baseetarako konexioak: datu-baseetan gordetako datuetarako sarbidea.
- APIetarako sarbidea: web zerbitzuetako datuak lortzeko aplikazioen funtzioak.
- EX: programa baten bidez aplikazio jakin baten funtzioak egiteko aukera ematen dizun aplikazio batera sartzea bezalakoa izango litzateke; nik nahi badut programa batek nire instagramera argazki bat igotzea astelehenero automatikoki, programak API bat erabiltzen du, eta horrek, adibidez, “argazkia igo” funtzioa erabiltzeko aukera ematen dizu.
- egituratu gabeko datuak: egitura bati jarraitzen ez dioten eta beti berdinak ez diren datu solteak.
- EX: Lortu Twitter aplikazioaren erabiltzaile baten izena, biografia, txioak...
- EX: Drive / Dropbox fitxategiak deskargatzea.
3. Estatistika deskribatzailea eta inferentziala
- Deskribatzailea: datuen laburpena metrika desberdinen bidez
- EX: batez besteko per capita errenta x eskualdetan.
- Inferentziala: atera ondorioak datu-lagin batean oinarrituta.
- EX: x pertsonak gaixotasuna izateko duen probabilitatea kalkulatzea, inguruko biztanleak aztertuta.
Moduluak
3. Datuak bistaratzea
1. Jardunaldia Datuak bistaratzeko liburutegiak Python-erako
- Matplotlib: 2Dko datuak edo estatistikak erakusten dituzten grafikoak egin ahal izateko liburutegia.
- Ploty: Grafiko interaktiboak sortzeko tresna.
- Dataframe-a bistaratzea: erabili grafikoak datuak Pandas-en analizatzeko.
2. ATALA Enpresa-adimena
- Emaitzak jakinarazteko eta aurkezteko tresnak eta plataformak:
- Tableau: Bistaratze interaktiboak eta dashboardak sortzeko plataforma.
- EX: enpresa bateko marketin- eta salmenta-errendimendua bistaratzea.
- Google Data Studio: Txostenak eta dashboard interaktiboak sortzeko doako tresna.
- EX: web-trafikoko datuen eta publizitate-kanpainen azterketa.
- Dashboards Streamlit-ekin: Datuak bistaratzeko web-aplikazio interaktiboak sortzeko tresna.
3. Dashboard: egoera erraz ulertzeko grafikoak eta datu garrantzitsuak dituen pantaila
Moduluak
4. ATALA Machine Learning
1. Jardunaldia Machine Learning: sarrera
- Machine Learning motak: ikuskatua eta gainbegiratu gabea.
- Sailkapena: esleitu kategoriak datuei.
- EX: sukarra, eztula, nekea → sailkapena: gripea.
- Erregresioa: zenbakizko balio jarraituak aurreikustea.
- EX: adibidez, Coca Colak azken urteetan burtsan izan duen balioaren grafikoa ikusita, zure ekintzek etorkizunean izango duten balioa aurreikus dezakezu.
2. ATALA Ikaskuntza gainbegiratua
Eredu bat (AA) datu etiketatuen bidez ikasteko prozesua
EX: AAri irakastea, bere deskribapena ezagutzen dugun datu-multzo batekin elikatuz; adibidez, argazki batzuen kasuan, aurretik sailkatuta egon daitezke (sagarra, txakurra, hondartza…), eta ideia litzateke AAri irudi berri bat ematean, deskribapenik ez duena, ikasitakoarekin zehaztu ahal izatea.
- Ereduen trebakuntza: AAri datu etiketatuak erabiliz erakusteko prozesua.
- Algoritmoak: problemak ebazteko metodoak (ereduak ikasteko hainbat modu).
- Ensembling: modelo bat baino gehiagoren konbinazioa hobea lortzeko.
- Ebaluazioa: ereduaren erantzuna neurtzea, ereduaren kalitatea zehazteko probak eginez.
- Doitze eta hobetzea: parametroak doitzea / eredua konfiguratzea emaitza hobeak lortzeko (adibidez, instagram-iragazkiak erabiltzea)
- CdU (erabilera-kasuak) / IDS (sistemen identifikazioa):
- EX:Machine Learning erabiltzea bankuko iruzurrak detektatzeko.
4. ATALA Gainbegiratu gabeko ikaskuntza
Eredu bat (AA) etiketatu gabeko datuen bidez ikasteko prozesua, gero taldekatzeko
adibidez: argazki-multzo bat duzu, baina ez dute deskribapenik; kasu honetan, argazkiak multzokatzen dira, antzekotasunak kontuan hartuta.
- Clustering: datuak etiketarik gabe multzokatzea.
- EX:kanikak koloreka multzokatzea.
- Algoritmoak: datuetan patroiak identifikatzeko zenbait metodo.