Oinarrizko datuak
- Inicio: Proximamente.
- Finalización: Proximamente.
- Créditos ECTS: 60.
- Metodología: Online.
- Idioma: Español.
Eskatu informazioa
Aurkezpena
Explora los fundamentos de la programación, analítica de datos y aprendizaje automatico con como Python, Pandas, Plotly y Scikit-learn.
Sumérgete en la analítica avanzada, desarrollando modelos supervisados y no supervisados, y aventúrate a minar datos del sector de las redes eléctricas inteligentes. Ideal para quienes desean transformar datos en decisiones estratégicas mediante técnicas avanzadas de inteligencia artificial y así afrontar desafíos reales en el mundo de la ciencia de datos.
Ikasketa plana
1. Jardunaldia Programazioari, datuei eta AAri buruzko oinarrizko kontzeptuak
AArekin lan egin ahal izateko beharrezkoak diren oinarriak landuko dira:
- Programación: desarrollar y ejecutar código Python.
- Fundamentos de bases de datos y su explotación usando SQL para obtener grandes cantidades de datos que serán la fuente con la que realizar analítica avanzada.
- Conceptos generales de la IA y la ciencia de datos
4 Moduluak
2. ATALA Datuen analisia
Se aprenderán técnicas de analítica de datos orientadas a la inteligencia artificial :
- La librería Pandas como navaja suiza para la analítica de datos
- Minería de datos: búsqueda y extracción de datos relevantes para preparar los mejores conjuntos de datos para tu modelo de aprendizaje automático.
- Acceso diversas a fuentes de datos: Ficheros, bases de datos, APIs y web scraping.
- Estatistika deskribatzailea eta inferentziala
3 Moduluak

3. Datuak bistaratzea
Dominaremos distintos métodos para mostrar los datos de forma visual:
- Librerías especializada para gráficos, como Matplotlib y Plotly.
- Cómo seleccionar el mejor gráfico para trasmitir tus descubrimientos.
- Herramientas de Business Inteligence para la toma de decisiones estratégicas basadas en el dato.
3 Moduluak
4. ATALA Machine Learning
Nos sumergiremos de lleno en las técnicas de Machine Learning (aprendizaje automático):
- Ikaskuntza bidez erabakiak hartzen dituzten ereduen diseinua eta funtzionamendua:
- Aprendizaje supervisado: regresión y clasificación.
- Aprendizaje no supervisado: clustering, detección de anomalías y reducción de dimensionalidad.
3 Moduluak
Moduluak
1. Jardunaldia Programazioari, datuei eta AAri buruzko oinarrizko kontzeptuak
1. Jardunaldia Python-ekin programatzeko sarrera

- Python: programazio-lengoaia oso erraza eta erabilera anitzekoa da, eta asko erabiltzen da web-garapenean, datu-zientzian eta adimen lehiakorreko sistemetan. Lengoaia hori makinek ulertzen dute, haiekin komunikatu ahal izateko eta nahi duguna programatzeko.
- EX: barruko programak testu (kode) bat dira, eta aplikazioak bete behar dituen aginduak/funtzionamendua adierazten dute.
- Erabiltzen duten enpresak: Youtube, Instagram, Pinterest
- Anaconda: Pythonen AAko proiektuetan lan egiteko erabiltzen diren programen eta tresnen bilduma
- EX: Python-ek IA garatzeko aukera ematen digu, telefono batek deiak egiteko aukera ematen digun bezala. Hala ere, telefonoa ez da horretara mugatzen, eta txateatzeko, argazkiak egiteko eta abarretarako aukera ematen digu. Anaconda-k aukera ematen digu gure proiektuetan garapen-aukerak zabaltzeko.
- Erabiltzen duten enpresak: Uber, Netflix, Facebook
- Liburutegiak: Kode bat da (programa baten atalak), zure programei funtzionalitate gehiago eransteko balio duena, 0tik hasita egin beharrik izan gabe. Funtzionalitate horiek hainbat programatan berrerabil daitezke, eta, hala, tresna eta funtzio gehiago izango dituzu zure proiektuetan erabiltzeko.
- EX: tortilla bat egiteko, olioa erabiltzen duzu, baina olio horrek beste zerbait prestatzeko ere balio dezake
- EX2: Urdaiazpiko-ogitarteko bat egin nahi baduzu, ez duzu zertan ogi bat laberatu; dendara joan zaitezke, eta eginda dagoen ogi bat lor dezakezu.
- Pakete-kudeatzailea: liburutegiak deskargatzeko eta eguneratzeko tresna erabilgarria
- EX: liburutegietako google play store
2. ATALA Datu-baseak

Datuak biltegiratzeko sistemak, ondoren erabiltzeko/aztertzeko
EX: Espainiako biztanleen edo instagrameko erabiltzaileen datu guztiak datu-baseetan gordetzen dira.
- Erlazionalak: tauletan gordetzen dute informazioa (zaharragoak dira, baina enpresetan asko erabiltzen dira).
- EX: transakzioak (Amazon, AirBnb), pertsonen datuak biltegiratzea (hotelak, ikastetxeak, enpresak...).
- Ez erlazionalak: informazioa taulez bestelako formatuetan gordetzen duten datu-base modernoenak dira. Ez dute egitura finkoko taulak izan beharrik, eta, horregatik, askatasun handiagoa ematen dute, eta, beraz, gero eta gehiago erabiltzen dira.
- EX: sareetan (Twitter, Facebook) egituratu gabeko datu-bolumen handiak.
- egituratu gabeko datuak: egitura bati jarraitzen ez dioten eta beti berdinak ez diren datu solteak.
- EX: Hotel batean izena ematen dugunean, adibidez, behar dituzten datu guztiak eskatzen dizkigute, eta, beraz, datu-base erlazionalek (taulek) ongi funtzionatzen dute. Hala ere, Interneten hazkundearekin, batez ere, datu asko osatu gabe daude edo ez dute egitura bera, iturri desberdinetatik ateratzen direlako.
- EX: Demagun gure ezagun guztien izena, adina eta bizitokia gorde nahi ditugula, eta, horretarako, instagram bidez bilaketak egiten ditugu. Profil batzuek ez dute zehazten, agian, zer adin duten edo non bizi diren, baina esaldi polit bat dute. Profil horiek pribatuak ere izan daitezke, eta izena besterik ez dakigunean, edo ezizena dutenak eta benetako izena ez dakigunean. Adibidez: Koldo, 15, Bilbo / Maria, Madril / Pablo, “Life is short, make every moment”.
- Operazionalak: indizeak (liburuetakoak, adibidez) edo triggerrak (automatizazioak) dituzten mekanismoak dituzte. Datuak gehitzean, ezabatzean edo editatzean, eragiketa-abiadura handiak ahalbidetzen dituzte mekanismo horiek, eta, horregatik, egunero erabiltzeko diseinatuta daude.
- EX: produktuen salmenta erostea (Wallmart).
- Informaziozkoak: helburua da datuen kontsulta konplexuak azkar egin ahal izatea; beraz, erabilera handia dute analisiaren eta erabakiak hartzearen arloan.
- EX: erabiltzaileen datuen analisia (Netflix)
- Transakzionalak: erabiltzaileen segurtasunari eusten diote, eragiketak zorrotz kontrolatuz. Horri esker, sistemen abiadura moteldu egiten da, baina indartu. Datu-base mota hau ezin hobea da transakzio azkar eta seguruak egiteko.
- EX: produktuak online dendetan erostea (eBay)
3. SQL

Gehien erabiltzen den datu-base erlazionala kudeatzeko lengoaia
Ex: programak hizkuntza bat erabiliz sortzen diren bezala, datu-baseak ere bai.
- Taulak, indizeak eta ikuspegiak sortzea: datu-baseak diseinatzea eta sortzea
- Taulek: Excel orri baten egitura bera dute.
- Aurkibideek: liburu bateko aurkibideek bezala funtzionatzen dute
- Ikuspegiak: interesatzen zaiguna erakusteko iragazki batzuk dituzten taulak dira
- SQL kontsultak: datu-basean gordetako informazioa lortzeko erabiltzen dira (datu-bilaketa).
- EX:: datu-baseari egiten zaizkion galderak dira, eta hark duen informazioarekin erantzuten dizu, hizkuntzaren bidez
4. ATALA Datuen zientziarako eta AArako sarrera

- Analisi-motak:
- Deskribatzailea: datuak aztertzen ditu, gertatutakoa ulertzeko.
- EX: azken urteko salmenten hileko txostena.
- Prediktiboa: datuak analizatzen ditu etorkizuneko gertaerak edo joerak iragartzeko
- EX: stockik ez izateko denda baten inbentario optimoa iradokitzen duen sistema.
- Aginduzkoa: erabakiak hartzeko eta helburuak lortzeko aztertzen ditu datuak.
- EX: produktibitatea hobetzeko langileen gaitasunak aztertzen dituen sistema.
Moduluak
2. ATALA Datuen analisia
1. Datuak esploratzeko analisia Pandas-ekin

- Pandak: datuak manipulatzeko funtsezko liburutegia.
- Dataset: datu-bilduma antolatua.
- EX: Excel fitxategia.
- Dataframe: datu-taula
2. ATALA Datu-iturriak inportatzen

- Datu-baseetarako konexioak: datu-baseetan gordetako datuetarako sarbidea.
- APIetarako sarbidea: web zerbitzuetako datuak lortzeko aplikazioen funtzioak.
- EX: programa baten bidez aplikazio jakin baten funtzioak egiteko aukera ematen dizun aplikazio batera sartzea bezalakoa izango litzateke; nik nahi badut programa batek nire instagramera argazki bat igotzea astelehenero automatikoki, programak API bat erabiltzen du, eta horrek, adibidez, “argazkia igo” funtzioa erabiltzeko aukera ematen dizu.
- egituratu gabeko datuak: egitura bati jarraitzen ez dioten eta beti berdinak ez diren datu solteak.
- EX: Lortu Twitter aplikazioaren erabiltzaile baten izena, biografia, txioak...
- EX: Drive / Dropbox fitxategiak deskargatzea.
3. Estatistika deskribatzailea eta inferentziala

- Deskribatzailea: datuen laburpena metrika desberdinen bidez
- EX: batez besteko per capita errenta x eskualdetan.
- Inferentziala: atera ondorioak datu-lagin batean oinarrituta.
- EX: x pertsonak gaixotasuna izateko duen probabilitatea kalkulatzea, inguruko biztanleak aztertuta.
Moduluak
3. Datuak bistaratzea
1. Jardunaldia Datuak bistaratzeko liburutegiak Python-erako

- Matplotlib: 2Dko datuak edo estatistikak erakusten dituzten grafikoak egin ahal izateko liburutegia.
- Ploty: Grafiko interaktiboak sortzeko tresna.
- Dataframe-a bistaratzea: erabili grafikoak datuak Pandas-en analizatzeko.
2. ATALA Enpresa-adimena

- Emaitzak jakinarazteko eta aurkezteko tresnak eta plataformak:
- Tableau: Bistaratze interaktiboak eta dashboardak sortzeko plataforma.
- EX: enpresa bateko marketin- eta salmenta-errendimendua bistaratzea.
- Google Data Studio: Txostenak eta dashboard interaktiboak sortzeko doako tresna.
- EX: web-trafikoko datuen eta publizitate-kanpainen azterketa.
- Dashboards Streamlit-ekin: Datuak bistaratzeko web-aplikazio interaktiboak sortzeko tresna.
3. Dashboard: egoera erraz ulertzeko grafikoak eta datu garrantzitsuak dituen pantaila

Moduluak
4. ATALA Machine Learning
1. Jardunaldia Machine Learning: sarrera

- Machine Learning motak: ikuskatua eta gainbegiratu gabea.
- Sailkapena: esleitu kategoriak datuei.
- EX: sukarra, eztula, nekea → sailkapena: gripea.
- Erregresioa: zenbakizko balio jarraituak aurreikustea.
- EX: adibidez, Coca Colak azken urteetan burtsan izan duen balioaren grafikoa ikusita, zure ekintzek etorkizunean izango duten balioa aurreikus dezakezu.
2. ATALA Ikaskuntza gainbegiratua

Eredu bat (AA) datu etiketatuen bidez ikasteko prozesua
EX: AAri irakastea, bere deskribapena ezagutzen dugun datu-multzo batekin elikatuz; adibidez, argazki batzuen kasuan, aurretik sailkatuta egon daitezke (sagarra, txakurra, hondartza…), eta ideia litzateke AAri irudi berri bat ematean, deskribapenik ez duena, ikasitakoarekin zehaztu ahal izatea.
- Ereduen trebakuntza: AAri datu etiketatuak erabiliz erakusteko prozesua.
- Algoritmoak: problemak ebazteko metodoak (ereduak ikasteko hainbat modu).
- Ensembling: modelo bat baino gehiagoren konbinazioa hobea lortzeko.
- Ebaluazioa: ereduaren erantzuna neurtzea, ereduaren kalitatea zehazteko probak eginez.
- Doitze eta hobetzea: parametroak doitzea / eredua konfiguratzea emaitza hobeak lortzeko (adibidez, instagram-iragazkiak erabiltzea)
- CdU (erabilera-kasuak) / IDS (sistemen identifikazioa):
- EX:Machine Learning erabiltzea bankuko iruzurrak detektatzeko.
4. ATALA Gainbegiratu gabeko ikaskuntza

Eredu bat (AA) etiketatu gabeko datuen bidez ikasteko prozesua, gero taldekatzeko
adibidez: argazki-multzo bat duzu, baina ez dute deskribapenik; kasu honetan, argazkiak multzokatzen dira, antzekotasunak kontuan hartuta.
- Clustering: datuak etiketarik gabe multzokatzea.
- EX:kanikak koloreka multzokatzea.
- Algoritmoak: datuetan patroiak identifikatzeko zenbait metodo.