Adimen artifiziala

Oinarrizko datuak

  • Inicio: Proximamente.
  • Estado: - . 
  • Horas de formación: 240 horas itinerario completo.
  • Metodología: Online (laboratorio presencial en Bizkaia).
  • Idioma: Español.

Aurkezpena

Domina técnicas de programación, analítica avanzada, visualización y machine learning para transformar datos en decisiones estratégicas en el sector energético.

Aprenderás a transformar grandes volúmenes de datos en información útil: descubrirás técnicas estadísticas, análisis exploratorio y visualización avanzada con lenguajes como Python y SQL, y herramientas como Pandas, Matplotlib y Plotly. Profundizarás en Machine Learning para crear modelos predictivos y segmentar datos mediante algoritmos supervisados y no supervisados, optimizando procesos y descubriendo patrones clave. Conviértete en experto en ciencia de datos aplicada a la inteligencia artificial para impulsar decisiones estratégicas en el sector energético.

Ikasketa plana

1. Jardunaldia Programazioari, datuei eta AAri buruzko oinarrizko kontzeptuak

AArekin lan egin ahal izateko beharrezkoak diren oinarriak landuko dira:

  • Descubrirás cómo la inteligencia artificial y la ciencia de datos transforman las redes eléctricas, aprendiendo a programar en Pythony SQL, analizar datos y crear visualizaciones para tomar decisiones basadas en datos. 
  • Aprenderás desde cero a programar enPython, gestionar entornos con Anaconda y Jupyter Notebook, y dominar las estructuras básicas, operadores, funciones y librerías esenciales para el análisis de datos. 
  • Comprenderás los fundamentos de las bases de datos relacionales y NoSQL, sus modelos, tipos y aplicaciones en el sector eléctrico. 
  • Dominarás SQL para gestionar y analizar datos: aprenderás a crear consultas, filtrar, agrupar, unir tablas y aplicar funciones avanzadas, todo integrado con Python yPandas en Jupyter Notebook.
4 Moduluak

2. ATALA Datuen analisia

Se aprenderán técnicas de analítica para tratar grandes volúmenes de datos:

  • Te convertirás en usuario avanzado de Pandas, la librería esencial para el análisis de datos:crearás y transformarás tablas, filtrarás información, agruparás resultados y automatizarás la gestión de datos en distintos formatos. 
  • Comprenderás los conceptos clave de la estadística aplicada a datos reales, como medias, medianas, varianzas, correlaciones y pruebas de hipótesis, para interpretar y validar información de manera rigurosa. 
  • Dominarás el análisis exploratorio de datos conPython, aprendiendo a limpiar, preparar y explorar conjuntos de datos, detectar valores atípicos y trabajar con series temporales, utilizando herramientas prácticas y actuales.
3 Moduluak
AI planaren argazkia
AI planaren argazkia

3. Datuak bistaratzea

Dominaremos distintos métodos para mostrar los datos de forma visual:

  • Descubrirás cómo transformar datos en gráficos claros y atractivos, aprendiendo a utilizar herramientas como Matplotlib y Plotlypara visualizar información, detectar patrones y comunicar resultados de forma visual. 
  • Aprenderás a elegir y crear el gráfico adecuado para cada situación: líneas para tendencias, barras para comparar categorías, histogramas para distribuciones, dispersión para relaciones entre variables, mapas de calor, diagramas de Sankey y mapas geográficos, entre otros. 
  • Desarrollarás habilidades para presentar resultados de manera profesional, combinando visualizaciones, storytelling y dashboards interactivos, logrando que tus análisis sean comprensibles, impactantes y útiles para la toma de decisiones.


3 Moduluak

4. ATALA Machine Learning

Nos sumergiremos de lleno en las técnicas de Machine Learning (aprendizaje automático):

  • Comprenderás los conceptos clave del aprendizaje automático, los tipos de analítica y el ciclo de vida de un proyecto de datos, desde la preparación y modelado hasta la evaluación e implementación de modelos predictivos. 
  • Dominarás los algoritmos principales de aprendizaje supervisado, como regresión, clasificación, árboles de decisión, SVM, KNN y ensamblado de modelos, aprendiendo a seleccionar, optimizar y explicar modelos para resolver problemas reales. 
  • Aprenderás a identificar patrones y segmentar datos mediante técnicas como clustering, reducción de dimensionalidad y detección de anomalías, utilizando algoritmos como K-means, DBSCAN, PCA e Isolation Forest.
3 Moduluak

Moduluak

1. Conceptos básicos de programación, datos e IA (40 horas)

1. Jardunaldia Python-ekin programatzeko sarrera

geziaren xehetasun
  • Python: programazio-lengoaia oso erraza eta erabilera anitzekoa da, eta asko erabiltzen da web-garapenean, datu-zientzian eta adimen lehiakorreko sistemetan. Lengoaia hori makinek ulertzen dute, haiekin komunikatu ahal izateko eta nahi duguna programatzeko.
  • EX: los programas por dentro son texto (código) que indica las ordenes/funcionamiento que debe cumplir la aplicación.
  • Erabiltzen duten enpresak: Youtube, Instagram, Pinterest
  • Anaconda: Pythonen AAko proiektuetan lan egiteko erabiltzen diren programen eta tresnen bilduma
  • EX: Python-ek IA garatzeko aukera ematen digu, telefono batek deiak egiteko aukera ematen digun bezala. Hala ere, telefonoa ez da horretara mugatzen, eta txateatzeko, argazkiak egiteko eta abarretarako aukera ematen digu. Anaconda-k aukera ematen digu gure proiektuetan garapen-aukerak zabaltzeko.
  • Erabiltzen duten enpresak: Uber, Netflix, Facebook
  • Liburutegiak: Kode bat da (programa baten atalak), zure programei funtzionalitate gehiago eransteko balio duena, 0tik hasita egin beharrik izan gabe. Funtzionalitate horiek hainbat programatan berrerabil daitezke, eta, hala, tresna eta funtzio gehiago izango dituzu zure proiektuetan erabiltzeko.
  • EX: tortilla bat egiteko, olioa erabiltzen duzu, baina olio horrek beste zerbait prestatzeko ere balio dezake
  • EX2: Urdaiazpiko-ogitarteko bat egin nahi baduzu, ez duzu zertan ogi bat laberatu; dendara joan zaitezke, eta eginda dagoen ogi bat lor dezakezu.
  • Pakete-kudeatzailea: liburutegiak deskargatzeko eta eguneratzeko tresna erabilgarria
  • EX: liburutegietako google play store

2. ATALA Datu-baseak

geziaren xehetasun

Datuak biltegiratzeko sistemak, ondoren erabiltzeko/aztertzeko
EX: Espainiako biztanleen edo instagrameko erabiltzaileen datu guztiak datu-baseetan gordetzen dira.

  • Relacionales: guardan la información en tablas (más antiguas pero muy usadas en las empresas).
  • EX: transacciones (Amazon, AirBnb), almacenamiento de datos de personas (Hoteles, colegios, empresas..).
  • No relacionales: el tipo de bases de datos más modernas que guardan la información en otros formatos distintos a las tablas, no hace falta que sean tablas con una estructura fija y por ello da más libertad y por lo tanto son cada vez más usadas.
  • EX: grandes volúmenes de datos no estructurados en redes (Twitter, Facebook).
  • egituratu gabeko datuak: egitura bati jarraitzen ez dioten eta beti berdinak ez diren datu solteak.
  • EX: Cuando nos inscribimos en un hotel por ejemplo nos piden todos los datos que necesitan, por lo que las bases de datos relacionales(tablas) funcionan bien, sin embargo con el crecimiento de internet sobre todo, hay muchos datos incompletos o que no siguen la misma estructura siempre por que se extraen de distintas fuentes.
  • EX: Demagun gure ezagun guztien izena, adina eta bizitokia gorde nahi ditugula, eta, horretarako, instagram bidez bilaketak egiten ditugu. Profil batzuek ez dute zehazten, agian, zer adin duten edo non bizi diren, baina esaldi polit bat dute. Profil horiek pribatuak ere izan daitezke, eta izena besterik ez dakigunean, edo ezizena dutenak eta benetako izena ez dakigunean. Adibidez: Koldo, 15, Bilbo / Maria, Madril / Pablo, “Life is short, make every moment”.
  • Operazionalak: indizeak (liburuetakoak, adibidez) edo triggerrak (automatizazioak) dituzten mekanismoak dituzte. Datuak gehitzean, ezabatzean edo editatzean, eragiketa-abiadura handiak ahalbidetzen dituzte mekanismo horiek, eta, horregatik, egunero erabiltzeko diseinatuta daude.
  • EX: compra venta de productos (Wallmart).
  • Informaziozkoak: helburua da datuen kontsulta konplexuak azkar egin ahal izatea; beraz, erabilera handia dute analisiaren eta erabakiak hartzearen arloan.
  • EX: erabiltzaileen datuen analisia (Netflix)
  • Transakzionalak: erabiltzaileen segurtasunari eusten diote, eragiketak zorrotz kontrolatuz. Horri esker, sistemen abiadura moteldu egiten da, baina indartu. Datu-base mota hau ezin hobea da transakzio azkar eta seguruak egiteko.
  • EX: produktuak online dendetan erostea (eBay)

3. SQL

geziaren xehetasun

Gehien erabiltzen den datu-base erlazionala kudeatzeko lengoaia
Ex: programak hizkuntza bat erabiliz sortzen diren bezala, datu-baseak ere bai.

  • Taulak, indizeak eta ikuspegiak sortzea: datu-baseak diseinatzea eta sortzea
  • Tablas: tienen la misma estructura que una hoja de excel.
  • Aurkibideek: liburu bateko aurkibideek bezala funtzionatzen dute
  • Ikuspegiak: interesatzen zaiguna erakusteko iragazki batzuk dituzten taulak dira
  • Consultas SQL: usadas para la obtención de información almacenada en la base de datos (búsqueda de datos).
  • EX:: datu-baseari egiten zaizkion galderak dira, eta hark duen informazioarekin erantzuten dizu, hizkuntzaren bidez

4. ATALA Datuen zientziarako eta AArako sarrera

geziaren xehetasun
  • Tipos de analítica:
  • Descriptiva: analiza los datos para entender lo sucedido.
  • EX: azken urteko salmenten hileko txostena.
  • Prediktiboa: datuak analizatzen ditu etorkizuneko gertaerak edo joerak iragartzeko
  • EX: sistema que sugiere el inventario óptimo de una tienda para evitar la falta de stock.
  • Prescriptiva: analiza datos para tomar decisiones y lograr objetivos.
  • EX: sistema que analiza capacidades de trabajadores para mejorar la productividad.

Moduluak

2. Analítica de Datos (60 horas)

1. Datuak esploratzeko analisia Pandas-ekin

geziaren xehetasun
  • Pandas: librería fundamental para manipulación de datos.
  • Dataset: colección de datos organizada.
  • EX: archivo de excel.
  • Dataframe: tabla de datos

2. ATALA Datu-iturriak inportatzen

geziaren xehetasun
  • Conexiones a base de datos: acceso a datos almacenados en bases de datos.
  • APIetarako sarbidea: web zerbitzuetako datuak lortzeko aplikazioen funtzioak.
  • EX: programa baten bidez aplikazio jakin baten funtzioak egiteko aukera ematen dizun aplikazio batera sartzea bezalakoa izango litzateke; nik nahi badut programa batek nire instagramera argazki bat igotzea astelehenero automatikoki, programak API bat erabiltzen du, eta horrek, adibidez, “argazkia igo” funtzioa erabiltzeko aukera ematen dizu.
  • egituratu gabeko datuak: egitura bati jarraitzen ez dioten eta beti berdinak ez diren datu solteak.
  • EX: Lortu Twitter aplikazioaren erabiltzaile baten izena, biografia, txioak...
  • EX: Drive / Dropbox fitxategiak deskargatzea.

3. Estatistika deskribatzailea eta inferentziala

geziaren xehetasun
  • Deskribatzailea: datuen laburpena metrika desberdinen bidez
  • EX: media de renta per cápita en x región.
  • Inferentziala: atera ondorioak datu-lagin batean oinarrituta.
  • EX: x pertsonak gaixotasuna izateko duen probabilitatea kalkulatzea, inguruko biztanleak aztertuta.

Moduluak

3. Visualización de Datos (20 horas)

1. Jardunaldia Datuak bistaratzeko liburutegiak Python-erako

geziaren xehetasun
  • Matplotlib: Librería para poder hacer gráficos que muestren datos y/o estadísticas en 2D.
  • Ploty: Grafiko interaktiboak sortzeko tresna.
  • Dataframe-a bistaratzea: erabili grafikoak datuak Pandas-en analizatzeko.

2. ATALA Enpresa-adimena

geziaren xehetasun
  • Herramientas y plataformas para la comunicación y presentación de resultados:
  • Tableau: Plataforma para crear visualizaciones interactivas y dashboards.
  • EX: enpresa bateko marketin- eta salmenta-errendimendua bistaratzea.
  • Google Data Studio: Txostenak eta dashboard interaktiboak sortzeko doako tresna.
  • EX: análisis de datos de tráfico web y campañas publicitarias.
  • Dashboards con Streamlit: Herramienta para crear aplicaciones web interactivas para visualización de datos.

3. Dashboard: egoera erraz ulertzeko grafikoak eta datu garrantzitsuak dituen pantaila

geziaren xehetasun

Moduluak

4. Machine Learning (100 horas)

1. Jardunaldia Machine Learning: sarrera

geziaren xehetasun
  • Machine Learning motak: ikuskatua eta gainbegiratu gabea.
  • Sailkapena: esleitu kategoriak datuei.
  • EX: fiebre,tos,cansancio → clasificación: gripe.
  • Erregresioa: zenbakizko balio jarraituak aurreikustea.
  • EX: adibidez, Coca Colak azken urteetan burtsan izan duen balioaren grafikoa ikusita, zure ekintzek etorkizunean izango duten balioa aurreikus dezakezu.

2. ATALA Ikaskuntza gainbegiratua

geziaren xehetasun

Eredu bat (AA) datu etiketatuen bidez ikasteko prozesua
EX: AAri irakastea, bere deskribapena ezagutzen dugun datu-multzo batekin elikatuz; adibidez, argazki batzuen kasuan, aurretik sailkatuta egon daitezke (sagarra, txakurra, hondartza…), eta ideia litzateke AAri irudi berri bat ematean, deskribapenik ez duena, ikasitakoarekin zehaztu ahal izatea.

  • Entrenamiento de modelos: proceso de enseñar a la IA usando datos etiquetados.
  • Algoritmos: métodos para resolver problemas (distintas formas de que aprenda el modelo).
  • Ensembling: combinación de varios modelos para conseguir uno mejor.
  • Ebaluazioa: ereduaren erantzuna neurtzea, ereduaren kalitatea zehazteko probak eginez.
  • Doitze eta hobetzea: parametroak doitzea / eredua konfiguratzea emaitza hobeak lortzeko (adibidez, instagram-iragazkiak erabiltzea)
  • CdU (casos de uso) / IDS (identificación de sistemas):
  • EX:Machine Learning erabiltzea bankuko iruzurrak detektatzeko.

4. ATALA Gainbegiratu gabeko ikaskuntza

geziaren xehetasun

Eredu bat (AA) etiketatu gabeko datuen bidez ikasteko prozesua, gero taldekatzeko
adibidez: argazki-multzo bat duzu, baina ez dute deskribapenik; kasu honetan, argazkiak multzokatzen dira, antzekotasunak kontuan hartuta.

  • Clustering: agrupamiento de datos sin etiquetas.
  • EX:kanikak koloreka multzokatzea.
  • Algoritmoak: datuetan patroiak identifikatzeko zenbait metodo.