Datos básicos
- Inicio: Proximamente.
- Finalización: Proximamente.
- Créditos ECTS: 60.
- Metodología: Online.
- Idioma: Español.
Solicita información
Presentación
Explora los fundamentos de la programación, analítica de datos y visualización con herramientas como Python, Pandas, Matplotlib y Tableau.
Sumérgete en el machine learning, desarrollando modelos supervisados y no supervisados, y aventúrate en el deep learning. Ideal para quienes desean transformar datos en decisiones estratégicas mediante técnicas avanzadas de inteligencia artificial y así afrontar desafíos reales en el mundo de la ciencia de datos.
Plan de estudios
1. Conceptos básicos de programación, datos e IA
Se trabajarán las bases necesarias para poder trabajar con la IA:
- Se trabajarán las bases necesarias para poder trabajar con la IA:
- AProgramación: desarrollar y ejecutar código de IA
- Bases de datos: almacenamiento y manejo de grandes cantidades de datos que serán la fuente de las IA
- Conceptos generales: funcionamiento y aplicación de IA
4 Módulos
2. Analítica de Datos
Extracción de datos y su posterior análisis mediante:
- Extracción de datos y su posterior análisis mediante:
- Python y librerías como Pandas
- Mineria de datos: busqueda y extracción de datos relevantes
- Acceso a fuentes de datos
- BD: bases de datos
- Web scraping: obtención de forma automatizada de datos de la web
- ex: es como si un robot fuese metiéndose en distintas paginas y sacando la informacion de ahi
- ej: descarga de lista de precios de Amazon automaticamente
- Estadistica descriptiva e inferencial
3 Módulos
3. Visualización de datos
Métodos para mostrar los datos de forma visual mediante:
- Uso de librerías en dataframes para la visualización de los datos.
- Business Inteligence básico para la toma de decisiones estratégicas basada en el dato.
3 Módulos
4. Machine Learning
Machine Learning (aprendizaje automático):
- Conceptos teóricos fundamentales
- Diseño y funcionamiento de modelos que toman decisiones mediante aprendizaje:
- Supervisado
- No supervisado
3 Módulos
Módulos
1. Conceptos básicos de programación, datos e IA
1. Introducción a la programación con Python
- Python: un lenguaje de programación (lenguaje que entienden las máquinas para podernos comunicar con ellas y así programar lo que deseemos) muy sencillo y versatil que se usa mucho en desarrollo web, ciencia de datos e IA
- EX: los programas por dentro son texto (código) que indica las ordenes/funcionamiento que debe cumplir la aplicación.
- Empresas que lo usan: Youtube, Instagram, Pinterest
- Anaconda: una recopilación de programas y herramientas que se usa en Python para trabajar en proyectos de IA
- EX: Python nos permite desarrollar IA al igual que un telefono hacer llamadas, sin embargo al igual que un telfono no se limita a eso y nos permite chatear, hacer fotos… Anaconda nos permite extender los horizontes de desarrollo en nuestros proyectos.
- Empresas que lo usan: Uber, Netflix, Facebook
- Librerias: Es código (partes de un programa) que sirven para añadir a tus programas más funcionalidades sin tener que hacerlas desde 0 y que se pueden reutilizar en distintos programas con lo que dispondras de una mayor cantidad de herramientas y funciones para usar en tus proyectos.
- EX: para hacer una tortilla usas aceite pero ese aceite te puede servir para cocinar otra cosa también
- EX2: si quieres hacer un bocata de jamon no hace falta que te pongas a hornear un pan, puedes ir a la tienda y conseguir uno que ya esta hecho.
- Gestor de paquetes: herramienta util para descargar y actualizar las librerías
- EX: el google play store de las librerias
2. Bases de datos
Sistemas que permiten el almacenamiento de datos para su posterior uso/análisis
EX: todos los datos de los habitantes de españa, o de los usuarios de instagram se guardan en bases de datos.
- Relacionales: guardan la información en tablas (más antiguas pero muy usadas en las empresas).
- EX: transacciones (Amazon, AirBnb), almacenamiento de datos de personas (Hoteles, colegios, empresas..).
- No relacionales: el tipo de bases de datos más modernas que guardan la información en otros formatos distintos a las tablas, no hace falta que sean tablas con una estructura fija y por ello da más libertad y por lo tanto son cada vez más usadas.
- EX: grandes volúmenes de datos no estructurados en redes (Twitter, Facebook).
- datos no estructurados: datos sueltos que no siguen una estructura y no siempre son iguales.
- EX: Cuando nos inscribimos en un hotel por ejemplo nos piden todos los datos que necesitan, por lo que las bases de datos relacionales(tablas) funcionan bien, sin embargo con el crecimiento de internet sobre todo, hay muchos datos incompletos o que no siguen la misma estructura siempre por que se extraen de distintas fuentes.
- EX: imaginemos que queremos guardar el nombre, edad y lugar de residencia de todos nuestros conocidos y para ello hacemos una busqueda por instagram; habrá perfiles que no tengan especificado quizás la edad o lugar de residencia y en cambio tengan una frase bonita, los habrá que sean privados también y en los que no sepamos nada más que el nombre, o incluso los que tengan un apodo y no sepamos su nombre real. Ej: Koldo,15,Bilbao / María,Madrid / Pablo, “Life is short, make every moment count”.
- Operacionales: disponen de mecanismos con indices(como los de los libros) o triggers (automatizaciones) que permiten grandes velocidades de operacion al añadir, eliminar o editar datos y por ello están diseñadas para el uso diario.
- EX: compra venta de productos (Wallmart).
- Informacionales: tienen como objetivo que se puedan realizar consultas complejas de los datos de forma rapida por lo que tienen un gran uso en el ambito de análisis y toma de decisiones.
- EX: análisis de datos de usuarios (Netflix)
- Transaccionales: se centran en mantener la seguridad de los usuarios mediante control exhaustivo de las operaciones lo que reduce la velocidad de los sistemas pero los hace más robustos. Este tipo de base de datos es perfecta para realizar transacciones rapidas y seguras.
- EX: compra de productos en tiendas online (eBay)
3. SQL
Lenguaje para gestión de base de datos relacional más usada
Ex: al igual que los programas se crean usando un lenguaje, las bases de datos también.
- Creación de tablas, indices, vistas: diseño y creación de las bases de datos
- Tablas: tienen la misma estructura que una hoja de excel.
- Índices: funcionan al igual que los indices de un libro
- Vistas: son tablas que tienen ciertos filtros aplicados para mostrar aquello que nos interese
- Consultas SQL: usadas para la obtención de información almacenada en la base de datos (búsqueda de datos).
- EX: son las preguntas que se le hacen a la base de datos para que te responda con la información que tiene mediante el lenguaje
4. Introducción a la ciencia de datos y la IA
- Tipos de analítica:
- Descriptiva: analiza los datos para entender lo sucedido.
- EX: informe mensual de ventas del último año.
- Predictiva: analiza datos para predecir eventos o tendencias futuras
- EX: sistema que sugiere el inventario óptimo de una tienda para evitar la falta de stock.
- Prescriptiva: analiza datos para tomar decisiones y lograr objetivos.
- EX: sistema que analiza capacidades de trabajadores para mejorar la productividad.
Módulos
2. Analítica de Datos
1. Análisis exploratorio de datos con Pandas
- Pandas: librería fundamental para manipulación de datos.
- Dataset: colección de datos organizada.
- EX: archivo de excel.
- Dataframe: tabla de datos
2. Importando fuentes de datos
- Conexiones a base de datos: acceso a datos almacenados en bases de datos.
- Acceso a APIs: funciones de aplicaciones para obtener datos de servicios web.
- EX: sería como acceder a una aplicación que te permite realizar funciones de una determinada aplicación mediante un programa, si yo quiero que un programa suba una foto a mi instagram todos los lunes automáticamente el programa usa una API que le permite usar la función “subir foto” por ejemplo.
- datos no estructurados: datos sueltos que no siguen una estructura y no siempre son iguales.
- EX: Obtener nombre, biografía, tweets… de un usuario de la aplicación Twitter.
- EX: Descargar archivos de Drive / Dropbox.
3. Estadística descriptiva e inferencial
- Descriptiva: resumen de datos mediante distintas métricas
- EX: media de renta per cápita en x región.
- Inferencial: extraer conclusiones basandose en una muestra de datos.
- EX: cálculo de probabilidad de que x persona tenga una enfermedad habiendo analizado a los residentes de su zona.
Módulos
3. Visualización de Datos
1. Librerías de visualización de datos para Python
- Matplotlib: Librería para poder hacer gráficos que muestren datos y/o estadísticas en 2D.
- Ploty: Herramienta para creación de gráficos interactivos.
- Visualización de dataframe: usar gráficos para analizar datos en Pandas.
2. Business Inteligence
- Herramientas y plataformas para la comunicación y presentación de resultados:
- Tableau: Plataforma para crear visualizaciones interactivas y dashboards.
- EX: visualización de rendimiento de marketing y ventas en una empresa.
- Google Data Studio: Herramienta gratuita para crear informes y dashboards interactivos.
- EX: análisis de datos de tráfico web y campañas publicitarias.
- Dashboards con Streamlit: Herramienta para crear aplicaciones web interactivas para visualización de datos.
3. Dashboard: pantalla con graficos y datos importantes para comprender fácilmente la situación
Módulos
4. Machine Learning
1. Introducción al Machine Learning
- Tipos de Machine Learning: supervisado y no supervisado.
- Clasificación: asignar categorías a datos.
- EX: fiebre,tos,cansancio → clasificación: gripe.
- Regresión: predicción de valores numericos continuos.
- EX: ej: viendo el gráfico de el valor en bolsa de Coca Cola en los ultimos años podrias hacer una predicción de el valor de sus acciones en un futuro.
2. Aprendizaje supervisado
Proceso de aprendizaje de un modelo (IA) mediante datos etiquetados
EX: enseñarle a la IA alimentandola con un conjunto de datos del que conocemos su descripcion, por ejemplo en el caso de unas fotos podrian estar ya previamente clasificadas como (manzana,perro,playa…) y la idea seria que al darle una imagen nueva a la IA que no tenga descripcion pueda determinarla con lo que ha aprendido.
- Entrenamiento de modelos: proceso de enseñar a la IA usando datos etiquetados.
- Algoritmos: métodos para resolver problemas (distintas formas de que aprenda el modelo).
- Ensembling: combinación de varios modelos para conseguir uno mejor.
- Evaluación: medición del redimiento del modelo, rmediante pruebas que determinarán la calidad del modelo.
- Ajuste y mejora: ajustar parametros / configurar el modelo para conseguir mejores resultados (como usar filtros de instagram).
- CdU (casos de uso) / IDS (identificación de sistemas):
- EX:usar Machine Learning para la detección de fraudes bancarios.
4. Aprendizaje no supervisado
Proceso de aprendizaje de un modelo (IA) mediante datos sin etiquetar para su posterior agrupamiento
ej: dispones de un conjunto de fotos pero no tienen descripción, en este caso se van agrupando las fotos teniendo en cuenta las similitudes.
- Clustering: agrupamiento de datos sin etiquetas.
- EX:agrupar canicas por colores.
- Algoritmos: distintos métodos de identificación de patrones en los datos.