Temario del curso
1 - Introducción al Análisis de Datos
Objetivo
Al finalizar la unidad, el alumno comprenderá en qué consiste un proyecto de Data Science y cómo Python nos ayudará a llevarlo a cabo.
Duración de la unidad
2 Horas 40 Minutos
Contenido
Introducción al Análisis de Datos con Python
¿Qué es Python y qué nos proporciona para el análisis de datos?
Instalación Python + Jupyter
Importar librerías y fuentes de datos
Visualización básica con Matplotlib
Flujograma de un proyecto Data Science
Resumen
2 - Fundamentos del lenguaje Python
Objetivo
Al finalizar la unidad, el alumno conseguirá dominar el lenguaje Python y su sintaxis.
Duración de la unidad
4 Horas 45 Minutos
Contenido
Fundamentos del lenguaje Python
Variables en Python
Creación de listas y extracción de datos
Conceptos avanzados de creación de listas
Uso de funciones en Python (in-built)
Creación de funciones en Python y argumentos flexibles
Funciones lambda
Métodos en Python
Cómo crear diccionarios en Python
Uso de función zip para creación de diccionarios en base a listas
Operadores en Python
Bucles en Python
Comprensión de listas en python
Resumen
3 - Conceptos de Estadística para el Análisis de Datos
Objetivo
Al finalizar la unidad, el alumno entenderá los fundamentos estadísticos para convertirse en científico de datos, lo cual es la base sólida para poder analizar y obtener conclusiones.
Duración de la unidad
2 Horas 15 Minutos
Contenido
Conceptos de Estadística para el Análisis de Datos
Variables y Conceptos básicos
Varianza de una variable
Correlación de variables
Histogramas
Análisis con percentiles (CDF)
Funciones densidad de probabilidad
Distribución Gaussiana
Cálculo de previsiones (forecast) y media móvil
Resumen
4 - Calculo numérico con Numpy
Objetivo
Al finalizar la unidad, el alumno habrá profundizado en la librería Numpy para hacer cálculos numéricos con Python.
Duración de la unidad
2 Horas 15 Minutos
Contenido
Calculo numérico con Numpy
Introducción a la librería Numpy
Selección de datos con array Numpy
Arrays 2D en Numpy
Cálculo estadístico con NumPy
Generación de datos con Numpy
Resumen
5 - Análisis de datos con Pandas
Objetivo
Al finalizar la unidad, el alumno habrá profundizado en la librería más importante para limpieza y
transformación de datos con Pandas.
Duración de la unidad
9 Horas 20 Minutos
Contenido
Análisis de datos con Pandas
Introducción a la librería Pandas ¿qué es un dataframe?
Creación de un dataframe a partir de un diccionario
Cómo importar datos desde un fichero de texto plano (txt, csv...)
Selección de datos en un dataframe Pandas
Métodos útiles de un dataframe Pandas
Eliminar duplicados, valores erróneos y columnas de un dataframe Pandas
Interpolación de datos
Filtrar datos en un dataframe Pandas
Ordenación valores en un dataframe Pandas
Crear columnas en un dataframe para cadenas de texto
Crear columnas en un dataframe a partir de un diccionario con map
Crear columnas en un dataframe a partir de funciones lambda
Crear columnas en un dataframe a partir de funciones condicionales
Renombrar y reordenar columnas de un dataframe Pandas
Cómo crear pivot tables en Pandas
Uso de groupby en Pandas
Concatenación de dataframes (union)
Combinación de dataframes
Combinación con Pandas Merge
Resumen
6 - Importación y exportación con Pandas
Objetivo
Al finalizar la unidad, el alumno conseguirá importar y exportar desde múltiples fuentes de datos.
Duración de la unidad
7 Horas 30 Minutos
Contenido
Importación y exportación con Pandas
Cómo importar datos desde un fichero Excel
Introducción a las BBDD relacionales / Modelos de datos
Cómo importar datos desde una BBDD SQL
Cómo importar datos desde una página web
Cómo importar datos desde una página web (Web scraping)
Cómo importar datos desde un fichero semi-estructurado JSON
¿Cómo importar datos en formato JSON en Python?
Cómo importar datos desde Redes Sociales
Cómo importar datos desde Cloud (AWS / Azure / Google Cloud)
Exportación de datos a csv y Excel
Exportación de datos a BBDD SQL
Resumen
7 - Visualización de datos en Python - Matplotlib
Objetivo
Al finalizar la unidad, el alumno conseguirá crear potentes visualizaciones con Matplotlib para poder analizar y explicar los resultados obtenidos.
Duración de la unidad
5 Horas 05 Minutos
Contenido
Visualización de datos en Python - Matplotlib
Consejos para la visualización de datos
¿Qué tipo de gráfico aplica a cada caso?
Introducción a la librería Matplotlib
Creación de un gráfico de línea, bar, scatter
Personalización de gráficos (título, etiquetas, ticks, leyenda, límites de ejes, anotaciones...)
Creación de box & whiskers plot
Gráfico Box & Whiskers con Matplotlib
Creación de un histograma y CDF
Creación CDF a partir del histograma
Gráfico de media móvil
Visualización de gráficos múltiples (subplots)
Aplicación de estilos
Creación de gráficos a partir de objeto groupby
Creación de histogramas en 2D
Creación de mapas geográficos con basemap y Google maps
Mapas geográficos con basemap
Mapas geográficos con Google Maps
Resumen
8 - Visualización de datos en Python - Seaborn
Objetivo
Al finalizar la unidad, el alumno conseguirá crear potentes estadísticas con la librería Seaborn para un análisis profundo de la información.
Duración de la unidad
3 Horas 15 Minutos
Contenido
Visualización de datos en Python - Seaborn
Introducción a la librería Seaborn
Seaborn - Creación de Regresión Lineal
Regresión lineal con Seaborn
Seaborn - Stripplot
Seaborn - Swarmplot
Seaborn - Violinplot
Seaborn - Uso de jointplot
Jointplot en modo KDE
Seaborn - Uso de pairplot
Seaborn - Correlación con heatmap
Resumen
9 - Series temporales en Python
Objetivo
Al finalizar la unidad, el alumno conseguirá explotar sus datos históricos para realizar análisis y previsiones.
Duración de la unidad
6 Horas 10 Minutos
Contenido
Series temporales en Python
Series temporales en Pandas: Extracción y parsing
Series temporales: Filtrado
Series temporales: Remuestreo - Diezmado (downsampling)
Cómo remuestrear con Pandas
Series temporales: Remuestreo - Interpolación (upsampling)
Visualización de series temporales
Previsiones basadas en datos históricos
Visualización tendencia y estacionalidad
Métodos de previsión
Resumen
10 - Ejecución e interconexión de Python con otras plataformas
Objetivo
Al finalizar la unidad, el alumno conseguirá generar scripts de Python para automatizar tareas e interconectar con otras herramientas de Business Intelligence.
Duración de la unidad
1 Hora 45 Minutos
Contenido
Ejecución e interconexión de Python con otras plataformas
Generación de scripts de python y automatización de tareas
Uso de Python en herramienta de Business Intelligence Power BI
¿Cómo importamos una fuente de datos ya transformada a partir de un script de Python?
¿Cómo podemos usar Python dentro de Power Query para transformar nuestros datos?
¿Cómo podemos crear un visual personalizado con Matplotlib o Seaborn dentro de PowerBI?
Resumen