• Nuevo
    IFCT107 Responsable experto de data

Objetivos

Objetivo general

- Dominar el dato para entenderlo, transformarlo y capturar su máximo potencial con inteligencia artificial para optimizar procesos y simplificar el desarrollo de los proyectos y, comenzar con la creación de modelos de machine learning.

Objetivos específicos

- Analizar desde una visión trasversal cómo la ciencia del dato se aplica en las diferentes áreas de la organización para impulsar sus capacidades (finanzas, recursos humanos, operaciones, atención al cliente...), concienciándose sobre el poder de los datos, tanto para mejorar la toma de decisiones como para crear modelos de negocio basados en datos.

- Entender las nociones claves de estadística, matemáticas y álgebra que son básicas para Data Science; así como la programación en Python para trabajar con los datos.

- Explorar y entender los datos para poder enfocar correctamente un problema, combinando diferentes modelos y, así, crear el que se requiera para dar solución al problema identificado y evaluar su funcionamiento para conseguir su optimización.

- Profundizar en las aplicaciones del Deep Learning en reconocimiento de imágenes y proceso del lenguaje y entender el funcionamiento de los distintos modelos de redes neuronales.

- Conocer los entornos de Big Data para data science, para construir modelos escalables y desplegar y lanzar las soluciones en la nube.

- Utilizar las claves y fundamentos de la visualización para crear historias con los datos.

- Conocer el nuevo entorno laboral VUCA (Volatility, Uncertainty, Complexity & Ambiguity), que requiere del dominio de herramientas de trabajo en red, colaborativas, ágiles; así como de las habilidades y competencias que se exigen para ser competitivo en el nuevo entorno digital.

Índice

MÓDULO 1. INTRODUCCIÓN: LA IMPORTANCIA DEL DATO

1. Concienciación en relación a cómo la ciencia del dato afecta a todos los sectores y puede ser el aliado perfecto para el mundo de los negocios.

2. Conocimiento de los diferentes modelos de negocio basado en datos:

2.1. Nuevos modelos de negocio en torno al dato

2.2. Tipología de datos y cómo se obtienen

2.3. Maneras de rentabilizar el dato

2.4. Data Business Model Canvas

3. Adquisición de conocimientos sobre los avances en Big Data & Inteligencia Artificial (IA)

3.1. Estado actual

3.2. Posible evolución futura

4.  Dominio de Conceptos básicos

4.1. Qué es Big Data

4.2. Qué es Machine Learning

4.3. Qué es Deep Learning

5. Concienciación sobre el poder de los datos en las organizaciones tanto para mejorar la toma de decisiones como para crear modelos de negocio basado en datos

6. Visión trasversal sobre cómo Data Science se aplica en las diferentes áreas de la organización para impulsar las capacidades

MÓDULO 2. NOCIONES INICIALES DE PYTHON, DATA ENGINEERING Y ESTADÍSTICA

1. Desarrollo de los fundamentos de Big Data

1.1. Qué es el Big Data

1.2. Perfiles técnicos: Data Analyst, Engineer, Arquitect, QA...

1.3. El proceso de construir un proyecto de Big Data

1.4. Arquitecturas de Big Data

1.5. Las claves del éxito del big data

2. Identificación de los fundamentos de Machine Learning

2.1. Introducción al Machine Learning: Datos, algoritmos, modelos, producción...

2.2. Aproximación a los algoritmos: clasificación, predicción y clustering

2.3. Creación de modelos de Machine Learning

2.4. Las claves del aprendizaje automático.

2.5. La productivización de modelos

3. Análisis de los fundamentos de IA: Visión, NPL...

3.1. Introducción al Deep Learning y sus aplicaciones

3.2. Tipos de redes neuronales y su entrenamiento

3.3. Funcionamiento y retos del Data Science aplicado al Computer Vision y al NPL

4. Conocimientos avanzados de Python Crash Course

4.1. Uso de pycharm como entorno de trabajo

4.2. Uso de notebooks

4.3. Conocimiento de la sintaxis del lenguaje: bucles, variables.

4.4. Librerías

4.5. Funciones

4.6. Programación orientada a objetos en Python

5. Aproximación a la arquitectura de la información y al SQL

5.1. Qué es la arquitectura de datos

5.2. Modelo relacional tradicional

5.3. Modelo estrella

5.4. Modelo copo de nieve

5.5. Bases de la normalización de datos

5.6. Definiciones esenciales: base de datos, tablespace, tabla, vista, vista materializada, clave primaria, índice y partición

5.6.1. SQL

5.6.2. Sintaxis del lenguaje

6. Identificación del Crash course de python para data engineers: SQL y dataframes

6.1. Consulta de datos

6.2. Cruce de tablas

6.3. Inserción y borrado

6.4. Dataframes

6.4.1. Qué es una serie

6.4.2. Qué es un dataframe

6.4.3. Cruces con dataframe

6.4.4. Funciones lambda con columnas

6.4.5. Leer y salvar datos desde y a dataframe desde distintos formatos

7. Diferenciación entre ETL/ELT y preproceso de datos

7.1. ELT o ETL

7.2. Pipelines de datos

7.3. ¿Cómo estructurar los distintos pasos del workflow de datos?

7.4. Automatización de procesos.

8. Aplicación del proceso del análisis exploratorio

8.1. Arranque de un proceso exploratorio

8.2. Los objetivos de un análisis exploratorio

8.3. Uso del proceso exploratorio para validación de hipótesis

8.4. Naturaleza iterativa del proceso

9. Utilización de herramientas de visualización exploratoria y librerías

9.1. Análisis descriptivo gráfico

9.2. Análisis descriptivo basado en estadísticos

10. Realización de análisis univariante y multivariante

10.1. Análisis multivariante

10.2. Análisis univariante

11. Conocimiento de la Estadística descriptiva

11.1. Media, mediana, momentos, etc.

11.2. Desviación, varianza

11.3. Sesgos y medidas de homogeneidad de la información

12. Aproximación breve al algebra lineal

12.1. Operaciones matriz-escalar

12.2. Operaciones matriz-matriz

12.3. Propiedades de las matrices: no conmutativa, asociativa, distributiva, matriz identidad

12.4. Trasposición e inversa de una matriz

13. Análisis de correlación de variables: fundamentos de estadística y probabilidad

13.1. Ingeniería de características: descarte y selección de características

13.2. Cómo analizar la correlación entre variables

13.3. Efecto de las correlaciones

13.4. Eliminación de la correlación

14. Deducción estadística y contraste de hipótesis

14.1. Definición de una distribución una variable aleatoria

14.2. Definición de una función de probabilidad

MÓDULO 3. CONOCIMIENTO AVANZADO DE MACHINE LEARNING & ARTIFICIAL INTELLIGENCE

1. Aproximación a la modelización

1.1. Introducción a la modelización

1.2. Tipos de modelos

2. Identificación de los Modelos de regresión

2.1. Modelos de regresión simple

2.2. Modelos de regresión múltiple

2.3. Modelos de regresión generalizado

3. Clasificación de los distintos modelos de Árboles

3.1. Modelos de inferencia de árboles de decisión y regresión

3.1.1. Clasificadores binarios

3.1.2. Regresión

3.2. Modelos de inferencia de árboles de decisión: clasificadores multiclase

3.3. Modelos avanzados de árboles

3.3.1. Boosting

3.3.2. Random forest

4. Conocimientos de Algoritmos alternativos de clasificación

5. Conocimientos de Eager y Lazy classifiers

6. Utilización de Clustering

6.1. Introducción a los modelos no supervisados

6.2. Análisis clúster

7. Aproximación al método científico

7.1. Evaluación de modelos

8. Evaluación y optimización de modelos

8.1. Control de outliers y análisis de residuos

8.2. Modelos no supervisados

8.3. Modelos supervisados

9. Creación de Ingeniería de variables

9.1. Principios de la ingeniería de variables en la creación de variables

9.2. La dimensionalidad

9.3. Técnicas: PCA y SVD

10. Ensamblado de modelos

10.1. Definición de model ensembles

10.2. Modelos débiles y modelos fuertes

10.3. Creación de pipelines para crear modelos ensamblados

11. Gestión del ciclo de vida de los modelos

12. Interpretabilidad

13. Aproximación a modelos heurísticos de optimización

14. Conocimiento de los algoritmos genéticos

14.1. Principios de optimización basado en heurísticos

14.2. Gradiente descendente

14.3. Modelos basados en comportamientos animales

14.4. El algoritmo genético

14.5. Aplicaciones de los algoritmos genéticos

14.6. Cromosoma y función de fitness

14.7. Resolución de un problema usando algoritmos genéticos

15. Utilización de series temporales y forecasting

15.1. Bases sobre componentes de las series temporales: tendencia, ciclo y estacionalidad

15.2. Series estacionarias y no estacionarias

15.3. Análisis de anomalías

15.4. Suavizado exponencial

15.5. Modelos autoregresivos

15.6. Modelos univariantes y multivariantes

15.7. Modelos arima

15.8. Modelos con parametrización automática

16. Gestión de proyectos de Data Science

MÓDULO 4. APLICACIONES DEL DEEP LEARNING

1. Aproximación a redes neuronales artificiales (ANN)

1.1. ¿Qué es una red neuronal artificial?

1.2. Tipos de redes: profundas y superficiales (shallow)

1.3. Técnica del gradiente descendiente

2. Conocimiento de los campos de aplicación de ANN

2.1. Visión por computador

2.2. Análisis y síntesis del lenguaje

2.3. Análisis de secuencias

2.4. GAN y deepfake

3. Aproximación al Shallow & Deep neural networks. Introducción CNN

3.1. Perceptrón simple

3.2.Topologías de redes neuronales

3.3. MNIST

3.4. Regularización: L1, L2, dropout y otros

3.5. Creación de una CNN con keras

4. Comprensión del diseño de redes neuronales artificiales (ANN), redes convolucionales (CNN) y redes recurrentes (RNN)

MÓDULO 5. ENTORNOS BIG DATA & CLOUD

1. Conocimientos de Big Data y de los principios de arquitecturas de computación distribuidas y altamente escalables

1.1. Comprender el papel del Big data en la ciencia de datos

1.2. Apache Spark

1.3. Spark en modo batch y en semi-tiempo real (microbatches)

1.4. Lazy evaluation

2. Utilización de Dataframes y Data pipelines en Spark

2.1. Operaciones sobre dataframes (SQL o pyspark)

2.2. Creación de data pipelines con spark

2.3. Transformación de dataframes

3. Creación de modelos de Machine Learning en Spark

3.1. Entrenamiento de modelos e integración en pipelines

3.2. Aplicación de la inferencia de modelos en Spark

4. Despliegue de pipelines de modelos con Spark

5. Desarrollo de modelos con proveedores de Cloud Machine Learning

MÓDULO 6. VISUALIZACIÓN DE LOS DATOS

1. Comprensión de las claves del storytelling a través de los datos

1.1. La ciencia de la visualización de datos y el storytelling: su valor en el mundo profesional

2. Uso del storytelling con datos

2.1. Principios de la comunicación visual de los datos

2.2. Uso de los distintos controles visuales

3. Comprensión de los conceptos Business Intelligence y Data Visualization

3.1. Entender el proceso para trabajar en la herramienta de visualización en un contexto de Business Intelligence

3.2. Fuentes de datos, tratamiento y preparación de datos, modelaje de datos (relaciones), análisis exploratorio y específicos, visualización y reporting

4. Profundización en la herramienta PowerBI para poder conectar datos, prepararlos, modelarlos, explorarlos y visualizarlos

4.1. Entorno de PowerBI: organización y componentes

4.2. Importación de datos

4.3. Visualizaciones básicas realizando agrupaciones y aplicando filtros

4.4. Trabajar y preparar los datos: columnas calculadas, medidas, fórmulas con DAX, tablas calculadas…

4.5. Trabajar con tablas matrices para aumentar la granularidad de los informes

4.6. Filtrar los datos de manera dinámica con la segmentación de datos

5. Aproximación a la herramienta Tableau

MÓDULO 7. HABILIDADES Y COMPETENCIAS DE GESTIÓN, PERSONALES Y SOCIALES, PARA EL ENTORNO DIGITAL

1. Impulso de habilidades digitales

1.1. Liderazgo participativo

1.2. Gestión del cambio

1.3. Inteligencia emocional

1.4. Storytelling

1.5. Creación de marca personal

1.6. Comunicación y negociación en entornos digitales

2. Comprensión de las competencias necesarias para el nuevo entorno digital

2.1. La influencia digital

2.2. La colaboración en el entorno

2.3. La integración de la diversidad

2.4. La gestión emocional

2.5. La agilidad en toma de decisiones

2.6. La anticipación en contextos digitales

2.7. La flexibilidad para la transformación

2.8. La asunción de incertidumbre y riesgos

2.9. La elaboración, gestión y difusión de contenidos

3. Conocimiento de las herramientas imprescindibles para

3.1. El trabajo colaborativo

3.2. El trabajo en remoto

3.3. La gestión de proyectos

3.4. Automatización de flujos de trabajo

4. Práctica en las claves del trabajo en equipo y de la productividad en remoto

5. Fomento del liderazgo participativo y la gestión del cambio

6. Dominio de la comunicación y la negociación en entornos digitales

7. Práctica del modelo de competencias para el entorno digital

8. Elaboración y gestión de la marca personal desde la importancia del storytelling

IFCT107

Ficha técnica

Número de horas
240
Formato
Curso e-learning

En la misma categoría

5 otros productos en la misma categoría: