| Nota de contenido con formato |
- Prefacio -<br/>- 1. Análisis exploratorio de datos - <br/>Elementos de datos estructurados,<br/>Lecturas complementarias,<br/>Datos rectangulares,<br/>Marcos de datos e índices,<br/>Estructuras de datos no rectangulares,<br/>Lecturas complementarias,<br/>Estimación de la localización,<br/>Media,<br/>Estimación de medianas robustas,<br/>Ejemplo: estimaciones de localización,<br/>de la población y tasas de homicidios,<br/>Lecturas complementarias,<br/>Estimación de la variabilidad,<br/>Desviación estándar y estimaciones relacionadas,<br/>Estimación basada en percentiles,<br/>Ejemplo: estimaciones de variabilidad de la población estatal,<br/>Lecturas complementarias,<br/>Exploración de la distribución de datos,<br/>Percentiles y diagramas de caja,<br/>Tablas de frecuencias e histogramas,<br/>Diagrama y estimación de la curva de densidad,<br/>Lecturas complementarias,<br/>Exploración de datos binarios y categóricos,<br/>Moda,<br/>Valor esperado,<br/>Probabilidad,<br/>Lecturas complementarias,<br/>Correlación,<br/>Diagramas de dispersión,<br/>Lecturas complementarias,<br/>Exploración de dos o más variables,<br/>Agrupación hexagonal y contornos (representación numérica,<br/>frente a datos numéricos),<br/>Dos variables categóricas,<br/>Datos categóricos y numéricos,<br/>Visualización de varias variables,<br/>Lecturas complementarias,<br/>Resumen,<br/>- 2. Distribuciones de datos y muestreo -<br/>Muestreo aleatorio y sesgo de la muestra,<br/>Sesgo,<br/>Selección aleatoria,<br/>Tamaño frente a calidad: ¿cuándo importa el tamaño?,<br/>Media muestral frente a media poblacional,<br/>Lecturas complementarias,<br/>Sesgo de selección,<br/>Regresión a la media,<br/>Lecturas complementarias,<br/>Distribución muestral del estadístico,<br/>Teorema del límite central,<br/>Error estándar,<br/>Lecturas complementarias,<br/>Bootstrap,<br/>Remuestreo frente a bootstrapping,<br/>Lecturas complementarias,<br/>Intervalos de confianza,<br/>Lecturas complementarias,<br/>Distribución normal,<br/>Normal estándar y diagramas QQ,<br/>Distribuciones de cola larga,<br/>Lecturas complementarias,<br/>Distribución t de Student,<br/>Lecturas complementarias,<br/>Distribución binomial,<br/>Lecturas complementarias,<br/>Distribución chi cuadrado,<br/>Lecturas complementarias,<br/>Distribución F,<br/>Lecturas complementarias.<br/>La distribución de Poisson y distribuciones relacionadas,<br/>Distribución de Poisson,<br/>Distribución exponencial,<br/>Estimación de la tasa de fallos,<br/>Distribución de Weibull,<br/>Lecturas complementarias,<br/>Resumen,<br/>- 3. Experimentos estadísticos y pruebas significativas -<br/>Prueba A/B,<br/>¿Por qué tener un grupo de control?,<br/>¿Por qué solo A/B? ¿Por qué no C, D, ...?,<br/>Lecturas complementarias,<br/>Pruebas de hipótesis,<br/>La hipótesis nula,<br/>Hipótesis alternativa,<br/>Pruebas de hipótesis unidireccionales o bidireccionales,<br/>Lecturas complementarias,<br/>Remuestreo,<br/>Prueba de permutación,<br/>Ejemplo: adherencia de la web,<br/>Pruebas de permutación exhaustiva y de Bootstrap,<br/>Pruebas de permutación: el resultado final de la ciencia de datos ,<br/>Lecturas complementarias,<br/>Significación estadística y valores p,<br/>Valor p,<br/>Alfa,<br/>Errores de tipo 1 y 2 ,<br/>Ciencia de datos y valores,<br/>Lecturas complementarias,<br/>Pruebas t,<br/>Lecturas complementarias,<br/>Pruebas múltiples,<br/>Lecturas complementarias,<br/>Grados de libertad,<br/>Lecturas complementarias,<br/>ANOVA,<br/>Estadístico F,<br/>ANOVA bidireccional,<br/>Lecturas complementarias,<br/>Prueba de chi cuadrado,<br/>Prueba de chi cuadrado: enfoque de remuestreo,<br/>Prueba de chi cuadrado: teoría estadística,<br/>Prueba exacta de Fisher,<br/>Relevancia para la ciencia de datos,<br/>Lecturas complementarias,<br/>Algoritmo Multi-Arm Bandit,<br/>Lecturas complementarias.<br/>Potencia y tamaño de la muestra,<br/>Tamaño de la muestra,<br/>Lecturas complementarias,<br/>Resumen,<br/>- 4. Regresión y pronóstico - <br/>Regresión lineal simple,<br/>La ecuación de regresión,<br/>Valores ajustados y residuos,<br/>Mínimos cuadrados,<br/>Pronóstico frente a explicación (elaboración de perfiles),<br/>Lecturas complementarias,<br/>Regresión lineal múltiple,<br/>Ejemplo: datos de las viviendas del condado de King,<br/>Evaluación del modelo,<br/>Validación cruzada,<br/>Selección del modelo y regresión escalonada,<br/>Regresión ponderada,<br/>Lecturas complementarias,<br/>Pronóstico mediante la regresión,<br/>Los peligros de la extrapolación,<br/>Intervalos de confianza y de pronóstico,<br/>Variables de tipo factor en la regresión,<br/>Representación de variables ficticias,<br/>Variables de tipo factor con muchos niveles,<br/>Variables de tipo factor ordenadas,<br/>Interpretación de la ecuación de regresión,<br/>Predictoras correlacionadas,<br/>Multicolinealidad,<br/>Variables de confusión,<br/>Interacciones y efectos principales,<br/>Diagnósticos de regresión,<br/>Valores atípicos,<br/>Valores influyentes,<br/>Heterocedasticidad, anormalidad y errores correlacionados,<br/>Diagramas de residuos parciales y falta de linealidad,<br/>Regresión polinomial y por spline,<br/>Polinomial,<br/>Splines,<br/>Modelos aditivos generalizados,<br/>Lecturas complementarias,<br/>Resumen,<br/>- 5. Clasificación -<br/>Bayes ingenuo,<br/>Por qué la clasificación bayesiana exacta no es práctica,<br/>La solución ingenua,<br/>Variables predictoras numéricas,<br/>Lecturas complementarias,<br/>Análisis discriminante,<br/>Matriz de covarianza,<br/>Discriminante lineal de Fisher,<br/>Un ejemplo sencillo,<br/>Lecturas complementarias,<br/>Regresión logística,<br/>Función de respuesta logística y logit,<br/>Regresión logística y GLM,<br/>Modelos lineales generalizados,<br/>Valores pronosticados de regresión logística,<br/>Interpretación de los coeficientes y de la razón de oportunidades,<br/>Regresión lineal y logística: similitudes y diferencias,<br/>Evaluación del modelo,<br/>Lecturas complementarias,<br/>Evaluación de modelos de clasificación,<br/>Matriz de confusión,<br/>El problema de las clases raras,<br/>Precisión, exhaustividad y especificidad,<br/>Curva ROC,<br/>AUC,<br/>Sustentación,<br/>Lecturas complementarias,<br/>Estrategias para datos que no están equilibrados,<br/>Subremuestreo,<br/>Sobremuestreo y aumento/disminución de la ponderación,<br/>Generación de datos,<br/>Clasificación basada en los costes,<br/>Exploración de pronósticos,<br/>Lecturas complementarias,<br/>Resumen,<br/>- 6. Aprendizaje automático estadístico -<br/>K-vecinos más cercanos,<br/>Un pequeño ejemplo: pronóstico del incumplimiento de préstamos,<br/>Métricas de distancia,<br/>Codificador One-Hot,<br/>Estandarización (normalización, puntuación z),<br/>Elección de K,<br/>KNN como motor de características,<br/>Modelos de árbol,<br/>Un ejemplo sencillo,<br/>Algoritmo de partición recursiva,<br/>Medición de la homogeneidad o la impureza,<br/>Detención del crecimiento del árbol,<br/>Pronóstico de un valor continuo,<br/>Cómo se utilizan los árboles,<br/>Lecturas complementarias,<br/>Métodos de baggingy bosque aleatorio,<br/>Bagging,<br/>Bosque aleatorio,<br/>Importancia de la variable,<br/>Hiperparámetros,<br/>Boosting,<br/>El algoritmo boosting,<br/>XGBoost,<br/>Regularización: evitación del sobreajuste,<br/>Hiperparámetros y validación cruzada,<br/>Resumen,<br/>- 7. Aprendizaje no supervisado -<br/>Análisis de componentes principales,<br/>Un ejemplo sencillo,<br/>Cálculo de los componentes principales,<br/>Interpretación de componentes principales,<br/>Análisis de correspondencias,<br/>Lecturas complementarias,<br/>Agrupación K-means,<br/>Un ejemplo sencillo,<br/>Algoritmo K-means,<br/>Interpretación de los grupos,<br/>Selección del número de grupos,<br/>Agrupación jerárquica,<br/>Un ejemplo sencillo,<br/>El dendrograma,<br/>El algoritmo de aglomeración,<br/>Medidas de disimilitud,<br/>Agrupación basada en el modelo,<br/>Distribución normal multivariante,<br/>Mezclas de distribuciones normales,<br/>Selección del número de grupos,<br/>Lecturas complementarias,<br/>Variables categóricas y escalado,<br/>Escalado de variables,<br/>Variables dominantes,<br/>Datos categóricos y distancia de Gower,<br/>Problemas con la agrupación de datos mixtos,<br/>Resumen,<br/>Bibliografía.<br/> |