Díaz Chávez, Luis AlbertoRosado Vega, Jairo Rafael2021-07-152021-07-1520199789588942582https://repositoryinst.uniguajira.edu.co/handle/uniguajira/309482 p.Como rector de la universidad de La Guajira me complace poner a disposición de la comunidad estudiantil, docentes e investigadores de nuestra alma mater la presente obra, que se constituye en un primer esfuerzo dentro de nuestra institución para contar con un documento de consulta en donde se referencien los procedimientos estadísticos de mayor relevancia, para apoyar las actividades en nuestras aulas durante el desarrollo de los cursos de Estadística Descriptiva, Estadística Inferencial y Diseño de Experimentos, y así mismo, otros de singular importancia en el tratamiento de datos productos de las investigaciones desarrolladas por los grupos de investigación. Por otro lado, esta obra se suma a los esfuerzos a nivel global en la adopción y masificación del uso de softwares libres, como es el caso de R, un lenguaje de programación de gran versatilidad y potencia, que en los últimos años ha tomado un reconocimiento exponencial y favoritismo de investigadores y analistas de datos, gracias al amplio espectro de herramientas que ofrece y la excelente presentación gráfica de reportes estadísticos que a través de él se pueden lograr, y sobre el cual, se sustentó la aplicación de los métodos y procedimientos descritos en este texto. Hago llegar mis felicitaciones a los autores de esta obra por entregarnos esta valiosa herramienta que fortalecerá el desarrollo académico de nuestra institución y catapultará la proyección social de nuestra alma mater, en la comunidad académica y científica.Presentación 13 Agradecimientos 15 Prologo 17 1. Generalidades y conceptos básicos 19 1.1. Panorama general: Tratamiento de datos 21 1.2. Definiciones básicas 21 Población estadística. 21 Parámetro 22 Muestra 22 Estadístico 22 Variable 22 1.3. Estadística descriptiva e inferencial 24 2. Estadística descriptiva 25 2.1. Organización y presentación de datos 27 Variables discretas 27 Variables continuas 30 2.2. Gráficos 33 2.2.1. Gráficos para variables cualitativas o cuantitativas discretas . 34 Gráficos de barras 34 Gráfico de sectores 40 2.2.2. Gráficos para variables cuantitativas 42 2.2.3. Gráficos de líneas y gráficos de dispersión 45 2.3. Medidas de tendencia central 47 2.3.1. Media aritmética 47 2.3.2. Mediana 48 2.3.3. Moda 49 2.4. Medidas de posición: Cuantiles 51 2.4.1. Cuartiles 52 2.4.2. Deciles 52 2.4.3. Percentiles 52 2.4.4. Gráficos basados en los cuartiles: Grafico de caja 56 2.5. Medidas de variabilidad o dispersión 61 2.5.1. Varianza 62 2.5.2. Desviación estándar 62 2.5.3. Coeficiente de variación 63 2.6. Medidas de forma 65 2.6.1. Coeficiente de asimetría 65 2.6.2. Apuntamiento o kurtosis 66 3. Variables aleatorias y distribuciones de probabilidad 69 3.1. Concepto de variable aleatoria 71 3.2. Distribuciones discretas de probabilidad 72 3.2.1. Distribución de probabilidad binomial 74 3.2.2. Distribución de probabilidad hipergeométrica 78 3.2.3. Distribución de probabilidad de Poisson 81 3.3. Distribuciones continúas de probabilidad 84 3.3.1. Distribución de probabilidad normal 89 3.3.2. Distribución de probabilidad t de student. 95 3.3.3. Distribución chi-cuadrado (x2) 99 3.3.4. Distribución F de Fisher-Snedecor 103 4. Estimación por intervalo de una y dos muestras 105 4.1. Generalidades 107 4.2. Intervalo de confianza para μ de una población normal con σ conocida 109 4.3. Intervalo de confianza para μ de una población normal con σ desconocida a través de una muestra pequeña (n < 30) 112 4.4. Intervalo de confianza para μ de una muestra grande (n > 30) 114 4.5. Intervalo de confianza para μ1–μ2; con σ12 y σ22 conocidas 116 4.6. Intervalo de confianza para μ1–μ2; con σ12=σ22 pero desconocidas. 118 4.7. Intervalo de confianza para μ1–μ2; con σ12≠σ22 y desconocidas 120 4.8. Intervalo de confianza para una proporción p de una muestra grande 123 4.9. Intervalo de confianza para la diferencia entre dos proporciones para muestras grandes 125 4.9.1. Intervalo de confianza para la varianza de una población normal 127 4.9.2. Intervalo de confianza para la razón de dos varianzas de poblaciones normales 129 5. Prueba de hipótesis de una y dos muestras 133 5.1. Generalidades 135 5.2. Hipótesis nula e hipótesis alterna 135 5.3. Estadístico de prueba, región crítica y región de aceptación 137 5.4. Tipos de errores 138 5.5. Uso del p-valor como herramienta para la toma de decisiones en un procedimiento de prueba de hipótesis 139 5.6. Prueba de hipótesis para la media de una población con varianza desconocida 140 5.7. Prueba de hipótesis sobre la diferencia de dos medias poblacionales: comparación de dos medias 143 5.7.1. Varianzas desconocidas pero iguales 144 5.7.2. Varianzas desconocidas pero diferentes 148 5.7.3. Observaciones pareadas (emparejadas) 152 5.8. Prueba de hipótesis para una proporción 155 5.9. Prueba de hipótesis sobre la diferencia entre dos proporciones 160 5.10.Prueba de hipótesis sobre dos varianzas poblacionales: Prueba de homogeneidad de varianzas 165 6. Pruebas de bondad de ajuste y análisis de datos categóricos 169 6.1. Generalidades 171 6.2. Prueba de bondad de ajuste chi-cuadrado 172 6.3. Test de Kolmogorov-Smirnov 177 6.4. Test de Shpairo-Wilk 181 6.5. Prueba de independencia: Tablas de contingencia r x c 185 6.6. Prueba de homogeneidad 188 7. Análisis de varianza (ANOVA) 191 7.1. Generalidades 193 7.2. Análisis de varianza (ANOVA) de un factor: Diseño completamente al azar 193 7.2.1. Diagnosis e hipótesis del modelo del ANOVA de un factor 194 7.2.2. Procedimiento de prueba del ANOVA de un factor 194 7.3. Pruebas sobre homogeneidad de diversas varianzas (homocedasticidad) 198 7.3.1. Test de Bartlett 199 7.3.2. Test de Levene 203 7.3.3. Test de Cochran 207 7.4. Pruebas de comparaciones múltiples (post-hoc) 214 7.4.1. Test de la mínima diferencia significativa o LSD de Fisher..... 215 7.4.2. Test de Student-Newman-Keuls (SNK) de rangos múltiples ... 219 7.4.3. Test de Scheffé 223 7.4.3.1.Test de Tukey o prueba de la Diferencia Honestamente Significativa (HSD) 227 7.4.4. Test de Duncan de rangos múltiples 229 7.4.5. Comparación de los tratamientos con un control: Test de Dunnett 234 7.5. Análisis de varianza para diseño de bloques completos aleatorios (BCA) 237 7.5.1. Interacción entre bloques y tratamientos 243 7.5.2. Comparaciones múltiples para el diseño de bloques completos aleatorios 244 7.6. Análisis de varianza de dos factores para diseños completamente aleatorios 252 7.6.1. Procedimiento de prueba del ANOVA de dos factores 253 7.6.2. Comparaciones múltiples 258 7.7. Transformación de variables 266 7.7.1. Trasnformación de variables con distribuciones conocidas .... 267 7.7.1.1 Transformación raíz cuadrada x=y+k. 267 7.7.1.2. Transformación angular 268 7.7.2. Transformación de variables con exponentes para estabilizar la varianza 268 8. Modelos de regresión 277 8.1. Generalidades 279 8.2. Regresión lineal simple 280 8.2.1. Supuestos del modelo de regresión lineal simple 281 8.2.2. La recta de regresión ajustada 281 8.2.3. Estimación de los parámetros del modelo ajustado 282 8.2.4. Inferencias sobre la pendiente del modelo 288 8.2.5. Calidad del ajuste del modelo de regresión lineal simple 289 8.2.5.1.Coeficiente de determinación R2. 289 8.2.5.2.Coeficiente de correlación r. 292 8.2.5.3. Análisis de varianza en los modelos de regresión lineal simple 295 8.2.6. Intervalos de confianza y de predicción 301 8.2.7. Verificación de los supuestos del modelo de regresión 305 8.2.7.1.Verificación de la homocedasticidad de los errores: Test de Breusch-Pagan 305 8.2.7.2. Verificación de independencia de los errores: Test de Durbin Watson 307 8.2.8. Transformaciones 317 8.3. Regresión lineal múltiple 325 8.3.1. Inferencias sobre el modelo de regresión lineal multiple 327 8.3.1.1.Análisis de varianza en la regresión multiple 327 8.3.1.2.Pruebas t individuales para comparar variables 328 8.3.1.3.Coeficiente de determinación y coeficiente de determinación ajustado 329 8.3.2. Supuesto de multicolinealidad 334 8.4. Regresión no lineal: Polinómica 336 8.5. Regresión logística341 9. Estadística no paramétrica: procedimientos de distribución libre 347 9.1. Generalidades 349 9.2. Test no paramétricos para una población: test de rangos con signos de Wilcoxon 350 9.3. Test no paramétricos para la comparación de dos poblaciones con base en muestras independientes: Test U de Mann-Whitney. 353 9.4. Test no paramétrico sobre observaciones pareadas 357 9.5. ANOVA de un factor no paramétrico: test de Kruskal-Wallis. 360 9.6. ANOVA para diseños de bloques completamente aleatorios no paramétrica: Test de Friedman. 363 10. Análisis multivariante de datos 367 10.1. Generalidades 369 10.2. Análisis de componentes principales (ACP) 370 10.3. Análisis factorial 380 10.3.1. Generalidades 380 10.3.2. Modelo factorial y obtención de los factores 381 10.3.3. Contrastes en el modelo factorial 383 10.3.3.1.Test de esfericidad de Bartlett 384 10.3.3.2.Medida KMO de Kaiser, Meyer y Olkin de adecuación muestral 385 10.3.3.3. Contraste de bondad de ajuste de máxima verosimilitud ... 386 10.3.4. Rotación de factores 386 10.3.5. Puntuación o medición de los factores 387 10.4. Análisis de correspondencias 393 10.4.1. Generalidades 393 10.4.2. Análisis de correspondencias simple (AC) 394 10.4.3. Análisis de correspondencias múltiple (ACM) 400 10.5. Métodos de clasificación: Análisis clúster 407 10.5.1. Generalidades 407 10.5.2. Clúster jerárquicos 409 10.5.3. Cluster no jerárquicos: Clasificación de k medias 414 10.5.4. Análisis discriminante 419 Referencias bibliográficas 431 Apendíces: Tablas y pruebas estadísticas 437application/pdfspaCopyright - Universidad de La Guajira, 2019https://creativecommons.org/licenses/by-nc-sa/4.0/Tratamiento estadístico de datosTratamiento de datosEstadística descriptivaEstadística inferencialVariables discretasVariables continuasTratamiento estadístico de datos con aplicaciones en R.Libroinfo:eu-repo/semantics/openAccessAtribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0)