class: center, middle, inverse, title-slide .title[ # Correlación y regresión ] .author[ ### Sebastián Muñoz-Tapia & Gino Ocampo ] .institute[ ### Antropología UAH ] .date[ ### 2024-06-07 ] --- ## En esta clase Repaso de estadística inferencial y regresión lineal ### 1. Inferencia estadística ### 2. Correlación ### 3. Regresión --- ### Estadística descriptiva - Medidas de tendencia central (**Media**, mediana, moda) - Medidas de dispersión (desviación estándar, **varianza**, rango) - Relación entre variables categóricas: Pruebas de hipótesis "cualitativa" (Chi cuadrado) --- class: inverse, center, middle # Inferencia estadística --- # Inferencia Estadística <img src="inferencia1.png" width="700px" /> --- ### Repaso Las probabilidades son el vehículo de la estadística, por ello su comprensión es clave ¿En qué se distinguen? 1. La Teoría de la Probabilidad se pregunta por la *ocurrencia* de algo cuando conoce las características de la población o los resultados de un experimento. Esto implica que: a. Con las probabilidades se hacen predicciones sobre lo que va a pasar. b. Estas probabilidades son conjeturas, *no hechos.* c. Se asocia a una pregunta del tipo: “si saco una muestra al azar, ¿cómo será ésta?” 2. En la Estadística, se desconoce la población. a. Se saca una muestra, se describe esa muestra (estadística descriptiva) y se infiere cómo es la población a partir de ella (estadística inferencial) b. Se asocia a la pregunta del tipo: “si tengo esta muestra, ¿cómo es la población? --- ### Probabilidad vs estadística <img src="probabilidad_estadistica1.png" width="700px" /> --- ### Distribución poblacional y muestral <br> -- Distribución poblacional <img src="distribucion_poblacional.png" alt="Descripción de la imagen" style="width: 400px; height: 400px;" /> Observo toda la población, en general, tener los datos de toda la población es muy díficil. --- ### Distribución poblacional y muestral <br> -- Distribución de la muestra <img src="distribucion_muestral.png" alt="Descripción de la imagen" style="width: 400px; height: 400px;" /> Si se extrae una **muestra aleatoria** de la población, se puede calcular su media y graficar su distribución --- ### Distribución poblacional y muestral <br> -- Distribuciones de las muestras <img src="distribucion_muestral1.png" width="700px" /> Se pueden extraer continuamente muestras del mismo tamaño (e.g. n=100) y calcular su media --- ### Distribución poblacional y muestral <br> -- **Distribución muestral** Cálculo de medias de diferentes muestras, pero del mismo tamaño, extraídas aleatoriamente: <img src="distribucion_muestral2.png" alt="Descripción de la imagen" style="width: 400px; height: 300px;" /> Cada muestra extraída tiene asociada una media. Esta “media de la muestra” cambia de muestra en muestra, según lo que se puede ver en la tabla de arriba. En este caso, hemos extraído 50 muestras de forma aleatoria y hemos calculado su media respectiva. --- ### Distribución muestral <br> Ahora la media de cada muestra es en sí una variable aleatoria. <img src="distribucion_muestral3.png" style="width: 400px; height: 300px;" /> Se puede graficar la distribución de un conjunto de medias tomadas de diferentes muestras aleatorias. Por ejemplo, 50 muestras de tamaño 100, calculamos su media y graficamos su distribución. Esto se denomina **DISTRIBUCIÓN MUESTRAL** --- ### Estimadores La media muestral `\(\bar{Y}\)` es la manera natural de estimar `\(\mu_y\)`, pero no es el único método. Por ejemplo, otra forma de estimar `\(\mu_y\)` es simplemente utilizar la primera observación. Tanto `\(\bar{Y}\)` como `\(Y_1\)` son funciones de los datos diseñadas para estimar `\(\mu_y\)`. Si se calculan para muestras repetidas, `\(\bar{Y}\)` e `\(Y_1\)` toman valores diferentes (proporcionan estimaciones diferentes) de una muestra a otra. Así, los estimadores `\(\bar{Y}\)` e `\(Y_1\)` poseen ambos distribuciones muestrales. Existen, de hecho, muchos estimadores de `\(\mu_y\)`, de los cuales `\(\bar{Y}\)` e `\(Y_1\)` son dos ejemplos. --- ### ¿cuáles son las características deseables de la distribución muestral de un estimador? Nos gustaría que la distribución muestral de un estimador estuviera tan estrechamente centrada sobre el valor desconocido como fuera posible. Esta observación nos conduce a las tres características específicas deseables de un estimador: insesgadez (ausencia de **sesgo**), **consistencia** y **eficiencia**. --- class: inverse, center, middle # Contraste de hipótesis --- ### Contraste de hipótesis <br> -- Muchas hipótesis acerca del mundo que nos rodea pueden expresarse en forma de preguntas con respuesta sí/no. * *¿La media de los ingresos salariales por hora de los recién titulados en la universidad es de $20000 la hora? * * *¿Son los ingresos salariales medios los mismos para los titulados universitarios de sexo masculino y femenino?* Ambas preguntas incluyen hipótesis específicas acerca de la distribución poblacional de los ingresos. El desafío estadístico consiste en responder estas preguntas en base a la evidencia *muestral*. --- ### Contraste de hipótesis <br> -- Los contrastes de hipótesis se refieren a - una *población*: ¿La *media* de los ingresos salariales por hora de los recién titulados en la universidad es de $20.000 la hora? - a *dos poblaciones diferentes*: ¿Es la *media* de ingresos la misma para *hombres* y *mujeres*? --- ### Hipótesis nula y alternativa <br> El punto de partida para la contrastación estadística de hipótesis consiste en especificar la hipótesis a contrastar, denominada **hipótesis nula**. El contraste de hipótesis implica la utilización de **datos** para comparar la hipótesis nula con una segunda hipótesis, denominada **hipótesis alternativa**, que se cumple si la nula no lo hace. --- ### Hipótesis nula <br> -- La hipótesis nula consiste en que la media poblacional, `\(E(Y)\)`, toma un valor específico, denominado `\(\mu_{Y,0}\)`. `$$H_0: E(Y)=\mu_{Y,0}$$` Por ejemplo, la conjetura de que, en promedio de la población, los titulados universitarios tienen ingresos por $20.000 la hora es una hipótesis nula acerca de la distribución poblacional de los ingresos por hora. --- ### Hipótesis alternativa <br> La hipótesis alternativa especifica qué es cierto si la hipótesis nula no lo es. La hipótesis alternativa más general es que `\(E(Y)≠\mu_{Y,0}\)`, lo que se denomina hipótesis alternativa bilateral porque permite que E(Y) pueda ser tanto menor como mayor que `\(\mu_{Y,0}\)`. `$$H_1:E(Y)≠\mu_{Y,0}$$` El problema al que se enfrenta el estadístico es el de utilizar la evidencia que proporciona una muestra de datos seleccionada aleatoriamente con el fin de decidir si aceptar la hipótesis nula `\(H_0\)` o rechazarla en favor de la hipótesis alternativa `\(H_1\)`. Si la hipótesis nula es «aceptada», esto no significa que el estadístico declare que es cierta; sino que es aceptada provisionalmente reconociendo que puede ser rechazada más tarde en base a la evidencia adicional. Por esta razón, **el contraste estadístico de hipótesis puede plantearse en términos tanto de rechazar la hipótesis nula como de no hacerlo**. --- ### p valor <br> -- Aunque una muestra de datos no pueda proporcionar evidencia concluyente acerca de la hipótesis nula, es posible realizar un cálculo probabilístico que permita contrastar la hipótesis nula de modo que se tenga en cuenta la incertidumbre del muestreo. Este cálculo implica la utilización de datos para obtener el **p-valor** de la hipótesis nula. El **p valor** es la probabilidad de obtener un valor del estadístico al menos tan adverso para la hipótesis nula como el calculado en la muestra, suponiendo que la hipótesis nula es cierta. En el caso que nos ocupa, el p-valor es la probabilidad de obtener una `\(\bar{Y}\)` al menos tan alejada en lo que respecta a las colas de su distribución, bajo la hipótesis nula, como la media muestral calculada realmente. Para calcular el p-valor, es necesario conocer la **distribución muestral** de `\(\bar{Y}\)` bajo la hipótesis nula. --- ### p valor Sin embargo, de acuerdo con el teorema central del límite, cuando el tamaño muestral es grande la distribución muestral de `\(\bar{Y}\)` se aproxima correctamente mediante una **distribución normal**. Bajo la hipótesis nula la media de esta distribución normal es `\(\mu_{y,0}\)` , por lo que bajo la hipótesis nula `\(\bar{Y}\)` se distribuye Normal `\((\mu_{y,0}\)`, `\(\sigma\)` `\(_\bar{Y})\)` Esta **aproximación normal** para grandes muestras hace posible calcular el **p-valor** sin necesidad de conocer la distribución poblacional de Y, en tanto el tamaño muestral sea elevado. <img src="p_valor.png" alt="Descripción de la imagen" style="width: 450px; height: 300px;" /> --- ### Valor-p <br> • Medida de lo inusual de un resultado cuando la hipótesis nula es verdadera. • Que tan frecuente es que en el muestreo repetido se obtenga la diferencia observada entre el resultado muestral observado y los resultados muestrales esperados • Valor-p va de 0 a 1 • Muestra probabilidad de que un suceso ocurra al azar En el caso de ser verdadera la `\(H_0\)`, sólo en un 5% de las veces (o menos) las diferencias observadas serán lo suficientemente grandes como para conducirnos erróneamente a la conclusión de H1. --- ### Intervalos de confianza Debido al error de muestreo aleatorio, es imposible saber el valor exacto de la media poblacional de Y utilizando solo la información de una muestra. Sin embargo, es posible utilizar los datos de una muestra aleatoria para construir un conjunto de valores que contengan la verdadera media poblacional `\(\mu_{Y}\)` con una cierta probabilidad preestablecida. Este conjunto de valores se denomina **intervalo de confianza**, y la probabilidad preestablecida de que `\(\mu_{Y}\)` esté contenida en este conjunto se denomina **nivel de confianza**. --- ### El estadístico t La media muestral estandarizada `\(\frac{\bar{Y}-\mu_{y,0}}{SE(\bar{Y})}\)` desempeña un papel central en el contraste de hipótesis y tiene un nombre concreto, estadístico t o t-ratio. `$$t=\frac{\bar{Y}-\mu_{y,0}}{SE(\bar{Y})}$$` En general, un **estadístico de contraste** es un estadístico utilizado para llevar a cabo un contraste de hipótesis. El estadístico t es un ejemplo importante de un contraste de hipótesis. Cuando n es grande la distribución del estadístico t se aproxima bien mediante la distribución normal. Por tanto, bajo la hipótesis nula, t se distribuye aproximadamente N(0,1) para n grande. Finalmente, se calcula el *valor-p* del asociado al estadístico t encontrado y se calcula un intervalo de confianza para el valor desconocido de la población. Todos estos cálculos los realiza el software estadístico. --- ### Resumen <br> -- El contraste de hipótesis consiste en la formulación de una hipótesis específica acerca de la población, y a continuación, utilizando la **evidencia muestral**, decidir si es cierta. Los intervalos de confianza utilizan un conjunto de datos con el fin de estimar un intervalo o rango para una característica desconocida de la población. El valor p, es la probabilidad de que se haya producido un resultado por casualidad. El valor de significación `\((\alpha)\)` se compara con un corte predeterminado (el nivel de significación) para determinar si una prueba es estadísticamente significativa. El estadístico t se utiliza para contrastar la hipótesis nula de que la media poblacional toma un valor en concreto. Si n es grande, el estadístico t tiene una distribución muestral normal estándar cuando la hipótesis nula es verdadera. El estadístico t se puede utilizar para calcular el p-valor asociado con la hipótesis nula. Un p-valor pequeño evidencia que la hipótesis nula es falsa. Un intervalo de confianza del 95 % para `\(\mu_{y}\)` es un intervalo construido de manera que contenga el verdadero valor de `\(\mu_{y}\)` en el 95% de todas las muestras posibles. --- class: inverse, center, middle # Covarianza y correlación --- ### Covarianza y correlación <br> -- *Covarianza*: Una medida del grado al que dos variables aleatorias evolucionan conjuntamente es su covarianza. `\(cov(X,Y) = \sigma_{xy}\)` = `\(\sum_{i=1}^{k} (x - \mu_x)(y - \mu_y)* Pr(X=x_j,Y=y_i)\)` Interpretación, si tanto `\(x_j\)` como `\(y_i\)` disminuyen o aumentan en conjunto la covarianza será positiva. En cambio, si `\(x_j\)` aumenta (o disminuye) cuando `\(y_i\)` disminuye (o aumenta), la covarianza será negativa. Finalmente, si X e Y son independientes, entonces la covarianza es cero. --- ### Correlación <br> -- Debido a que la *covarianza* es el producto de X e Y, en desviaciones respecto de sus medias, sus unidades son, desafortunadamente, las unidades de X multiplicadas por las unidades de Y. Este problema de «unidades» puede ocasionar que los resultados numéricos de la covarianza sean difíciles de interpretar. <br> -- La *correlación* es una medida alternativa de la dependencia entre X e Y que resuelve el problema de las «unidades» de la covarianza. En concreto, la *correlación* entre X e Y es la covarianza entre X e Y dividida por sus desviaciones típicas. --- ### Correlación <br> -- `$$Corr(X,Y) = \frac{cov(X,Y)}{\sqrt{var(X)var(Y)}} = \frac{\sigma_{xy}}{\sigma_{x}\sigma_{y}}$$` Al ser las unidades del numerador de la Ecuación (2.25) las mismas que las del denominador, las unidades se cancelan y la correlación no tiene unidades. Las variables aleatorias X e Y se dice que están incorrelacionadas si `\(corr(X, Y) = 0\)`. La correlación siempre toma valores *entre -1 y 1* --- ### Correlación <img src="correlaciones1.png" alt="Descripción de la imagen" width="470" height="500" /> --- #### Base de datos Teaching Ratings TeachingRatings contiene datos de evaluaciones docentes, características del profesor y del curso para 463 cursos dentro de los años 2000-2002 en la University of Texas en Austin. Estos datos fueron usados en un paper con Amy Parker, “Beauty in the Classroom: Instructors’ Pulchritude and Putative Pedagogical Productivity”. <table class=" lightable-classic" style="font-family: Cambria; width: auto !important; margin-left: auto; margin-right: auto;border-bottom: 0;"> <caption>Tabla 1. Estadísticos descriptivos</caption> <thead> <tr> <th style="text-align:left;"> </th> <th style="text-align:left;"> Variable </th> <th style="text-align:left;"> Etiqueta </th> <th style="text-align:right;"> n </th> <th style="text-align:right;"> Media </th> <th style="text-align:right;"> D. estandar </th> <th style="text-align:right;"> Mediana </th> <th style="text-align:left;"> Rango </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> 6 </td> <td style="text-align:left;"> minority </td> <td style="text-align:left;"> Minority </td> <td style="text-align:right;"> 463 </td> <td style="text-align:right;"> 0.1382289 </td> <td style="text-align:right;"> 0.3455134 </td> <td style="text-align:right;"> 0.0000000 </td> <td style="text-align:left;"> 1 (0-1) </td> </tr> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> age </td> <td style="text-align:left;"> Age </td> <td style="text-align:right;"> 463 </td> <td style="text-align:right;"> 48.3650108 </td> <td style="text-align:right;"> 9.8027420 </td> <td style="text-align:right;"> 48.0000000 </td> <td style="text-align:left;"> 44 (29-73) </td> </tr> <tr> <td style="text-align:left;"> 4 </td> <td style="text-align:left;"> female </td> <td style="text-align:left;"> Female </td> <td style="text-align:right;"> 463 </td> <td style="text-align:right;"> 0.4211663 </td> <td style="text-align:right;"> 0.4942802 </td> <td style="text-align:right;"> 0.0000000 </td> <td style="text-align:left;"> 1 (0-1) </td> </tr> <tr> <td style="text-align:left;"> 8 </td> <td style="text-align:left;"> onecredit </td> <td style="text-align:left;"> One Credit </td> <td style="text-align:right;"> 463 </td> <td style="text-align:right;"> 0.0583153 </td> <td style="text-align:right;"> 0.2345922 </td> <td style="text-align:right;"> 0.0000000 </td> <td style="text-align:left;"> 1 (0-1) </td> </tr> <tr> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> beauty </td> <td style="text-align:left;"> Beauty </td> <td style="text-align:right;"> 463 </td> <td style="text-align:right;"> 0.0000001 </td> <td style="text-align:right;"> 0.7886477 </td> <td style="text-align:right;"> -0.0680143 </td> <td style="text-align:left;"> 3.42 (-1.45-1.97) </td> </tr> <tr> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> course_eval </td> <td style="text-align:left;"> Course eval </td> <td style="text-align:right;"> 463 </td> <td style="text-align:right;"> 3.9982721 </td> <td style="text-align:right;"> 0.5548656 </td> <td style="text-align:right;"> 4.0000000 </td> <td style="text-align:left;"> 2.9 (2.1-5) </td> </tr> <tr> <td style="text-align:left;"> 5 </td> <td style="text-align:left;"> intro </td> <td style="text-align:left;"> Intro </td> <td style="text-align:right;"> 463 </td> <td style="text-align:right;"> 0.3390929 </td> <td style="text-align:right;"> 0.4739135 </td> <td style="text-align:right;"> 0.0000000 </td> <td style="text-align:left;"> 1 (0-1) </td> </tr> <tr> <td style="text-align:left;"> 7 </td> <td style="text-align:left;"> nnenglish </td> <td style="text-align:left;"> NNenglish </td> <td style="text-align:right;"> 463 </td> <td style="text-align:right;"> 0.0604752 </td> <td style="text-align:right;"> 0.2386229 </td> <td style="text-align:right;"> 0.0000000 </td> <td style="text-align:left;"> 1 (0-1) </td> </tr> </tbody> <tfoot> <tr><td style="padding: 0; " colspan="100%"><span style="font-style: italic;">Fuente: </span></td></tr> <tr><td style="padding: 0; " colspan="100%"> <sup></sup> Elaboración propia en base a TeachingRatings</td></tr> </tfoot> </table> --- ### Correlación, ejemplo <!-- --> ``` ## [1] 0.1890391 ``` --- class: inverse, center, middle # Regresión --- ### Regresión <br> -- La regresión es una relación entre variables cuantitativas, al igual que la correlación, pero los estimadores en la regresión corresponden a los coeficientes que acompañan a las variables explicativas (independientes) en la recta de regresión. Estos coeficientes de regresión corresponden a la pendiente de la variable dependiente, es decir, cuanto afecta un predictor(v.i.) sobre una variable dependiente. **Tiene por objetivo último establecer relaciones causales entre una variable independiente sobre una dependiente** Sirve para responder preguntas del tipo Si estudio una hora más todos los días, ¿cuánto mejorará mi promedio? ¿cómo afecta la belleza de un(@) profesor(@) su evaluación docente? ¿Cuánto afecta la presencia de sindicatos la probabilidad de conflicto laboral? --- ### Ecuación de regresión lineal <br> La siguiente ecuación es el modelo de regresión lineal con regresor único, en el que Y es la variable dependiente y X es la variable independiente o regresor `$$Y_i=\beta_0+\beta_1X_i+u_i$$` Donde - `\(\beta_0\)` es el término constante o intercepto de esta recta - `\(\beta_1\)` es la pendiente - `\(u_i\)` es el termino de error, recoge todos los factores responsables de la diferencia entre los valores de Y observados en los datos y el valor predicho por la recta poblacional. `\(\beta_0\)` y `\(\beta_1\)` son los coeficientes de la recta de regresión poblacional Esta es la relación entre Y y X que se cumple en promedio para la población. Por lo que `\(\beta_0\)` y `\(\beta_1\)` son conocidos como los parámetros de regresión poblacional. --- ### Recta de regresión <img src="regresion.png" alt="Descripción de la imagen" style="width: 800px; height: 450px;" /> --- ### Regresión lineal <br> El método más utilizado para estimar los coeficientes de regresión lineal se obtienen por medio del método de Mínimos Cuadrados Ordinarios (MCO) u OLS (*Ordinary Least Squares*). `\(\beta_{HorasEstudio}\)` = `\(\frac{Variaciónnotas}{Variaciónhorasestudio}\)` = `\(\frac{\triangle{notas}}{\triangle{Horasestudio}}\)` <br> -- `\(\triangle{notas}\)` = `\(\beta_{HorasEstudio}\)` x `\(Horas Estudio\)` -- <br> `\(notas\)` = `\(\beta_{0}\)` + `\(\beta_{HorasEstudio}\)` x `\(Horas Estudio\)` -- `\(Evaluacion Docente\)` = `\(\beta_{0}\)` + `\(\beta_{Belleza}\)` x `\(Belleza\)` `\(Pr(Conflicto Laboral)\)` = `\(\beta_{0}\)` + `\(\beta_{Sindicato}\)` x `\(Sindicato\)` --- background-image: background-position: 50% 50% class: center, bottom, inverse ## Ahora vamos con un ejemplo en R! --- ## Ejemplo de ejercicio [1] -0.0467139 <table style="text-align:center"><tr><td colspan="7" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"></td><td colspan="6"><em>Dependent variable:</em></td></tr> <tr><td></td><td colspan="6" style="border-bottom: 1px solid black"></td></tr> <tr><td style="text-align:left"></td><td colspan="6">Índice de Bienestar Persona</td></tr> <tr><td style="text-align:left"></td><td colspan="6"><em>OLS</em></td></tr> <tr><td style="text-align:left"></td><td>Nororiente</td><td>Norponiente</td><td>Centro Oriente</td><td>Centro Poniente</td><td>Sur Oriente</td><td>Sur Poniente</td></tr> <tr><td style="text-align:left"></td><td>(1)</td><td>(2)</td><td>(3)</td><td>(4)</td><td>(5)</td><td>(6)</td></tr> <tr><td colspan="7" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">Intercepto (constante)</td><td>-0.630<sup>***</sup> (0.124)</td><td>0.444<sup>***</sup> (0.054)</td><td>-0.223<sup>***</sup> (0.063)</td><td>0.147 (0.092)</td><td>-0.183<sup>**</sup> (0.090)</td><td>-0.146<sup>***</sup> (0.050)</td></tr> <tr><td style="text-align:left">Tipo de vivienda Departamento</td><td>-0.191 (0.376)</td><td>0.469<sup>***</sup> (0.094)</td><td>-0.904<sup>***</sup> (0.093)</td><td>0.443 (0.328)</td><td>-0.403<sup>***</sup> (0.152)</td><td>-0.661<sup>***</sup> (0.117)</td></tr> <tr><td style="text-align:left">Tipo de vivienda Pieza en casa</td><td>0.256<sup>***</sup> (0.036)</td><td>0.087<sup>*</sup> (0.050)</td><td>-0.075<sup>*</sup> (0.045)</td><td>0.119<sup>**</sup> (0.055)</td><td>-0.044 (0.049)</td><td>0.025 (0.056)</td></tr> <tr><td style="text-align:left">Sexo Hombre</td><td>-0.004 (0.044)</td><td>-0.113<sup>*</sup> (0.064)</td><td>0.264<sup>***</sup> (0.048)</td><td>0.025 (0.077)</td><td>0.236<sup>***</sup> (0.065)</td><td>0.595<sup>***</sup> (0.078)</td></tr> <tr><td style="text-align:left">30 a 44 años</td><td>0.287<sup>***</sup> (0.052)</td><td>0.187<sup>***</sup> (0.071)</td><td>0.394<sup>***</sup> (0.051)</td><td>-0.480<sup>***</sup> (0.079)</td><td>-0.403<sup>***</sup> (0.085)</td><td>0.342<sup>***</sup> (0.072)</td></tr> <tr><td style="text-align:left">45 a 59 años</td><td>-0.301<sup>***</sup> (0.055)</td><td>-0.118 (0.077)</td><td>-0.044 (0.055)</td><td>-0.094 (0.074)</td><td>-0.427<sup>***</sup> (0.062)</td><td>0.451<sup>***</sup> (0.074)</td></tr> <tr><td style="text-align:left">60 a 74 años</td><td>0.136 (0.086)</td><td>0.036 (0.146)</td><td>0.376<sup>***</sup> (0.071)</td><td>-0.555<sup>***</sup> (0.148)</td><td>-0.015 (0.148)</td><td>0.502<sup>***</sup> (0.096)</td></tr> <tr><td style="text-align:left">75 años o más</td><td>0.046 (0.043)</td><td>-0.252<sup>***</sup> (0.049)</td><td>0.082<sup>**</sup> (0.039)</td><td>0.195<sup>***</sup> (0.070)</td><td>0.200<sup>***</sup> (0.057)</td><td>0.288<sup>***</sup> (0.073)</td></tr> <tr><td style="text-align:left">Nacionalidad Extranjera</td><td>3.711<sup>***</sup> (0.135)</td><td>2.917<sup>***</sup> (0.074)</td><td>3.195<sup>***</sup> (0.063)</td><td>3.139<sup>***</sup> (0.111)</td><td>3.286<sup>***</sup> (0.099)</td><td>2.900<sup>***</sup> (0.066)</td></tr> <tr><td colspan="7" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">Observations</td><td>466</td><td>384</td><td>409</td><td>383</td><td>384</td><td>379</td></tr> <tr><td style="text-align:left">R<sup>2</sup></td><td>0.348</td><td>0.297</td><td>0.381</td><td>0.239</td><td>0.311</td><td>0.547</td></tr> <tr><td style="text-align:left">Adjusted R<sup>2</sup></td><td>0.337</td><td>0.282</td><td>0.369</td><td>0.222</td><td>0.297</td><td>0.538</td></tr> <tr><td style="text-align:left">Residual Std. Error</td><td>3.711 (df = 457)</td><td>5.905 (df = 375)</td><td>4.877 (df = 400)</td><td>7.540 (df = 374)</td><td>4.108 (df = 375)</td><td>3.301 (df = 370)</td></tr> <tr><td style="text-align:left">F Statistic</td><td>30.508<sup>***</sup> (df = 8; 457)</td><td>19.833<sup>***</sup> (df = 8; 375)</td><td>30.836<sup>***</sup> (df = 8; 400)</td><td>14.648<sup>***</sup> (df = 8; 374)</td><td>21.199<sup>***</sup> (df = 8; 375)</td><td>55.923<sup>***</sup> (df = 8; 370)</td></tr> <tr><td colspan="7" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"><em>Note:</em></td><td colspan="6" style="text-align:right"><sup>*</sup>p<0.1; <sup>**</sup>p<0.05; <sup>***</sup>p<0.01</td></tr> <tr><td style="text-align:left"></td><td colspan="6" style="text-align:right">*** p < 0.001; ** p < 0.01; * p < 0.05</td></tr> </table>