Contenidos
Imputación Knn
Un estimando científico \N(Q\) es una cantidad de interés científico que podemos calcular si observáramos a toda la población. Por ejemplo, podríamos estar interesados en la renta media de la población. En general, \(Q\) puede expresarse como una función conocida de los datos de la población. Si estamos interesados en más de una cantidad, \(Q\) será un vector. Nótese que \(Q\) es una propiedad de la población, por lo que no depende de ninguna característica del diseño. Algunos ejemplos de estimadores científicos son la media de la población, la (co)varianza o correlación de la población y las cargas de los factores de la población y los coeficientes de regresión, así como estas cantidades calculadas dentro de estratos conocidos de la población. Ejemplos de cantidades que no son estimandos científicos son las medias muestrales, los errores estándar y los estadísticos de prueba.
Sólo podemos calcular \ (Q\) si los datos de la población son totalmente conocidos, pero casi nunca es el caso. El objetivo de la imputación múltiple es encontrar una estimación \(\hat Q\) que sea insesgada y de confianza válida (Rubin 1996). A continuación explicamos estos conceptos.
Imputación media en r
Estás aquíComisión Europea ” Eurostat ” CROS ” DIME – Directores de Metodología ” Manuales metodológicos ” Manual de Metodología de las Estadísticas Empresariales Modernas ” Imputación ” Imputación basada en modelos (Tema)
El objetivo de la imputación basada en modelos es encontrar un modelo predictivo para cada variable objetivo del conjunto de datos que contiene valores perdidos. El modelo se ajusta a los datos observados y posteriormente se utiliza para generar imputaciones para los valores que faltan. Varios métodos de imputación comúnmente utilizados son casos especiales de imputación basada en modelos; esto incluye la imputación de la media, la imputación de la proporción y la imputación de la regresión.
Métodos de imputación múltiple
La imputación es el proceso utilizado para determinar y asignar valores de reemplazo para los datos faltantes, inválidos o inconsistentes que han fallado en las ediciones. Esto se hace cambiando algunas de las respuestas o asignando valores cuando faltan en el registro que se está editando para garantizar que las estimaciones sean de alta calidad y que se cree un registro plausible e internamente coherente. (Statistics Canada, “Statistics Canada Quality Guidelines”, 4ª edición, octubre de 2003, página 41, disponible en: http://www.statcan.ca:8096/bsolc/english/bsolc?catno=12-539-X&CHROPG=1).
Imputación múltiple spss
La información identificada como archivada se proporciona con fines de referencia, investigación o mantenimiento de registros. No está sujeta a las normas web del Gobierno de Canadá y no ha sido modificada ni actualizada desde que se archivó. Por favor, “contáctenos” para solicitar un formato distinto a los disponibles.
La imputación es el proceso utilizado para asignar valores de reemplazo para los datos faltantes, inválidos o incoherentes que no han sido editados. Esto ocurre después de hacer un seguimiento de los encuestados (si es posible) y de la revisión y corrección manual de los cuestionarios (si procede). La imputación se utiliza normalmente para tratar la falta de respuesta de los elementos y, ocasionalmente, la falta de respuesta de las unidades. La falta de respuesta unitaria se produce cuando no se recoge información utilizable para un registro determinado, mientras que la falta de respuesta de los ítems se produce cuando se recoge parte de la información deseada pero no toda. Después de la imputación, el archivo de datos de la encuesta debería contener normalmente sólo registros de datos plausibles e internamente coherentes que puedan utilizarse para la estimación de las cantidades de población de interés.