- Notifications
You must be signed in to change notification settings - Fork5
Procesamiento de la Encuesta Continua de Hogares de Uruguay
License
calcita/ech
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
Caja de herramientas para el procesamiento de laEncuesta Continua deHogares deUruguaydel Instituto Nacional de Estadística (INE). Pretendemos contribuir a lacomunidad de usuaries de R en Uruguay, facilitando el uso de una de lasencuestas socioeconómicas más importantes del país. En este sentido, elpaquete implementa una serie de funciones que permiten el cálculo de losprincipales indicadores socioeconómicos que permite la encuesta.
Para la versión estable
install.packages('ech') library(ech)
Para la versión en desarrollo
# install.packages('devtools')# si no tiene instalado devtoolsdevtools::install_github("calcita/ech")library(ech)
Una serie de funciones del paquete que se usan internamente permitendescargar de la página del INE y convertir a un formato tidy los datosde: Índice de Precios al Consumo (IPC con base 2010), el Índice dePrecios de Alimentos y Bebidas (IPAB con base 2010), Canasta BásicaAlimentaria y No Alimentaria (CBA y CBNA), la codigue de CIIU4, losmicrodatos de cada ECH y sus respectivos diccionarios para los años 2011a 2019.
Las funciones para crear variables se organizan según la dimensión a lacual corresponden, así tenemos:
Vivienda (Dwelling): permite calcular la situación estructural ycoyuntural de la vivienda, las privaciones de la vivienda,hacinamiento y la tenencia de la vivienda.
Educación (Education): permite calcular el máximo nivel alcanzado, losaños de estudio, la completitud según niveles, la asistencia a uncentro educativo.
Mercado de trabajo (Employment): permite calcular la condición deactividad, la PEA (población económicamente activa), PET (población enedad de trabajar), PO (población ocupada) y PD (población desocupada),las restricciones al empleo, subempleo y las ramas de actividad segúnCIIU4.
Tipo de hogar (Household type): permite construir una tipología dehogar.
Ingresos y desigualdad (Income): permite calcular el ingresodeflactado (por el índice y año base elegido), quintiles y deciles deingreso, el ingreso laboral per cápita y por hora.
Pobreza (Poverty): permite calcular pobreza e indigencia y las NBI(Necesidad Básicas Insatisfechas).
Se pueden estimar medias, medianas y proporciones, totales y ratios, elÍndice de Gini, el Brecha salarial de género (GPG, por sus siglas eninglés Gender Pay Gap) y la relación quintil5/quintil1 (QSR, QuintilShare Ratio). Para los años 2018 y 2019 se cuenta con la información delas UPM (Unidades Primarias de Muestreo) y estratos por lo cual esposible definir correctamente el diseño de muestra y obtener intervalosde confianza correctos.
El paquete ech permite descargar los microdatos oficiales desde la webdel INE o bien utilizar microdatos ya procesados. En el primer caso losdatos se obtiene a través de la funciónget_microdata()
. En el segundocaso, puede usar la funciónread_microdata()
para leerlos. El paquetetiene tres grandes conjuntos de funciones: - las que leen datos desde laweb del INE, se llaman get_(). - las que calculan variables tanto anivel hogares como personas, estas tienen nombres descriptivos en inglésque se detallan más adelante. - las que estiman indicadores y calculanlos intervalos de confianza asociados, se llaman get_estimation_().
Ejemplo de descarga de microdatos:
# Cargo la librerialibrary(ech)# Cargo la baseech19<- get_microdata(year="2019",# Año/s a descargar (2011-2019)folder= tempdir(),# Carpeta para descargatoR=TRUE)# Lo guarda en formato RData
Como un segundo paso, recomendamos utilizar la funciónorganize_names()
que estandariza los nombres de variables llevándolasa los nombres de 2017. Este paso facilita el uso de las demás funcionesen la medida que todas contienen parámetros que dan cuenta del nombre dealguna variable y cuyo valor por defecto es el nombre de la variablepara 2017. La correspondencia entre variables para cada año se puedeobservar en el diccionarioech::dic
. No todas las variables de la echestán contempladas en el diccionario por lo que este proyecto estáabierto a contribuciones que en la medida que se agreguen nuevasfunciones serán necesarias.
# Organizamos nombres de variablesech19<- organize_names(ech19,2019)
Para estimar la proporción de hogares pobres por departamento, usamos lavariablepobre06
que ya viene en la ECH calculada y elegimos lafunción de estimaciónget_estimation_mean()
. Para estimar pordepartamento definimos como variable de crucenomdpto
. Elegimos elnivel de la estimación, hogares o personas, en el argumentolevel
, eneste caso, lo definimos como “h”.
# Genero una estimación:pobre_x_dpto<- get_estimation_mean(data=ech19,# Indico el data.framevariable="pobre06",# La variable a estimarby.x="nomdpto",# La variable de agrupaciónby.y=NULL,# Se permite otra variable de agrupacióndomain=NULL,# Se podría indicar un dominiolevel="h",# Defino que lo haga a nivel de hogarname="Pobreza")
El uso de este paquete se potencia al usarlo en conjunto congeouy ya que permite acceder adiferentes capas geográficas de Uruguay y construir mapas temáticos. Porejemplo, a la estimación anterior de hogares pobres por departamento sele pueden agregar las geometrías de los polígonos de cada departamentopara construir un mapa de coropletas.
# Solo me quedo con la estimación de pobrepobre_x_dpto<-pobre_x_dpto %>%dplyr::filter(pobre06=="Pobre")# Agrego geometríaspobre_x_dpto_geo<- add_geom(data=pobre_x_dpto,# Los datos en una unidad geográficaunit="Departamentos",# Unidad de agregación de los datosvariable="nomdpto")# Variable correspondiente a los códigos a la unidad
Y con esto, podemos hacer un mapa conggplot2
muy fácilmente de estasestimaciones.
# Hago un mapaplot_geouy(x=pobre_x_dpto_geo,col="Pobreza",l="%")
Este paquete se propone incorporar cualquier función de propósitosgenerales que utilice como base le Encuesta Continua de Hogares (ECH) deUruguay. Todos los aportes en este sentido son bienvenidos.
Si trabajas con la ECH de Uruguay y querés agregar tu función o tusdatos, te recomendamos que leas los siguientes consejos de comocolaboraraquí. También podésgenerar un issue si encontrás algún error.
Si este paquete te parece útil también hacenoslo saber que es nuestromotor para seguir desarrollándolo.
Para citar ech en publicaciones, por favor usa:
Mathieu, Gabriela & Detomasi, Richard (2020) “ech: Caja de herramientaspara procesar la Encuesta Continua de Hogares”. R package version0.0.1.20. URL:https://github.com/calcita/ech.
El formato BibTex para usar en tus archivos .bib o el gestorbibliográfico de tu preferencia:
@Misc{ech20, title = {ech: Caja de herramientas para procesar la Encuesta Continua de Hogares}, author = {Gabriela Mathieu & Richard Detomasi}, note = {R package version 0.2.1}, year = {2020}, url = {https://github.com/calcita/ech},}
About
Procesamiento de la Encuesta Continua de Hogares de Uruguay