Encuesta Nacional Continua de Fuerza de Trabajo (ENCFT) en R
Código:vignettes/encftr.Rmd
encftr.Rmd
“El objetivo general de la Encuesta Nacional Continua de Fuerza de Trabajo (ENCFT) consiste en proporcionar información estadística amplia y precisa sobre las distintas variables laborales, sociodemográficas y económicas que permita caracterizar y analizar la dinámica y heterogeneidad del mercado de trabajo en la República Dominicana y por consiguiente fortalecer y mejorar el diseño y formulación de las políticas y programas socio laborales del país. Además, tiene el propósito de dar seguimiento a la estimación de la pobreza monetaria estimada a través del ingreso de los hogares y las líneas oficiales de pobreza consensuadas para medir la misma en el país.” (BCRD, 2016)
A continuación, se presentan una tabla resumen con algunos detalles de interés acerca de la encuesta. Para mayor especificidad consulta el Diseño muestral, el Manual del Encuestador y el Boletín informativo No. I de la ENFT. También están disponibles las Presetaciones de lanzamiento de la encuesta donde además podrás encontrar la forma correcta de realizar algunos cálculos, aunque la mayoría, sino todos, ya se encuentran implementados en las funciones de esta librería.
Especificaciones del Diseño | Encuesta Nacional Continua de Fuerza de Trabajo (ENCFT) |
---|---|
Población objeto de estudio | Las personas residentes en los hogares de las viviendas particulares ocupadas de la República Dominicana. |
Cobertura geográfica | Todo el territorio nacional, incluyendo las islas aledañas. |
Marco censal de referencia | IX Censo Nacional de Población y Vivienda realizado en diciembre del año 2010. |
Distribución geográfica de la población | 75.0% en al área urbana y 25.0% en la zona rural. |
Tipo de muestreo | Probabilístico, estratificado, continuo, replicado y bietápico. |
Variable de diseño | Tasa de desocupación abierta y otras variables del mercado de trabajo. |
Nivel de confianza | 90% de confianza en la muestra (Z=1.645) para indicadores laborales. |
Máximo error esperado | Error de 2% en la estimación de los indicadores laborales. |
Tasa de no respuesta mínima esperada | Tasa de no respuesta de 22%, basado en la ENFT anteriores. |
Dominio de estimación o inferencia estadística | a) Gran Santo Domingo, Norte o Cibao, Este y Sur. b) Total país, zona urbana y zona rural. c) Gran Santo Domingo, resto urbano y resto rural. |
Estratificación geográfica | 23 estratos geográficos con 5 réplicas o submuestras en cada uno; formado en base a la zona de residencia reportada por el Censo Nacional 2010. |
Asignación o distribución de la muestra por dominio | Asignación óptima en los dominios de estudios y proporcional a la población por zona de residencia en los estratos geográficos. |
Tamaño de muestra | Se escogen 8,480 viviendas por trimestre en 1,060 segmentos censales o UPM’s. |
Selección de la muestra | a) Los segmentos censales se definieron como las unidades primarias de muestreo (UPM) y se seleccionaron con probabilidad proporcional al tamaño (PPT). b) Las unidades secundarias de muestreo (USM) son las viviendas y se seleccionan 8 por UPM con igual probabilidad, tanto en zona urbana como rural. |
Traslape o solapamiento de viviendas | 80% de las viviendas son comunes en dos trimestres consecutivos y un 20% en el mismo trimestre de dos años contiguos. Se rota 1 réplica equivalente al 20% del total de viviendas del trimestre. |
Levantamiento en campo | Forma continua a lo largo de 48 semanas durante el año y 12 semanas en el trimestre. |
Período de referencia de estimación | A mitad del trimestre de levantamiento de la Encuesta. |
Factores de expansión | 1,060 factores de expansión por trimestre calculados en base a: muestra efectiva, tasa de respuesta, actualizaciones cartográficas en las UPM’s y las proyecciones oficiales de población por zona de residencia realizadas por la ONE (2014-2015). |
Nomenclaturas | a) Clasificación Internacional Uniforme de Ocupaciones (CIUO-08). b) Clasificación Industrial Internacional Uniforme de todas las Actividades Económicas (CIIU, Rev.4). |
Divulgación de resultados | Trimestrales. |
¿Dónde puedo conseguir los datos de la encuesta?
Para conseguir los datos de la encuesta es necesario hacer una solicitud vía correo electrónico a la Oficina de Libre Acceso a la Información Pública del Banco Central de la República Dominicana.
Algunos cruces básicos y detalles finales utilizando la librería
library(encftr)
library(dplyr)
#>
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#>
#> filter, lag
#> The following objects are masked from 'package:base':
#>
#> intersect, setdiff, setequal, union
Para mostrar algunas funcionalidades de la librería utilizaremos un pequeño data.frame que simulará los datos de la encuesta. El archivo tiene la siguiente estructura.
encft <- encftr::encft
glimpse(encft)
#> Rows: 256
#> Columns: 5
#> Groups: TRIMESTRE, ANO, SEXO [8]
#> $ TRIMESTRE <dbl> 20161, 20161, 20161, 20161, 20161, 20161, 20161, 2016…
#> $ ANO <dbl> 2016, 2016, 2016, 2016, 2016, 2016, 2016, 2016, 2016,…
#> $ SEXO <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,…
#> $ ID_PROVINCIA <dbl> 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16…
#> $ FACTOR_EXPANSION <dbl> 529286.00, 126833.66, 48703.15, 99383.29, 39469.04, 1…
Para el procesamiento de la encuesta puedes utilizar las funiones suministradas de la forma convencional o utilizar operadores pipe como %>%
.
Como se mencionó antes la ENCFT es una encuestra trimestral por lo que el factor de expansión es trimestral.
encft %>%
group_by(TRIMESTRE) %>%
summarise(sum(FACTOR_EXPANSION))
#> # A tibble: 4 × 2
#> TRIMESTRE `sum(FACTOR_EXPANSION)`
#> <dbl> <dbl>
#> 1 20161 10039487.
#> 2 20162 10062657.
#> 3 20163 10086474.
#> 4 20164 10110143.
Para trabajar con los datos en frecuencia anual debes transformar el factor de expansión.
encft %>%
ftc_compute_factor_exp_anual() %>%
group_by(ANO) %>%
summarise(
sum(FACTOR_EXPANSION),
sum(factor_exp_anual)
)
#> Warning: `ftc_compute_factor_exp_anual()` was deprecated in encftr 0.5.0.
#> Please use `ftc_factor_exp_anual()` instead.
#> This warning is displayed once every 8 hours.
#> Call `lifecycle::last_lifecycle_warnings()` to see where this warning was generated.
#> # A tibble: 1 × 3
#> ANO `sum(FACTOR_EXPANSION)` `sum(factor_exp_anual)`
#> <dbl> <dbl> <dbl>
#> 1 2016 40298761. 10074690.
En el primer caso, que usa el factor trimestral, por lo que el total poblacional está resultando en más de 40 millones de personas, mientras que en el segundo caso obtenemos un total representativo de 10 millones aproximadamente.
También puedes asignar y utilizar etiquetas de datos para la variables. Lea más sobre las Etiquetas de datos en R.
encft %>%
ftc_compute_factor_exp_anual() %>%
group_by(ANO, SEXO) %>%
summarise(sum(factor_exp_anual))
#> `summarise()` has grouped output by 'ANO'. You can override using the `.groups`
#> argument.
#> # A tibble: 2 × 3
#> # Groups: ANO [1]
#> ANO SEXO `sum(factor_exp_anual)`
#> <dbl> <dbl> <dbl>
#> 1 2016 1 4956106.
#> 2 2016 2 5118584.
encft %>%
ftc_factor_exp_anual() %>%
group_by(ANO, SEXO) %>%
summarise(sum(factor_exp_anual)) %>%
ftc_use_labels()
#> `summarise()` has grouped output by 'ANO'. You can override using the `.groups`
#> argument.
#> # A tibble: 2 × 3
#> # Groups: ANO [1]
#> ANO SEXO `sum(factor_exp_anual)`
#> <dbl> <fct> <dbl>
#> 1 2016 Hombre 4956106.
#> 2 2016 Mujer 5118584.