La Encuesta Nacional de Fuerza de Trabajo está concebida para ofrecer informaciones generales sobre el mercado de trabajo. Dentro de sus principales objetivos se encuentran:
- Evaluar la evolución del mercado de trabajo por medio de la estimación de los principales indicadores para poblaciones específicas, tales como, Tasa Global de Participación, Ocupación, Desocupación, Cesantía e Inactividad, según diversas desagregaciones.
- Conocer los ingresos promedios generados por la participación de los ocupados en dicho mercado, así como la jornada promedio trabajada.
- Estudiar la relación entre los resultados de las informaciones del mercado de trabajo y el comportamiento de las actividades económicas que conforman el Producto Interno Bruto (PIB).
- Permitir la elaboración de estudios de comparabilidad internacional de las estadísticas laborales del país con otros de características similares.
A continuación, se presentan una tabla resumen con algunos detalles de interés acerca de la encuesta. Para mayor especificidad consulta el Documento metodológico y el Boletín informativo No. I de la ENFT.
Especificaciones del Diseño | Encuesta Nacional (tradicional) de Fuerza de Trabajo (ENFT) |
---|---|
Población objeto de estudio | Hogares residentes en las viviendas no colectivas o particulares ocupadas de la República Dominicana. |
Cobertura geográfica | Todo el territorio nacional, incluyendo las islas aledañas. |
Marco censal de referencia | VIII Censo Nacional de Población y Vivienda 2002 y actualización cartográfica de la Provincia de Santo Domingo en el año 2006. |
Distribución geográfica de la población | 62.5% se asienta en el área urbana y 37.5% en la zona rural. |
Tipo de muestreo | Bietápico. |
Variable de diseño | Tasa de desocupación abierta. |
Nivel de confianza | 95% de confianza |
Máximo error esperado | Error de 1% |
Tasa de no respuesta mínima esperada | Tasa de no respuesta de 18% |
Dominio de estimación o inferencia estadística | Se diseñó para el Distrito Nacional, provincias principales de cada región de planificación y las principales provincias turísticas del país. |
Estratificación geográfica | 47 estratos. 8 réplicas o submuestras por estrato, se usan 4 en cada semestre. Zona geográfica (provincias o regiones de planificación) y zona de residencia (urbana y rural) reportada por Censo Nacional 2002. |
Asignación o distribución de la muestra por dominio | Asignación óptima y proporcional a la población por zona de residencia en cada dominio de estudio. |
Tamaño de muestra | Al año 19,904 viviendas en 1968 UPM’s. Cada semestre se selecciona de forma independiente 9,952 viviendas en 984 UPM’s. |
Selección de la muestra | Las áreas de supervisión censal se definieron como las unidades primarias de muestreo (UPM) y se seleccionaron con probabilidad proporcional al tamaño (PPT). Las unidades secundarias de muestro (USM) son las viviendas y se seleccionaron con igual probabilidad 12 viviendas en el área urbana y 8 en la rural. |
Traslape o solapamiento de viviendas | La muestra tendrá un 75% de viviendas comunes en dos años consecutivos. Se rotan 2 réplicas, una cada semestre, para un 25% de las viviendas en el año (4,976 viviendas). Se seleccionan muestras independientes para los semestres de un mismo año. |
Levantamiento en campo | Levantamiento semestral, primera semana de abril y de octubre. |
Período de referencia de estimación | A mediados de la última semana de marzo y de septiembre |
Factores de expansión | 1,968 factores al año, 984 factores por semestre, calculados en base a: muestra efectiva, tasa de respuesta, actualizaciones cartográficas de las UPM’s y las proyecciones de ONAPLAN realizadas en el año 1999. |
Nomenclaturas | a) Clasificación Internacional Uniforme de Ocupaciones (CIUO-88). b) Clasificación Industrial Internacional Uniforme de todas las Actividades Económicas (CIIU, Rev.3). |
Divulgación de resultados | Semestral |
¿Dónde puedo conseguir los datos de la encuesta?
Para conseguir los datos de la encuesta es necesario hacer una solicitud vía correo electrónico a la Oficina de Libre Acceso a la Información Pública del Banco Central de la República Dominicana.
Algunos cruces básicos y detalles finales utilizando la librería
Para el procesamiento de la encuesta puedes utilizar las funciones suministradas de la forma convencional o utilizar operadores pipe como %>%
o |>
si tiene R >= 4.1.
library(enftr)
library(dplyr)
#>
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#>
#> filter, lag
#> The following objects are masked from 'package:base':
#>
#> intersect, setdiff, setequal, union
Para mostrar algunas funcionalidades de la librería utilizaremos un pequeño data.frame
que simulará los datos de la encuesta. El archivo tiene la siguiente estructura.
enft <- enftr::enft
glimpse(enft)
#> Rows: 68
#> Columns: 4
#> Groups: EFT_PERIODO [34]
#> $ EFT_PERIODO <chr> "1/2000", "1/2000", "1/2001", "1/2001", "1/2002",…
#> $ EFT_SEXO <dbl> 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1…
#> $ EFT_FACTOR_EXP <dbl> 4134361, 4234634, 4195120, 4289152, 4258805, 4340…
#> $ EFT_FACTOR_EXP_ANUAL <dbl> 2067180, 2117317, 2097560, 2144576, 2129402, 2170…
Existen varias versiones de la base de datos de la encuesta. La versión más reciente corresponde a una versión con corrección de factores regionales para replicar las últimas estimaciones poblacionales de la Oficina Nacional de Estadísticas (ONE). Esta versión de la encuesta lleva los nombres de las variables precedidas por el patrón “EFT” además de que replica los valores anuales que se muestran a continuación.
enft %>%
ft_peri_vars() %>%
group_by(ano) %>%
summarise(
poblacion = sum(EFT_FACTOR_EXP_ANUAL)
)
#> # A tibble: 17 × 2
#> ano poblacion
#> <int> <dbl>
#> 1 2000 8397700.
#> 2 2001 8512768
#> 3 2002 8627858.
#> 4 2003 8744236.
#> 5 2004 8856477
#> 6 2005 8967632.
#> 7 2006 9071229
#> 8 2007 9173982.
#> 9 2008 9278345
#> 10 2009 9381159
#> 11 2010 9479715
#> 12 2011 9579338
#> 13 2012 9682189
#> 14 2013 9784771
#> 15 2014 9882333
#> 16 2015 9980904
#> 17 2016 10075473
En la librería existe una función llamada ft_version()
que intenta adivinar la versión de la encuesta que se está utilizando. Un ejemplo, del uso de esta función lo constituye la función ft_peri_vars()
que crea variables de tiempo como ano
, semestre
y periodo
, homologando el formato durante todo el período de la encuesta y para todas las versiones.
Como se mencionó antes, la enft
es una encuesta trimestral por lo que el factor de expansión es trimestral. Para trabajar con los datos en frecuencia anual se debe utilizar el factor de expansión anual.
enft %>%
ft_peri_vars() %>%
group_by(ano) %>%
summarise(
sum(EFT_FACTOR_EXP),
sum(EFT_FACTOR_EXP_ANUAL)
) %>%
tail()
#> # A tibble: 6 × 3
#> ano `sum(EFT_FACTOR_EXP)` `sum(EFT_FACTOR_EXP_ANUAL)`
#> <int> <dbl> <dbl>
#> 1 2011 19160149 9579338
#> 2 2012 19362652 9682189
#> 3 2013 19566681 9784771
#> 4 2014 19766123 9882333
#> 5 2015 19961431 9980904
#> 6 2016 20149223 10075473
En el primer caso, se usa el factor trimestral, por lo que el total poblacional está resultando 2 veces mayor, mientras que en el segundo caso obtenemos un total representativo de 10 millones aproximadamente.
Igual que en las otras librerías del proyecto endomer
, puedes asignar y utilizar etiquetas de datos para la variables. Lea más sobre las Etiquetas de datos en R aquí (En inglés).
enft %>%
ft_peri_vars() %>%
group_by(ano, EFT_SEXO) %>%
summarise(n = sum(EFT_FACTOR_EXP_ANUAL)) %>%
ft_use_labels() %>%
tail()
#> `summarise()` has grouped output by 'ano'. You can override using the `.groups` argument.
#> # A tibble: 6 × 3
#> # Groups: ano [3]
#> ano EFT_SEXO n
#> <int> <fct> <dbl>
#> 1 2014 Hombre 4924831
#> 2 2014 Mujer 4957502
#> 3 2015 Hombre 4949189
#> 4 2015 Mujer 5031715
#> 5 2016 Hombre 5004387
#> 6 2016 Mujer 5071086
Finalmente es importante mencionar que utilizando la función ft_browse_dict()
puedes acceder a una tabla interactiva en la que se puede consultar la el diccionario de la encuesta.