- Notifications
You must be signed in to change notification settings - Fork0
Datos de SUNEDU sobre licenciamiento de universidades en Perú
License
jmcastagnetto/sunedu-licenciamiento
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
Los datos combinan la información que se tenía en Abril del 2020 en datos abiertos (https://www.datosabiertos.gob.pe/dataset/sunedu-estado-licenciamiento-universidades), con la extracción manual ("scraping") de las tablas que muestran el avance de licenciamiento (https://www.sunedu.gob.pe/avances-licenciamiento/, descargado el 2021-01-14)
Los datos originales se guardan en los archivos:
- Datos abiertos:
orig/Licenciamiento Institucional_6.csv
(datos)orig/Licenciamiento Institucional - Diccionario_0.pdf
(documentación)
- Extracción manual:
orig/20210114-tablas-licenciamiento-sunedu.csv
Los datos originales se combinaron generando el archivoproc/sunedu-datos-combinados-crudo.csv
, el cual fue procesado usando OpenRefine (ver operaciones en:proc/openrefine-operations.json
) para generar el archivoproc/sunedu-datos-combinados-crudo-csv-openrefine-editado.csv
De este último se ha generado dos archivos que consolidan la información:
datos/sunedu-licenciamiento-20210114.csv
datos/sunedu-licenciamiento-20210114.rds
(formato RDS)
Estos datos tienen la siguiente estructura:
> skimr::skim(sunedu)── Data Summary ──────────────────────── ValuesName suneduNumber of rows 147 Number of columns 12 _______________________ Column type frequency: character 8 numeric 4 ________________________ Group variables None ── Variable type: character ─────────────────────────────────────────────────────────────────────────── skim_variable n_missing complete_rate min max empty n_unique whitespace1 nombre 0 1 16 76 0 147 02 gestion 0 1 7 7 0 2 03 departamento 0 1 3 13 0 25 04 provincia 4 0.973 3 23 0 48 05 distrito 4 0.973 3 22 0 82 06 estado 2 0.986 17 37 0 3 07 grupo 2 0.986 7 7 0 9 08 nota_estado_abril_2020 4 0.973 7 55 0 7 0── Variable type: numeric ───────────────────────────────────────────────────────────────────────────── skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist 1 codigo 4 0.973 75.0 43.7 1 36.5 77 112. 149 ▇▇▇▇▇2 latitud 4 0.973 -11.3 3.23 -18.0 -12.5 -12.1 -9.10 -3.59 ▂▂▇▃▂3 longitud 4 0.973 -76.0 2.67 -80.7 -77.1 -77.0 -74.7 -69.2 ▃▇▂▂▁4 periodo_licenciamiento 4 0.973 4.08 3.16 0 0 6 6 10 ▅▁▇▁▁
About
Datos de SUNEDU sobre licenciamiento de universidades en Perú