OpenRefine | |||
---|---|---|---|
![]() | |||
![]() | |||
Información general | |||
Tipo de programa | software libre | ||
Idiomas | |||
Información técnica | |||
Programado en | |||
Versiones | |||
Última versión estable | 3.9.226 de marzo de 2025 | ||
Archivos legibles | |||
| |||
Enlaces | |||
OpenRefine es una aplicación de escritorio decódigo abierto para la limpieza y transformación de datos a otros formatos, una actividad comúnmente conocida comodata wrangling (disputa de datos).[1] Es similar a las aplicaciones dehoja de cálculo y puede manejar formatos de archivo como CSV, pero se comporta más como una base de datos.
Opera enfilas de datos que tienen celdas debajo decolumnas, similar a la forma en que operan las tablas debases de datos relacionales. Los proyectos de OpenRefine constan de una tabla, cuyas filas se pueden filtrar utilizandofacetas que definen criterios (por ejemplo, mostrar filas donde una columna determinada no está vacía).
A diferencia de las hojas de cálculo, la mayoría de las operaciones en OpenRefine se realizan en todas las filas visibles, por ejemplo, la transformación de todas las celdas en todas las filas en una columna,[2] o la creación de una nueva columna basada en datos existentes. Las acciones realizadas en un conjunto de datos se almacenan en el proyecto y se pueden 'reproducir' en otros conjuntos de datos. Las fórmulas no se almacenan en celdas, pero se utilizan para transformar los datos. La transformación se realiza solo una vez.[3] Las expresiones de fórmula se pueden escribir en General Refine Expression Language (GREL),[4] enJython (es decir,Python) y enClojure.[5]
El programa funciona como unaaplicación web local: inicia unservidor web y abre el navegador predeterminado a127.0.0.1:3333.
La importación es compatible con los siguientes formatos:[12]
Si los datos de entrada están en un formato de texto no estándar, se pueden importar como líneas completas, sin dividir en columnas, y luego las columnas se extraen más tarde con las herramientas de OpenRefine. Se admiten archivos comprimidos y archivados (.zip, .tar.gz, .tgz, .tar.bz2, .gz o .bz2) y Refine puede descargar archivos de entrada desde unaURL. Para utilizar páginas web como entrada, es posible importar una lista de URL y luego invocar una función de recuperación de URL.
La exportación se admite en los siguientes formatos:[14]
Los proyectos completos de OpenRefine en formato nativo se pueden exportar como un archivo.tar.gz.
OpenRefine comenzó su vida como Freebase Gridworks, desarrollado porMetaweb y ha estado disponible como código abierto desde enero de 2010.[15] El 16 de julio de 2010,Google adquirió Metaweb,[16] los creadores deFreebase, y el 10 de noviembre de 2010 renombró Freebase Gridwords Google Refine, lanzando la versión 2.0.[17] El 2 de octubre de 2012, el autor original, David Huynh, anunció que Google dejaría pronto de brindar apoyo activo a Google Refine.[18][19] Desde entonces, el código base ha estado en transición a un proyecto de código abierto llamado OpenRefine.[20]