| OpenRefine | |
| Dezvoltator | Freebase(d), apoiGoogle, acum comunitatea open source |
|---|---|
| Versiune inițială | 10 noiembrie 2010; acum 15 ani, 3 luni și 9 zile (2010-11-10) |
| Ultima versiune | 3.9.5[1] |
| Repo | [2] https://github.com/OpenRefine/OpenRefine[2] |
| Scris în | Java[3] |
| Sistem de operare | Microsoft Windows macOS Linux |
| Platformă | Microsoft Windows,Linux,macOS |
| Disponibil în | engleză, italiană, chineză, japoneză, franceză, germană |
| Tip | |
| Licență | Licența BSD |
| Prezență online | |
| site web oficial cont X hasthtag | |
| Modificădate / text | |
OpenRefine este o aplicație desktopopen-source pentru curățarea datelor și transformarea în alte formate, o activitate cunoscută în mod obișnuit sub denumirea de manipularea datelor.[4] Este similar cu aplicațiile de foi de calcul și poate gestiona formate de fișiere de foi de calcul, cum ar fi CSV, dar se comportă mai mult ca o bază de date.
Funcționează perânduri de date care au celule grupate pecoloane, similar modului în care funcționează tabelele debaze de date relaționale. Proiectele OpenRefine constau dintr-un tabel, ale cărui rânduri pot fi filtrate folosindfațete care definesc criterii (de exemplu, afișând rândurile în care o anumită coloană nu este goală).
Spre deosebire de foile de calcul, majoritatea operațiilor din OpenRefine se fac pe toate rândurile vizibile, de exemplu, transformarea tuturor celulelor din toate rândurile de pe o coloană,[5] sau crearea unei coloane noi pe baza datelor existente. Acțiunile efectuate pe un set de date sunt stocate în proiect și pot fi „reluate” pe alte seturi de date. Formulele nu sunt stocate în celule, ci sunt folosite pentru a transforma datele. Transformarea se face o singură dată.[6] Expresiile cu formule pot fi scrise înGeneral Refine Expression Language (GREL),[7] înJython (adică, Python) și înClojure.[8]
Programul funcționează ca o aplicație web locală: pornește unserver web și deschide browserul implicit la adresa127.0.0.1 :3333.
Importul este acceptat din următoarele formate:[14]
Dacă datele de intrare sunt într-un format de text non-standard, pot fi importate ca linii întregi, fără a fi împărțite în coloane, iar apoi coloanele sunt extrase ulterior cu instrumentele OpenRefine. Fișierele arhivate și comprimate sunt acceptate (.zip, .tar.gz, .tgz, .tar.bz2, .gz sau .bz2); de asemenea, Refine poate descărca fișiere de intrare de la oadresă URL. Pentru a utiliza pagini web ca intrare, este posibil să importați o listă de adrese URL și apoi să invocați o funcție de preluare a URL-urilor.
Exportul este acceptat în următoarele formate:[16]
Toate proiectele OpenRefine în format nativ pot fi exportate ca arhivă .tar.gz.
OpenRefine și-a început viața caFreebase Gridworks, dezvoltat de Metaweb și este disponibil ca sursă deschisă din ianuarie 2010.[17] La 16 iulie 2010,Google a achiziționat Metaweb,[18] creatoriiFreebase(d), iar pe 10 noiembrie 2010 a redenumit Freebase Gridwords înGoogle Refine, lansând versiunea 2.0.[19] Pe 2 octombrie 2012, autorul original David Huynh a anunțat că Google va opri în curând dezvoltarea pentru Google Refine.[20][21][22] De atunci, baza de cod a fost mutată către un proiect open source numit OpenRefine.[23]