| HtmlUnit | ||
|---|---|---|
![]() | ||
| Información general | ||
| Tipo de programa | Navegador web | |
| Lanzamiento inicial | 22 de mayo de 2002 (23 años, 8 meses y 29 días) | |
| Licencia | Apache License 2.0 | |
| Idiomas | inglés | |
| Información técnica | ||
| Programado en | Java | |
| Plataformas admitidas | Java | |
| Versiones | ||
| Última versión estable | 2.17(03 de junio de 2015 (10 años, 8 meses y 17 días)) | |
| Enlaces | ||
HtmlUnit es unnavegador web sininterfaz de usuario escrito enJava. Permite la manipulación de alto nivel desitios web a partir de otro código Java, incluyendo el llenado y envío deformularios y el hacer click enhiperenlaces. También proporciona acceso a la estructura y los detalles de laspáginas web recibidas. HtmlUnit emula el comportamiento de las partes del navegador, incluyendo los aspectos de bajo nivel de losprotocolosTCP/IP yHTTP. Una secuencia comogetPage(url),getLinkWith("Click here"),click() permite al usuario navegar a través de hipertexto y obtener páginas web, incluyendoHTML,JavaScript,AJAX ycookies. También hay HtmlPage.getFrames(), pero hay problema con el método settimeout. Este navegador sin cabeza puede tratar con seguridad HTTPS,autenticación HTTP básica, la redirección automática de páginas y otras cabeceras HTTP. Permite al código Java de testeo (probador) examinar las páginas devueltas en forma de texto, un DOM XML, o como colecciones de formularios, tablas y enlaces.[1]
El uso más común de HtmlUnit es laautomación de pruebas de páginas web, pero a veces se puede utilizar paraweb scraping (extracción de datos web, literalmente, "raspado web") o descarga de contenido del sitio web.
La versión 2.0 incluye muchas mejoras nuevas, como una puesta en práctica de las características de la implementaciónW3CDOM Java 5, un mejor soporteXPath, y un mejor manejo de HTML incorrecto, además de diversas mejoras enJavaScript, mientras que la versión 2.1 se centra principalmente en afinar algunos problemas de rendimiento reportados por los usuarios.