DataparkSearch
Пока процесс обсуждения не завершён, статью можно попытаться улучшить, однако следует воздерживаться от переименований или немотивированного удаления содержания, подробнее см.руководство к дальнейшему действию.
Не снимайте пометку о выставлении на удаление доподведения итога обсуждения.
| DataparkSearch | |
|---|---|
| Тип | поисковая машина |
| Разработчик | Максим Захаров |
| Написана на | C |
| Операционные системы | FreeBSD,GNU/Linux,Sun Solaris |
| Последняя версия | 4.54 (3 декабря2016) |
| Репозиторий | github.com/Maxime2/datap… |
| Лицензия | GNU General Public License |
| Сайт | www.dataparksearch.org |
DataparkSearch Engine —поисковая машина с открытым исходным текстом, написанная наязыке С. Распространяется по лицензииGNU GPL. Предназначена для организациипоиска на одном или многихвеб-серверах.
DataparkSearch самостоятельно может индексировать текст,HTML иXML, а также многие другие данные, используя внешниепарсеры.
Машина готова для индексирования многоязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение; использует технологию согласования содержимого для индексирования копий одной и той же страницы на разных языках; может искать без учёта акцентов символов (диакритических знаков); а также разбивать на слова и фразы китайского, корейского, тайского и японского языков. Возможно использование синонимов, акронимов и всех морфологических форм слова для расширения результатов поиска.
Использует собственную технологию ссылочного ранжирования, основанную нанейронной сети. Эта технология называется Neo Popularity Rank. Результаты поиска могут сортироваться порелевантности, популярности, дате последнего изменения и по важности (произведению релевантности на популярность).
Для уточнения ранжирования сайтов может автоматически строить рефераты индексируемых страниц, состоящие из трёх наиболее важных предложений.
Ссылки
[править |править код]- Официальный сайт проекта
- Страница проекта в Google Code
- Порт FreeBSD
- newslookup.com — новостной сайт, использующий DataparkSearch.
- Википедия:Страницы с ежедневно очищаемым кэшем
- Википедия:Страницы на КУ (не распределённые по типам)
- Википедия:Кандидаты на удаление
- Википедия:Месяцев просрочки на КУ:12
- Википедия:Статьи без изображений (тип: программное обеспечение)
- Страницы с неизвестными параметрами шаблона Программа
- ПРО:ИТ:Статьи по алфавиту
- ПРО:ИТ:Последняя правка: в прошлом году