DjVu

Материал из Википедии — свободной энциклопедии
Текущая версия страницы покане проверялась опытными участниками и может значительно отличаться отверсии, проверенной 3 июля 2024 года; проверки требуют7 правок.
Перейти к навигацииПерейти к поиску
Эта статья — о технологии компьютерного сжатия изображений. О компьютерной программе автоматизированного перевода см. Déjà Vu; о психологическом феномене см. дежавю; о других значениях термина см. дежавю (значения).
DjVu
Изображение логотипа
Расширение.djvu[3] или.djv[3]
MIME-типimage/vnd.djvu
image/x-djvu
СигнатураAT&TFORM
РазработчикAT&T Labs-Research,LizardTech (с марта 2000[1])
Опубликован1998
Последний выпуск27 (июль 2006[2])
Тип форматаЭлектронный документ
Открытый формат?Да
Сайтdjvu.org (англ.)
Логотип Викисклада Медиафайлы на Викискладе

DjVu (отфр. déjà vu — «уже виденное») — технология представления и хранения документов (книг, журналов, рукописей и подобных, прежде всего сканированных) с использованиемсжатия изображений с потерями.

Изначально технология была разработанаЯном Лекуном, Леоном Боту и Патриком Хеффнером вAT&T Labs с 1996 по 2001 годы.

Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения загрузки файла. DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлятьполнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области — ссылки, что позволяет реализовать удобную навигацию в DjVu-книгах.

Содержание

Используемые технологии

[править |править код]

Для сжатия цветных изображений в DjVu применяется специальная технология, разделяющая исходное изображение на три слоя: передний план, задний план и чёрно-белую (однобитовую) маску. Маска сохраняется с разрешением исходного файла; именно она содержит изображение текста и прочие чёткие детали. Разрешение заднего плана, в котором остаются иллюстрации и текстура страницы, по умолчанию понижается для экономии места. Передний план содержит цветовую информацию о маске; его разрешение обычно понижается ещё сильнее. Затем задний и передний планы сжимаются с помощьювейвлет-преобразования, а маска — алгоритмомJB2.

Особенностью алгоритма JB2 является то, что он ищет на странице повторяющиеся символы и сохраняет их изображение только один раз. В многостраничных документах каждые несколько подряд идущих страниц пользуются общим «словарём» изображений.

Для сжатия большинства книг можно обойтись только двумя цветами. В этом случае используется всего один слой, что позволяет достичь рекордной степени сжатия. В типичной книге с чёрно-белыми иллюстрациями, отсканированной с разрешением 600dpi, средний размер страницы составляет около 15Кб, то есть приблизительно в 100 раз меньше, чем исходный файл. В присутствии сложного заднего плана выигрыш объёма составляет обычно 4—10 раз. Однако при стандартных настройках в DjVu используетсясжатие данных с потерями, поэтому для особо важных документов обычно используются форматысжатия без потерь:PNG,JPEG 2000,TIFF и т. п. Например, сжатие без потерь предоставляет утилита CJB2 из пакетаDjVuLibre.

В основе формата DjVu лежат несколько технологий, в том числе разработанных вAT&T Labs:

  • алгоритм отделения текста от фона на отсканированном изображении;
  • вейвлетный алгоритм сжатия фонаIW44;
  • алгоритм сжатия чёрно-белых изображений JB2 (похожий наJBIG2);
  • универсальный алгоритм сжатияBZZ (похожий наBZIP2);
  • алгоритм распаковки «по запросу»;
  • алгоритм «маскировки» изображений.

Текстовое представление изображений DjVu

[править |править код]

Формат DjVu предусматривает наличиетекстового слоя, который содержит текст со страницы (используется для поиска и лёгкого копирования текста при работе с ним). В случае, если текстовый слой недоступен, единственный метод получения текста — выполнениеоптического распознавания в сторонних программах.

Лицензионная информация

[править |править код]

В марте 2000 года[1]AT&T продали технологию компанииLizardTech[4], которая пыталась использовать её в своих коммерческих интересах, но благодаряоткрытости формата[5] для создания и просмотра документов DjVu существуетсвободное программное обеспечение, доступное для различных платформ. 1 июля 2008 годаLizardTech передал менеджментDjVu родительской компанииCelartem[6], а 10 июня 2009 годаCelartem передал права на технологиюDjVu компанииCuminas (ранее Caminova[7])[8].

Существуетоткрытая публикуемая под лицензиейGNU GPL библиотекаDjVuLibre и программы-кодировщики и просмотрщики на ней.

См. также

[править |править код]

Примечания

[править |править код]
  1. 12См. файлreadme пакетаDjVuLibre-3.5.27.tar.gz
  2. DjVu File Format Versions . Разработчики DjVu (июль 2006). Дата обращения: 16 января 2010. Архивировано 13 июня 2010 года.
  3. 12TrID — 2003.
  4. DjVuLibre History and CreditsАрхивная копия от 9 сентября 2017 наWayback Machine (англ.)
  5. Лицензия . Дата обращения: 28 мая 2009. Архивировано 2 мая 2009 года.
  6. Пресс-релиз LizardTech . Дата обращения: 4 октября 2008. Архивировано изоригинала 28 сентября 2008 года.
  7. Caminova — Cuminas transition . Дата обращения: 25 октября 2014. Архивировано изоригинала 5 октября 2014 года.
  8. Пресс-релиз LizardTech . Дата обращения: 17 июля 2009. Архивировано изоригинала 16 июля 2009 года.

Ссылки

[править |править код]
Имеетсявикиучебник по теме«Создание электронной копии книги в формате DjVu в Linux»
Перейти к шаблону «Медиаконтейнеры»
Видео/аудио
Аудио
Музыка
Растровые
Векторные
Комплексные
Перейти к шаблону «Электронные книги»
Электронные книги(устройства идокументы)
Серии устройств
Форматы файлов
Каталогизаторы
Библиотеки
См. также
Источник —https://ru.wikipedia.org/w/index.php?title=DjVu&oldid=149813179
Категории:
Скрытые категории: