Portable Document Format

Материал из Википедии — свободной энциклопедии
Перейти к навигацииПерейти к поиску
Запрос «PDF» перенаправляется сюда; см. такжедругие значения.
Portable Document Format
Изображение логотипа
Расширение.pdf
MIME-типapplication/pdf
application/x-pdf
application/x-bzpdf
application/x-gzpdf
Сигнатура%PDF
РазработчикAdobe Systems,ISO
Опубликован15 июня 1993
Последний выпуск
Тип форматаэлектронный документ
Расширен изPostScript
Развит вPDF/A,PDF/X, PDF/E, PDF/UA, PDF/VT
Стандарт(ы)ISO 32000-2
Открытый формат?да
Сайтiso.org/standard/… (англ.)
Логотип Викисклада Медиафайлы на Викискладе

Portable Document Format (PDF) — межплатформенный открытыйформат электронных документов, изначально разработанный фирмойAdobe Systems в 1992 году с использованием ряда возможностей языкаPostScript. В первую очередь предназначен для представленияполиграфической продукции в электронном виде. Для просмотра существует множество программ, а также официальная бесплатная программаAdobe Reader. Значительное количество современного профессионального печатного оборудования имеет аппаратную поддержку формата PDF, что позволяет производить печать документов в данном формате без использования какого-либо программного обеспечения. Традиционным способом создания PDF-документов являетсявиртуальный принтер, то есть документ как таковой готовится в своей специализированной программе — графической программе илитекстовом редакторе,САПР и т. д., а затем экспортируется в форматPDF для распространения в электронном виде, передачи в типографию и т. п.

PDF с 1 июля 2008 года являетсяоткрытым стандартомISO 32000[2][3].

Формат PDF позволяет внедрять необходимые шрифты (построчный текст),векторные ирастровые изображения, формы имультимедиавставки. ПоддерживаетRGB,CMYK,Grayscale,Lab,Duotone,Bitmap, несколько типов сжатия растровой информации. Имеет собственные технические форматы для полиграфии:PDF/X-1a, PDF/X-3. Включает в себя механизмэлектронных подписей для защиты и проверки подлинности документов. В этом формате распространяется большое количество сопутствующей документации.

Содержание

Общие сведения

[править |править код]

Чаще всего PDF-файл является комбинацией текста срастровой ивекторной графикой, реже — текста сформами, сценариями на языкеJavaScript,3D-графикой и другими типами элементов.

Информационные объёмы двух одинаково выглядящих на экране PDF-документов могут значительно различаться в зависимости от:

  • внедрения или связыванияшрифтов имультимедиа;
  • разрешения растровых изображений;
  • использования встроенного механизма сжатия всего документа;
  • используемых алгоритмовсжатия растровых изображений.

Для создания документа минимального объёма необходимо использовать векторную графику и «безопасные» шрифты. Всего имеется 14 таких шрифтов:

  • Times (v3) (обычный, курсив, полужирный и полужирный курсив);
  • Courier (обычный, наклонный, полужирный и полужирный наклонный);
  • Helvetica (v3) (обычный, наклонный, полужирный и полужирный наклонный);
  • Symbol;
  • Zapf Dingbats[англ.].

Эти шрифты можно использовать без внедрения в документ, так как их должны правильно отображать все программы. Любые другие шрифты, которые не были внедрены в документ производителем и отсутствуют всистеме у зрителя, будут заменены одним из имеющихся, что может стать причиной неправильного отображения страниц, количества символов в строке и других ошибок отображения, связанных сметрикой шрифта.

Существует технология MRC (Mixed Raster Content), которая приближает возможности PDF к возможностям форматаDjVu по хранению сканированных изображений с текстом[4].

Ограничения формата

[править |править код]

В спецификации формата PDF размер страницы документа не ограничен, однако референсная программа для работы с файлами PDF — Adobe Acrobat — такое ограничение имеет. Ограничения имеются и в других программах, обрабатывающих файлы PDF[5][6].

Размер страницы в документе PDF устанавливается параметромMediaBox разделаPage, а начиная с PDF 1.6 на размер страницы также влияет параметрUserUnit. (В спецификациях PDF до версии 1.6 размер базовой единицы пользовательского пространства задан в 1/72 дюйма. Начиная с версии 1.6 в стандарте появилась возможность задать её размер с помощью параметраUserUnit. )[5][6].

В Adobe Acrobat 7.0 размер стороны страницы в документе ограничен 15 миллионами дюймов, что равно 381 километру. Это ограничение является вторичным, оно основано на ограничению размера базовой единицы пользовательского пространства (англ. default user space unit) — параметра «UserUnit», максимальное значение которого составляет 75000 единиц по 1/72 дюйма[5][6].

В Acrobat Reader до версии 4.0 минимальный размер стороны страницы составляет 1 дюйм (72 единицы), а максимальный размер равен 45 дюймам (3240 единиц)[5][6].

В версиях Acrobat 5.0 и 6.× допустимые размеры сторон страницы составляют от приблизительно 0,04 дюйма (3 единицы, 1/24 дюйма) до 200 дюймов (14400 единиц)[5][6].

Acrobat Reader версии 7.0 поддерживает спецификацию PDF 1.6, эта версия программы поддерживает диапазон значений параметраUserUnit от 1 до 75000, что ограничивает стороны страницы диапазоном от 1/72 дюйма до 15 млн дюймов, максимальный размер стороны страницы при этом равен 381 километру[5][6].

Поставляемое сmacOS приложениеPreview вообще не обрабатывает параметрUserUnit файла PDF и воспринимает все документы PDF как будто в них единица пользовательского пространства равна 1/72 дюйма[5][6].

Редактирование PDF

[править |править код]

Существуют специальные программы, позволяющие редактировать PDF-файлы, однако их выбор значительно меньше, чем программ для создания или просмотра PDF-документов.[источник не указан 734 дня]

Inkscape, начиная с версии 0.46, позволяет импортировать PDF и экспортировать в него благодаря использованию на промежуточном этапе программыPoppler[7].

В 2017 году функциональность по редактированию PDF была включена в программуABBYY FineReader, до этого имеющей функции распознавания и конвертирования PDF в другие форматы[8].

История

[править |править код]
Информация должна бытьпроверяема, иначе она может быть удалена. Вы можетеотредактировать статью, добавив ссылки наавторитетные источники в видесносок.(17 февраля 2024)
Возможно, этот раздел содержиторигинальное исследование.
Проверьте соответствие информации приведённым источникам и удалите или исправьте информацию, являющуюся оригинальным исследованием. В случае необходимости подтвердите информацию авторитетнымиисточниками. В противном случае этот раздел может быть удалён.(17 февраля 2024)

В первое время существования данный формат был крайне непопулярен:

  • программное обеспечение компанииAdobe для чтения и создания PDF было платным;
  • в PDF отсутствовала поддержка внешних ссылок, что делало его практически бесполезным во всемирной паутине;
  • PDF-документы были большего размера по сравнению с обычным текстом, что означало более длительную загрузку на медленных модемах, широко использовавшихся в те времена;
  • на слабых машинах отображение PDF-документов осуществлялось с заметными задержками;
  • существовало несколько конкурирующих форматов, таких, как Envoy, Common Ground Digital Paper, Farallon Replica; даже собственныйPostScript являлся конкурентом.

После того, как Adobe выпустила бесплатную версию Acrobat Reader для чтения PDF-документов (позднее переименованную в Adobe Reader), популярность этого формата стала возрастать. Формат PDF-файлов несколько раз изменялся и продолжает эволюционировать. Существует несколько спецификаций формата, последовательно расширяющих друг друга. Для каждой новой спецификации создаются новые версии программного обеспечения из пакетаAdobe Acrobat. Ниже показана таблица соответствий версий документов и версий программ, в которых впервые была введена поддержка этих документов. Версию любого PDF-документа можно узнать по первым восьми байтам, открыв этот документ в текстовом режиме, например в блокноте.

Версии Adobe PDF

[править |править код]
Информация должна бытьпроверяема, иначе она может быть удалена. Вы можетеотредактировать статью, добавив ссылки наавторитетные источники в видесносок.(17 февраля 2024)
Хронология спецификаций PDF
ГодВерсия документаНовые возможностиВерсияПО
1993PDF 1.0Acrobat 1.0
1994PDF 1.1пароли,ссылки,потоки, независимая от устройства цветопередачаAcrobat 2.0
1996PDF 1.2интерактивные элементы, обработка событий мыши, мультимедийные типы,Юникод, улучшенное представление цвета и графикиAcrobat 3.0
1999PDF 1.3цифровые подписи,цветовые пространстваICC иDeviceN,JavaScriptAcrobat 4.0
2001PDF 1.4JBIG2, прозрачность, текстовый слойOCRAcrobat 5.0
2003PDF 1.5JPEG 2000, связанное мультимедиа, объектные потоки, перекрестные потоки, слоиAcrobat 6.0
2005PDF 1.6внедренное мультимедиа, 3D,XML-формы,AES-шифрованиеAcrobat 7.0
2006PDF 1.7Acrobat 8.0
2008PDF 1.7,AEL3XFA 2.5 (EL1) и XFA 2.6 (EL1)Acrobat 9.0
2008PDF 1.7,AEL3AES-шифрование 256-битным ключом. XFA 2.7 и 2.8Acrobat 9.0
2009PDF 1.7,AEL5XFA 3.0Acrobat 9.1
2009PDF 1.7,AEL5XFA 3.1Acrobat 9.1
2011PDF 1.7,AEL8XFA 3.3Acrobat X (10)

Библиотеки для работы с PDF

[править |править код]
Информация должна бытьпроверяема, иначе она может быть удалена. Вы можетеотредактировать статью, добавив ссылки наавторитетные источники в видесносок.(16 декабря 2018)

C

[править |править код]

Свободные:

  • Haru

Проприетарные:

  • Adobe PDF Library SDK

C++

[править |править код]

Свободные:

Java

[править |править код]

Свободные:

  • Apache PDFBox[англ.] — создание документов, слияние или разделение документа(ов), извлечения текста или другого контента из документа, печать,электронная подпись.
  • ICEpdf — просмотр и печать документов, преобразование в изображение, извлечения контента, поиск в документе.
  • IText — это библиотека классов для генерации, анализа и изменения документов в форматах PDF, а такжеXML,HTML иRTF.

Проприетарные:

  • jPedal[англ.] — просмотр и обработка документов, извлечения контента.

Perl

[править |править код]

Свободные модули:

  • PDF::API2 — этот модуль может создавать, модифицировать и просматривайте файлы PDF.
  • PDF::Create — этот модуль позволяет создавать PDF-документы с использованием ряда примитивов. Результатом является PDF-файл или поток.
  • CAM::PDF — этот модуль читает и записывает любой документ, соответствующий спецификации PDF, предоставленной Adobe.
  • Text::PDF — этот модуль позволяет напрямую взаимодействовать с существующими файлами PDF.
  • PDF::Tiny — этот модуль очень легкий (ограниченный) анализатор PDF.
  • PDF — библиотека для доступа к PDF и управления им в Perl.
  • и многие другиеCPAN search PDF.

PHP

[править |править код]

Свободные:

  • pdfparser — библиотека PHP для синтаксического анализа PDF файлов и извлечения таких элементов, как текст.
  • mPDF — это библиотека PHP, которая создает PDF-файлы из HTML-кода UTF-8.
  • PHPPdf — это библиотека, которая преобразует документ XML в документ PDF или графические файлы.

Примечания

[править |править код]
  1. https://www.pdfa.org/iso-32000-22020-is-now-available/
  2. Формат PDF стал международным стандартомАрхивная копия от 20 февраля 2008 наWayback Machine —lenta.ru
  3. ISO Ballot for PDF 1.7 Passed! — blogs.adobe.comАрхивная копия от 14 ноября 2017 наWayback Machine (англ.)
  4. Как технология MRC уменьшает размер PDF-документов . Дата обращения: 27 октября 2011. Архивировано 3 ноября 2011 года.
  5. 1234567Chan, A. W. Making a PDF that’s larger than Germany :[англ.] : [арх. 31 января 2024]. — 2024. — 31 January.
  6. 1234567Чан, А. Создание PDF размером с Германию : [арх. 17 февраля 2024] = Making a PDF that’s larger than Germany / Пер. с англ.: Дмитрий Брайт // RuVDS. — 2024. — 16 февраля.
  7. Bah, T. Inkscape : Guide to a Vector Drawing Program. — 4th ed. — Prentice Hall, 2011. — P. 112–113. — 473 p. —ISBN 978-0-13-276414-8.
  8. Крупин, А. Четыре в одном: обзор нового ABBYY FineReader 14 : [арх. 24 октября 2018] // 3DNews.

Ссылки

[править |править код]
Имеетсявикиучебник по теме«Редактирование PDF файлов в Linux»
Перейти к шаблону «External links»
Ссылки на внешние ресурсы
Перейти к шаблону «Внешние ссылки» Перейти к элементу Викиданных
  Словари и энциклопедии
В библиографических каталогах
Перейти к шаблону «Программы для PDF»
Программы для работы с форматомPDF
Свободные и открытые
Проприетарные
Бесплатные
Коммерческие
Перейти к шаблону «Adobe»
Клиентское ПО
Серверное ПО
Технологии
Сервисы
Совет директоров
Приобретение
других компаний
Перейти к шаблону «Медиаконтейнеры»
Видео/аудио
Аудио
Музыка
Растровые
Векторные
Комплексные
Перейти к шаблону «Стандарты ISO»
СтандартыISO
1
по
9999
10000
по
19999
20000+
Источник —https://ru.wikipedia.org/w/index.php?title=Portable_Document_Format&oldid=151679617
Категории:
Скрытые категории: