Portable Document Format (PDF) —Adobe Systems фирмасы тарапынанPostScript тілінің бірқатар мүмкіндіктерін қолдана отырып жасаған электронды құжаттардың кросстұғырлы форматы.
Біріншіден, полиграфиялық өнімдерді электрондық нұсқада ұсынуға арналған, себебі заманауи кәсіби баспа жабдықтарының бірталайы PDF-ті тікелей өңдей алу мүмкіндігіне ие.[1] PDF форматындағы құжаттарды тамашалап, оқу үшін ресми түрдегі тегінAdobe Reader бағдарламасын және басқа да сырттай бағдарлама өндірушілердің бағдарламаларын қолдануға болады. PDF-құжатты құрудың дәстүрлі жолывиртуалды принтер болып табылады, яғни құжат арнайыкескіндік бағдарламада тізілу немесемәтіндік редакторда басылу, автоматты жобалау жүйесі бағдарламасында топталу жолымен жасалып, электронды нұсқада таратылу, баспаға беру және т.б. түрлі мақсатындаPDF форматына жөнелтіледі.
2008 жылдың 1 шілдесінен PDFISO-ның 32000ашық стандарты болып табылады.[2][3] ISO 32000-2:2020 ретінде шыққан соңғы басылым 2020 жылғы желтоқсанда жарияланды.[4]
PDF форматы қажетті қаріп түрлерін (жол асты мәтіні),векторлық немесерастрлық кескіндерді, пішіндер менмультимедиалық құралдарды енгізуге мүмкіндік береді.RGB,CMYK,Grayscale,Lab,Duotone,Bitmap және растрлық ақпарат сығылуының бірнеше типін қолдайды. Полиграфияға қажетті өзінің бірқатар техникалық форматтарына ие: PDF/X-1, PDF/X-3. Құжаттың қауіпсіздігі мен шынайылығын тексеру мақсатындаэлектронды қолтаңба механизмін қамтиды. Бұл формат түрінде қажетті құжаттаманың біршама бөлігі таратылады.
Көп жағдайда PDF кеңейтпесіндегі файл мәтін менрастрлық жәневекторлық кескіннің, кейде — мәтін мен уеб-пішіндердің,JavaScriptтің,3D-ксекін және басқа элемент типтерінің арасындағы қосындысы болып табылады.
Экраннан қарастырылып отырған бірдей екі PDF-құжаттың ақпараттық көлемдері айтарлықтай әртүрлі болуы мүмкін, ол мынандай жағдайларға байланысты:
- қаріптер мен мультимедияның енгізілуі және байланыстырылуы;
- растрлық кескіндердің рұқсаттығы;
- құжатты сығудың шартты механизмінің қолданылуы;
- растрлық кескіндерді сығу механизмдерінің қолданылыуы.
Кіші көлемді құжатты құру үшін векторлық кескін мен «қауіпсіз» қаріптерді қолданған дұрыс. Осындай «қауіпсіз» қаріптердің 14 түрі бар:
- Times (v3) (әдепкі, курсив, жартылай қалың және жартылай қалың курсив)
- Courier (әдепкі, қисайған, жартылай қалың және жартылай қалың қисайған)
- Helvetica (v3) (әдепкі, қисайған, жартылай қалың және жартылай қалың қисайған)
- Symbol
- Zapf Dingbats
Бұл қаріптер құжатқа енгізуді қажет етпейді және барлық бағдарламалар оларды дұрыс жаңғыртуы тиіс. Құжатқа енгізілмеген жәнеоперациялық жүйеде жоқ басқа да бір қаріп түрі осы аталған қаріп түрлерімен алмастырылуы мүмкін, өз кезегінде бұл, құжаттағы бет санының артылу-кему, жолдағы символ саны, жоларалық ара-қашықтық және қаріп метрикасымен байланысты ауытқуларды тудыруы мүмкін.
Бұлардан басқа MRC (Mixed Raster Content) технологиясы деген ұғым бар. Ол PDF мүмкіндіктерін сканерден өткізілген кескін мен мәтінді сақтаудың тағы бір форматыDjVu-ға жақындата түседі.[5]
PDF пішімінің әртүрлі бағдарламалық жасақтама мен аппараттық құрал платформаларында құжаттың сыртқы көрінісін дәл сақтауға бағытталуы PDF құжаттарын басқа файл пішімдеріне түрлендіруде және белгілі бір ақпаратты бөліп алуда қиындықтар туғызады. Мұндай ақпаратқамәтін,суреттер,кестелер, библиографиялық деректер және метадеректер жатады. Бұл міндеттерді орындауға арналған көптеген бағдарламалық құралдар мен бастапқы код кітапханалары бар. Сонымен қатар PDF құжаттарын түрлендіру және ақпаратты бөліп алу құралдарының тиімділігін салыстырмалы түрде бағалау үшін қолданылатын бірнеше таңбаланған деректер жиынтығы бар және олар эталондық тестілеуде пайдаланылады.[6]
Алғаш шыққан кезде бұл формат кең қолданысқа ие бола алмады, себебі:
- Құжатты оқып құрастыруға қажетті Adobe бағдарламалары ақылы еді;
- PDF-тің сыртқы сілтемелерді қолдау мүмкіндігі болмады, бұл оның ғаламдық тордағы қажетсіздігін көрсетті;
- PDF-құжаттардың қарапайым мәтінге қарағанда көлемдері артық болып, бұл сол кездегі кең қолданыста болған баяу модем арқылы жүктелу уақытынчто означало более длительную загрузку на медленных модемах, широко использовавшихся в те времена;
- Әлсіздеу келген есептеу машиналарында PDF-құжаттардың жаңғыртылуы үдеумен өтетін;
- Бәсекелес форматтар болатын, олардың ішіндеEnvoy,Common Ground Digital Paper,Farallon Replica; тіптіPostScript-тің өзі бәсекелестік құрайтын.
ТекAdobe өзінің тегін Acrobat Reader (кейінAdobe Reader деп атын өзгертті) PDF оқу бағдарламасын шығарғаннан кейін ғана бұл форматтың қолданысы кеңейе бастады. PDF-файлдарының дамуы бірнеше рет өзеріп, өз дамуын тоқтатқан жоқ. Бірін-бірі кезектей толықтыратын, осы форматтың бірнеше арнайы түрі бар. Әрбір жаңа арнайы түрі үшінAdobe Acrobat топтамасынан жаңа бағдарламалық қамтамасыз ету нұсқалары да шығарылуда. Төмендегі сәйкестілік кестесінде бұл құжаттарды қолдайтын құжат нұсқалары мен бағдарламаларының нұсқалары көрсетілген. Кез келген PDF-құжаттың нұсқасын құжатты мәтіндік редакторда, мысалға блокноттың көмегімен ашып, алғашқы сегіз байты арқылы білсе болады.
| жылы | құжат нұсқасы | жаңа мүмкіндіктері | БҚЕҚ нұсқасы |
|---|
| 1993 | PDF 1.0 | | Acrobat 1.0 |
| 1994 | PDF 1.1 | құпиясөздер, сілтемелер, мәліметтер ағыны, құрылғыдан тәуелсіз түс жаңғыртылуы | Acrobat 2.0 |
| 1996 | PDF 1.2 | интерактивті элементтер,тышқан қимылын қадағалау, мультимедиялық типтер, әмбебап код, түс пен кескінннің жетік жаңғыртылуы | Acrobat 3.0 |
| 1999 | PDF 1.3 | электронды қолтаңба ,ICC менDeviceN түс кеңістіктері,JavaScript | Acrobat 4.0 |
| 2001 | PDF 1.4 | JBIG2, мөлдірлік,OCR мәтіндік қабаты | Acrobat 5.0 |
| 2003 | PDF 1.5 | JPEG 2000, байланысқан мультимедиа, нысандық ағымдар, қиылысқан ағымдар, қабаттар | Acrobat 6.0 |
| 2005 | PDF 1.6 | енгізілген мультимедиа, 3D,XML-формалары,AES-шифрлеу | Acrobat 7.0 |
| 2006 | PDF 1.7 | | Acrobat 8.0 |
| 2008 | PDF 1.7,AEL3 | 256-битті кілтпенAES-шифрлеу | Acrobat 9.0 |
| 2009 | PDF 1.7,AEL5 | XFA 3.0 | Acrobat 9.1 |
- ↑PDF Reference sixth edition (PDF). Adobe Systems Incorporated (2006). Басты дереккөзіненмұрағатталған 1 қазан 2008. Тексерілді, 16 желтоқсан 2025.
- ↑Формат PDF стал международным стандартом —lenta.ru
- ↑ISO Ballot for PDF 1.7 Passed! — blogs.adobe.com (ағыл.)
- ↑ISO 32000-2 Portable document format – Part 2: PDF 2.0. PDF Association. Тексерілді, 16 желтоқсан 2025.
- ↑Как технология MRC уменьшает размер PDF-документов
- ↑Meuschke, Norman; Jagdale, Apurva; Spinde, Timo; Mitrović, Jelena; Gipp, Bela (2023-03-10)."A Benchmark of PDF Information Extraction Tools Using a Multi-task and Multi-domain Evaluation Framework for Academic Documents".Information for a Better World: Normality, Virtuality, Physicality, Inclusivity (Springer Nature Switzerland)13972: 383–405. arXiv:2303.09957.doi:10.1007/978-3-031-28032-0_31.ISBN:978-3-031-28031-3