Преобразование документов — АГБ ~ Агентство гарантий

PDF/A-1a)
Описание
Часть 1 стандарта PDF / A ISO [ISO 19005-1: 2005] представляет собой ограниченную форму Adobe PDF версии 1.4, предназначенную для долгосрочного сохранения ориентированных на страницы документов, для которых PDF уже используется на практике. Соответствие уровню а (PDF/A-1a) означает полное соответствие требованиям стандарта ISO 19005-1, в том числе связанным со структурными и семантическими свойствами документов. Соответствие уровню B (PDF/A-1b) указывает на минимальное соответствие, гарантирующее сохранение визуализированного визуального вида соответствующего файла в течение длительного времени.

Если пришло PDF без встроенных текстов:

Конвертировать в PDF —  в формат с распознанным текстом Документ не соответствует стандарту PDF 1.5.

Распознать текст —  в формат с распознанным текстом Документ соответствует стандарту PDF 1.5.

Конвертировать в формат в PDF/A-1a

Конвертировать в формат в PDF/A-2a

Валидатор  проверяем на соответствие стандарту PDF/A-1a

Распознать

Еще валидатор

Валидаторы и программы ассоциации развития хранения цифровых данных

Стандарт PDF/A-2 определяет три уровня соответствия: уровень соответствия «a» удовлетворяет всем требованиям спецификации; уровень «b» является более низким уровнем соответствия, «охватывающим требования этой части ISO 19005 относительно визуального появления электронных документов, но не их структурных или семантических свойств»20. Для PDF/A-2 был введен промежуточный уровень соответствия — уровень «u», который представляет соответствие уровня «b» с дополнительным требованием, заключающимся в том, чтобы весь текст в документе имел эквиваленты Unicode21.

Основное различие между PDF/A-1 и PDF/A-2 заключалось в использовании более поздней версии PDF. Добавленные возможности соответствуют требованиям ISO 32000-122 и включают:

— улучшения базового формата PDF (повышение его доступности),

— сжатый объект и потоки XRef23, (для меньших размеров файлов),

— поддержку встраивания вложенных файлов в формате PDF/A, переносимых коллекций и пакетов PDF,

— поддержку прозрачности изображений,

— поддержку сжатия JPEG 2000 для изображений24.

Формат PDF/A-3 стандартизирован ISO 19005-3:2012 «Document management — Electronic document file format for long-term preservation — Part 3: Use of ISO 32000-1 with support for embedded files»25 и актуализирован в 2018 году.

PDF/A-3 добавляет единственную и очень важную функцию к предшественнику PDF/A-2. Если PDF/A-2 допускал вложение других файлов, пока вложенные файлы были действительными файлами PDF/A, то PDF/A-3 позволяет встраивать файлы любого формата (включая XML, CSV, CAD, изображения, бинарные исполняемые файлы и т. д.) в единый файл PDF/A. Эта новая функция предназначена для расширения функциональности PDF/A от формата зафиксированного «бумажного документа» (пусть и подходящего для использования в долгосрочной перспективе) до полноценного архивного формата, ориентированного на хранение электронного документа в неизменном виде, который может иметь и поддерживать связанные с ним файлы и электронную подпись.

Как и в PDF/A-2, стандарт PDF/A-3 определяет три уровня соответствия: уровень соответствия «a» удовлетворяет всем требованиям стандарта; уровень «b» является более низким уровнем соответствия, удовлетворяющим требованиям, которые должны быть минимально необходимы для обеспечения того, чтобы визуальный внешний вид соответствующего файла сохранялся в течение длительного времени. При этом в стандарте отмечается, что файлы, соответствующие стандартам уровня «b», могут не иметь «достаточно богатой внутренней информации, чтобы обеспечить сохранение логической структуры документа и текстового контента в естественном порядке чтения»26, что обеспечивается соответствием более высокому уровню «a». Промежуточный уровень соответствия, уровень «u» способен соответствовать всем дополнительным требованиям.

PDF/A-3 позволяет встраивать файлы любого типа, но накладывает требования, отличные от обычных, определенных в ISO 32000-127 для PDF 1.7. Согласно положениям стандарта файлы, соответствующие этим требованиям, называются «связанными» файлами. Для их создания и поддержания должна быть сделана явная связь между каждым встроенным файлом, содержащим PDF-документ, объектом или его структурой (например, изображение, страница или логический раздел) в PDF-файле. Для связанных файлов должны быть предусмотрены типы MIME28. Однако PDF/A-3 требует использования специальных приложений, если тип MIME неизвестен.

Преобразование документов