Сравнение PDF-файлов — Авиационные и компьютерные заметки
Существует множество программ для сравнения текстовых файлов типа TXT, DOC и т.п. Такие программы могут легко сравнить два файла и отобразить в отчете все различия: что было удалено, что было добавлено, а что не было отредактировано и осталось без изменения.
Программами для сравнения файлов часто пользуются программисты, составители различных инструкций, ТЗ и др. документации, которым приходится периодически сравнивать между собой различные версии одного документа или файла.
Но иногда может возникнуть необходимость сравнить PDF-файлы и определить различия, имеющиеся между ними. Вот тут у многих могут возникнуть трудности. Формат файлов Adobe Acrobat — PDF — весьма специфичен и обычные программы сравнения текста с ним уже не могут справиться.
Самый реальный, но не очень простой вариант сравнения PDF-файлов долгое время был следующим: PDF-документы распознавались с помощью программы типа
Мы ждали этого долго, и вот, наконец-то фирма Adobe сжалилась над своими клиентами и реализовала механизм сравнения PDF-файлов в свою программу Adobe Acrobat Professional. На счет 7-ой и 8-ой версий нет информации, но как минимум Acrobat PRO 9
Как сравнить 2 PDF-файла?
С помощью программы Adobe Acrobat Professional сравнить два PDF очень просто:
1. Запустить программу Adobe Acrobat Pro
2. В меню программы выбрать: Просмотр -> Сравнить документы…:
Откроется панель сравнения документов:
Здесь можно настроить диапазон сравнения файлов (указать требуемые страницы документов) и выбрать тип (описание) документа.
3. Выбрать 2 файла, которые необходимо сравнить между собой:
В данном примере сравниваются 2 версии списка воздушных трасс. Параметры файлов указаны ниже (см. п.5).
4. Нажать кнопку «ОК» и ждать окончания процедуры сравнения файлов. Время сравнения прямо пропорционально зависит от количества страниц в документах. Ход сравнения отображается в нижнем правом углу программы:
Процедура сравнения подходит к завершению:
5. В итоге программа Acrobat Pro создает новый документ, на первой страницы которого отображается отчет и легенда:
6. Непосредственно в файле отображаются различия документов:
Таким образом можно легко проанализировать изменения в новом PDF-файле относительно старого.
Примечание 1: данный метод сравнения работает только для незащищенных PDF-файлов. Зашифрованные файлы, заблокированные от редактирования пользователями сравнить не получится. Нужно сначала деактивировать защиту этих файлов и только потом выполнять сравнение документов. Удаление защиты с PDF-файлов можно выполнить, например, с помощью утилиты
Примечание 2: этот способ также можно использовать для сравнения любых нормативных документов в любом формате, презентации PowerPoint или любого другого файла. Для этого просто преобразуйте их в формат PDF. Затем, для быстрого поиска изменений, используйте инструмент для сравнения файлов, описанный выше. Acrobat PRO представляет подробный отчет о каждом изменении, включая изменения текста, шрифта, изображения и даже порядка презентации страниц.
Сравнение файлов — сравнить тексты, PDF и Word документы
ABBYY- Контакты
- Интернет-магазин
-
Выберите регион
Global
Global Web Site EnglishNorth America
Canada English Mexico Español United States EnglishSouth America
Brazil Português South America EspañolEurope
France Français Germany Deutsch Italy Italiano United Kingdom English Spain Español Western Europe English Central and Eastern Europe English Croatia Hrvatski Czech Republic Čeština Hungary Magyar Poland Polski Romania Română Russia Русский Slovakia Slovenčina Ukraine УкраїнськаAfrica and Asia
China 中文 India and SEA Countries English Israel עברית
Как сравнить два документа
ABBYY- Contacts
- Select Region
Global
Global Web Site EnglishNorth America
Canada English Mexico Español United States EnglishSouth America
Brazil Português South America EspañolEurope
France Français Germany Deutsch Italy Italiano United Kingdom English Spain Español Western Europe English Central and Eastern Europe English Croatia Hrvatski Czech Republic Čeština Hungary Magyar Poland Polski Romania Română Russia Русский Slovakia Slovenčina Ukraine УкраїнськаAfrica and Asia
China 中文 India and SEA Countries English Israel עברית Japan 日本語 Middle East English South Korea 한국어 Turkey TürkçeAustralia
Australia English -
Submit
- Products
Сравнение документов PDF и Word
Сравнение документов PDF и WordДокумент PDF можно сравнить с документом Word. Типичный сценарий имеет место, если из документа Word был создан PDF-файл, после чего документ был изменен, и теперь нужно найти эти различия.
PDF-файл передается в программу Convert Assistant для преобразования в документ Word. Сравнение двух документов выполняется в Word, что позволяет выполнить визуальное или текстовое сравнение с результатом, отображаемым во временном файле, который при желании можно сохранить.
Процедура сравнения документов
-
Выберите пункты «Домой» > «Обработка» > Сравнение документов. Откроется диалоговое окно «Сравнение документов».
-
Примите открытый в данный момент документ PDF в качестве более старого или нажмите кнопку Обзор, чтобы выбрать более новый файл в диалоговом окне «Открыть». В поле Редакция выберите любую из доступных редакций документа.
-
Нажмите кнопку Обзор и выберите в качестве типа файла документ Word (DOC или DOCX), а затем выберите нужный документ Word в диалоговом окне «Открыть».
-
Выберите тип отчета для представления результата сравнения: Рядом или Совмещено (см. описание ниже).
-
Нажмите кнопку ОК. Подтвердите преобразование из формата PDF и нажмите кнопку Преобразовать все в программе PDF Converter Assistant. Копия исходного PDF-файла, доступная только для чтения, будет отображена в Microsoft Word с расширением PDF.
-
При необходимости подтвердите преобразование файла из формата RTF в файл Word.
Отчет «Рядом». Синхронно прокручивайте оба документа, визуально проверяя различия, если таковые имеются.
Совмещенный отчет В режиме отслеживания изменений Word создается и отображается объединенный временный документ с выделенными визуальными и текстовыми изменениями. Изменение форматирования текста не считается различием.
Примечания
Можно также указать в качестве более старого файла документ Word, а нового — файл PDF.
Для этого типа сравнения параметры в средней части диалогового окна недоступны.
Сравнение частей документов
PDF-файл может содержать больше материала, чем документ Word. Разделите его, чтобы выделить только ту часть, которую нужно сравнить.
Сравнение специальных атрибутов
При визуальном сравнении особые атрибуты в документах PDF, например примечания, подсветка, пометки, водяные знаки, подписи и т. д., считаются «обычными» графическими объектами и учитываются при сравнении.
При текстовом сравнении текст в блоках, колонтитулах или штампах документов PDF считается «обычным» текстом, а текст примечаний исключается из сравнения.
Примечание
Можно также сравнить два документа PDF.
Сравнение двух PDF файлов | Hi-tech в работе юриста
Активное использование в работе pdf файлов может вызывать потребность в их сравнении. С учетом того, что внести изменения в них, как уже отмечалось ранее, не представляет особого труда.
Сегодня я хотел бы остановиться на таком техническом средстве, которое позволяет осуществить сравнение двух pdf файлов.
Программа, которая позволяет выполнить эту задачу — Acrobat XI Pro.
Данная программа позволяет сравнивать не только простые текстовые документы, а также позволяет сравнивать презентации, созданные в программе PowerPoint (преобразованного в pdf файл ).
Acrobat XI Pro может обнаружить изменения в версиях файла, даже если эти изменения коснулись одного слова. Проверять каждую строку документа больше не нужно.
После завершения процесса сравнения двух файлов Acrobat XI представляет подробный отчет о каждом изменении, включая изменения текста, шрифта, изображения и даже порядка презентации страниц.
Для того, чтобы осуществить сравнение двух версий файла PDF, необходимо:
- В Acrobat XI выберите «Просмотр» > «Сравнить документы».
- Выберите два файла PDF для сравнения и нажмите OK.
- Просмотреть отображаемые различия с помощью страницы обзора главного рабочего пространства или миниатюр документов окна сравнения.
Acrobat XI Pro распространяется в нашей стране с условно-бесплатной лицензией, при скачивании программы с официального сайта необходимо учитывать, что ее размер составляет 501 МВ.
Для осуществления скачивания, на сайте Вам будет предложена небольшая анкета – регистрация.
Метки: pdf для юриста, Работа с pdf, Сравнение pdf файлов
Запись опубликована 12.11.2012 в 4:58 пп и размещена в рубрике Без рубрики. Вы можете следить за обсуждением этой записи с помощью ленты RSS 2.0. Можно оставить комментарий или сделать обратную ссылку с вашего сайта.
DiffPDF
Сравнение двух файлов формата PDF.
comparepdf — маленькая консольная утилита, предназначенная для сравнения двух файлов формата PDF (Portable Document Format).
comparepdf проводит текстовое сравнение двух PDF файлов (режим «по умолчанию») а так же визуальное (обнаружение изменений разметки, изображений, шрифтов и пр…). Утилита может оказаться полезной в системах автоматического тестирования. Если необходимо графическое приложение для просмотра различий, то авторы проекта рекомендуют использовать DiffPDF.
DiffPDF — простое C++ / Qt графическое приложение показывающее подробности различий между двумя PDF-документами.
DiffPDF имеет простой, частично настраиваемый (перемещаемые и удаляемые панели инструментов), пользовательский интерфейс и минимум настроек. Для сравнения PDF-документов могут использоваться три режима сравнения: текстовой, символьный и визуальный.
DiffPDF ищет не просто различия в текстах или диаграммах, но и различия на уровне форматирования PDF-документов. По умолчанию в каждой паре страниц сравнивается текст, но есть возможность сравнивать и внешний вид (например изменение вставленной диаграммы, или стиля абзаца).
Так же DiffPDF может сравнивать определённые страницы, или страницы в определённых диапазонах. Например, если в первой версии файла имеются страницы от 1 до 12, а во второй от 1 до 13 (была вставлена дополнительная страница 4), эти версии можно сравнить. Указав в таком случае для первого документа диапазон 1 — 12, а для второго 1 — 3 и 5 — 13, таким образом будет выполнено сравнение страниц в следующих парах: 1/1, 2/2, 3:3, 4/5 и так далее до 12/13.
DiffPDF работает быстро, результаты сравнения страниц документов в могут быть просмотрены визуально, а так же может быть просмотрен и скопирован в буфер обмена лог сравнения (для последующего сохранения в текстовом файле).
DiffPDF не является графическим интерфейсом (GUI) к консольной утилите comparepdf, это самостоятельное приложение хоть и в нём используются наработки проекта comparepdf, поддержку PDF обеспечивает библиотека Poppler. Так же автором, в рамках проекта Qtrac Ltd, разработан ViewPDF (приложение для просмотра PDF документов, с проверкой орфографии).
Лицензия: GNU General Public License v 2
Домашняя страница
Инструмент для сравнения большого количества файлов PDF?
Мне нужно сравнить большое количество файлов PDF для его оптического содержимого. Поскольку файлы PDF были созданы на разных платформах и с разными версиями программного обеспечения, существуют структурные различия. Например:
- фрагментация текста может быть разной
- порядок записи может быть разным
- позиция может отличаться несколькими пикселями
Он должен сравнивать содержание как бы человеческого народа, а не внутреннюю структуру. Я хочу проверить регрессии между различными версиями генератора PDF, который мы использовали.
testing pdf compare Поделиться Источник Horcrux7 28 сентября 2008 в 11:0210 Ответов
39
Потому что нет такого инструмента в наличии, что мы написали один. Вы можете скачать i-net PDF content comparer и использовать его. Я надеюсь, что помогу другим с той же проблемой. Если у вас есть проблемы с ним или у вас есть обратная связь для нас, то вы можете связаться с нашей службой поддержки.
Поделиться Horcrux7 16 февраля 2010 в 08:34
19
На самом деле существует инструмент diffpdf.
http://www.qtrac.eu/diffpdf.html
Его слабость заключается в том, что он плохо реагирует, когда дополнения заставляют новый текст частично переместиться на новую страницу. Например, если старая страница 4 должна быть сопоставлена с концом страницы 5 и началом страницы 6, вам нужно будет изменить параметры, чтобы сравнить два среза отдельно.
Поделиться jabial 03 мая 2011 в 11:49
12
Я использовал домашний сценарий, который
- преобразует все страницы на двух PDFs в растровые изображения
- цвета страниц от PDF 1 до red-on-white
- меняет белый цвет на прозрачный на страницах PDF 2
- накладывает каждую страницу из PDF 2 поверх соответствующей страницы из PDF 1
- выполняет преобразование / раскраску и наложение параллельно на нескольких ядрах
Используемое программное обеспечение:
- GhostScript для PDF-to-bitmap преобразования
- ImageMagick для окраски, прозрачности и наложения
- inotify для синхронизации параллельных процессов
- любой PNG-способный просмотрщик изображений для просмотра результата
Плюсы:
- простая реализация
- все используемые инструменты имеют открытый исходный код
- отлично подходит для поиска небольших различий в компоновке
Аферы:
- преобразование происходит медленно
- основные различия между PDFs (например, разбиение на страницы) приводят к беспорядку
- растровые изображения не масштабируются
- хорошо работает только для black-and-white текста и диаграмм
- нет easy-to-use GUI
Я искал инструмент, который бы делал то же самое на уровне PDF/PostScript.
Вот как наш скрипт вызывает утилиты (обратите внимание, что ImageMagick использует GhostScript за кулисами для преобразования PDF — >PNG):
$ convert -density 150x150 -fill red -opaque black +antialias 1.pdf back%02d.png
$ convert -density 150x150 -transparent white +antialias 2.pdf front%02d.png
$ composite front01.png back01.png result01.png # do this for all pairs of images
Поделиться akaihola 10 февраля 2010 в 08:59
Поделиться sdaau 08 мая 2011 в 06:36
8
Мы также использовали pdftotext (см. ответ Sklivvz) для создания ASCII версий PDFs и wdiff для их сравнения.
Используйте переключатель pdftotext -layout
, чтобы улучшить читаемость и получить некоторое представление об изменениях в макете.
Чтобы получить хороший цветной вывод из wdiff, используйте этот скрипт-оболочку:
#!/bin/sh
RED=$'\e'"[1;31m"
GREEN=$'\e'"[1;32m"
RESET=$'\e'"[0m"
wdiff -w$RED -x$RESET -y$GREEN -z$RESET -n $1 $2
Поделиться akaihola 10 февраля 2010 в 09:08
4
Я думаю, что ваш лучший подход будет заключаться в преобразовании PDF в изображения с приличным разрешением, а не в сравнении изображений.
Для создания изображений из PDF вы можете использовать библиотеку Adobe PDF или решение, предложенное в лучшем случае для преобразования файлов pdf в файлы tiff .
Для сравнения сгенерированных TIFF файлов я нашел GNU tiffcmp (для windows части GnuWin32 tiff) и tiffinfo сделал хорошую работу. Используйте tiffcmp-l и подсчитайте количество строк вывода, чтобы найти любые различия. Если вы хотите иметь небольшое количество изменений содержимого (например, сглаживание различий), то используйте tiffinfo для подсчета общего количества пикселей, а затем вы можете создать процентное значение разницы.
Кстати, для тех, кто делает простое сравнение PDF, где структура не изменилась, можно использовать командную строку diff и игнорировать определенные шаблоны, например, с GNU diff 2.7:
diff --brief -I xap: -I xapMM: -I /CreationDate -I /BaseFont -I /ID --binary --text
Это все еще имеет проблему, что он не всегда улавливает изменения в созданных именах шрифтов.
Поделиться danio 29 сентября 2008 в 15:04
1
Наш продукт, компаратор PDF — http://www.premediasystems.com/pdfc.html » — сделает это довольно элегантно и эффективно. Это также не бесплатно,и это приложение только для Mac OS X.
Поделиться Peter Truskier 03 августа 2010 в 00:09
1
Исходя из ваших потребностей, преобразование в текстовое решение будет самым простым и непосредственным. Я действительно думал, что идея bitmap была довольно крутой.
Поделиться user602475 04 февраля 2011 в 00:52
0
программное обеспечение blubeam pdf сделает это за вас
Поделиться M Jenkins 23 марта 2010 в 13:55
0
Вы можете пакетно сравнить pdf файлов с Tarkware Pdf Comparer. Но это не бесплатно и требует Adobe Acrobat.
Поделиться erks 28 марта 2010 в 21:13
Похожие вопросы:
Контент-мудрый, а не постраничный pdf библиотека сравнения
Я ищу библиотеку, которую я могу использовать в приложении C# windows для сравнения файлов PDF. Есть много инструментов, которые я видел для выполнения сравнения страниц pdf (например,…
Инструмент для сравнения web.config файлов
Есть ли хороший инструмент для сравнения конкретно web.config файлов, чтобы найти конкретно, какие настройки имеют разные значения и какой файл имеет настройки, которые не отображаются в обоих. XML…
Лучший инструмент для проверки файлов PDF?
Какой инструмент вы рекомендуете для проверки файлов PDF? Пример использования: я пытаюсь программно создать PDF файлов (используя iText). У меня есть проблемы с достижением определенных макетов, но…
Автоматизировать Acrobat Инструмент Сравнения Файлов
Я пытаюсь определить, можно ли запустить инструмент сравнения файлов Acrobat DC с PDFs указанным, либо через API, либо через JavaScript. Любая помощь была бы очень признательна.
Django хранилище файловой системы для большого количества файлов
Сценарий: Приложение Django генерирует множество небольших файлов, связанных с объектами в разных моделях. Я много искал, чтобы избежать генерации большого количества файлов в одном каталоге при…
iText API для сравнения PDF
Могу ли я использовать iText API для сравнения двух файлов PDF? Я прошел через различные подходы на StackOverflow для сравнения файлов PDF, такие как инструменты, некоторые утилиты, такие как…
Xcode Инструмент Сравнения Проектов
Я столкнулся с проблемой, по отслеживанию изменений, внесенных другими разработчиками. Примечание: SVN не используется по некоторым причинам. Итак, есть ли лучший способ, кроме сравнения отдельных…
Инструмент для сравнения файлов в Visual Studio 2010
Я читал этот инструмент для сравнения файлов в Visual Studio post и рекомендуемые сообщения, но непростительно, что это только для VS-2008. Мне интересно, есть ли рабочий инструмент для сравнения…
Java содержимое APIs для большого количества файлов
Кто-нибудь знает какие-либо библиотеки java (с открытым исходным кодом), которые предоставляют функции для обработки большого количества файлов (write/read) с диска. Я говорю о 2-4 миллионах файлов…
Как сравнить два файла pdf?
Возможный Дубликат : Инструмент для сравнения большого количества файлов PDF? Я сгенерировал два файла pdf 1.MNTR305K.PRT.pdf (1862 страницы) из 2760 KB 2.MNTR305K.PRT.pdf (1862 страницы) из 7345 KB…