Как-то передо мной встала необходимость скопировать текст из
файла PDF (Adobe Acrobat), который был защищен от копирования. Ничего
шпионского или криминального - просто некий текст религиозной тематики,
который, по мнению служителей культа, не должен быть искажен мирянами.
А мне надо было сделать из данного текста веб-страницу...
1. FineReader
Первый способ, который пришел мне в голову, это распознавание текста
программой ФайнРидер (FineReader).
Программа FineReader также не хочет работать с файла PDF,
которые защищены паролем. Выход - наделать скрин-шотов (снимков экрана
в режиме просмотра документа в Adobe Acrobat Reader),
т.е. создать кучу графических файлов, а потом их распознать программой
ФайнРидер (FineReader) и сохранить либо
как DOC, HTML и т.д.
Для этого в программе Adobe Acrobat Reader жмем кнопочку
PrintScreen (PrtScr) на каждой просматриваемой
странице нашего документа, потом в программе Photoshop
сохраняем каждый такой снимок (скриншот) экрана в виде графического файла
(GIF / JPG / PNG). Эти графические файлы скармливаем
ФайнРидер-у и всё.
Но этот путь слишком сложен, хоть и абсолютно честен :) Честнее только
руками с клавиатуры перенабрать нужный текст...
2. Он-лайн сервис PDFpirate
Для
этого нам потребуется наш закрытый PDF-файл и доступ
в Internet.
Заходим на сайт PDFpirate[точка]org, нажимаем там на ссылочку "Снять
ограничения", далее появляется диалог загрузки туда
нашего закрытого PDF-файла - загружаем.
Появляется надпись - "Пожалуйста, подождите! Ваш файл обрабатывается..."
Ждем.
Через некоторое время видим сообщение - "Готово! Теперь
Вы можете скачать разблокированный или разблокировать другой
файл."
Скачиваем разблокированный PDF-файл, на всякий случай
проверяем его на возможные ошибки и наслаждаемся результатом.
Не знаю, насколько долго проживет данный сайт или как долго этот серсис
будет бесплатным.
Внимание: данный текст НЕ является рекламой вышеупомянутого сайта,
равно как и не содержит на него активную ссылку. Соблюдайте авторские
права владельцев информации.