Сегодня встала задача очистить PDF файл от скрытых данных.
Никогда не нужно было, а тут вот, случилось.
И что же оказалось? Они, скрытые данные, там действительно есть. В моем случае файл был сгенерирован утилитой сканера. Дата и время генерации, программа в которой эта генерация была сделана и марка сканера присутствовали в файле. Это бы ничего, но там же был скрыт текст отсканированного документа! Значит утилита сканера подпольно распознала изображение и скрыто сохранила данные в файле. Если бы я хотел задаться целью получить информацию о всем что отсканировано и лежит в компьютере я бы, теоретически, мог запросто сделать это. Искать по ключевым словам, просто выкачивать тексты и упаковывая отсылать себе и тд.
Расскажу как очистить файл от закладок. Как почистил я.
Воспользовался Adobe Acrobat Pro XI.
Не с ходу но нашел кнопку очистки. Не исключаю вероятность что доступ к этой функции лежит и ближе, просто пользуюсь программой раз в полгода и то чтоб удалить или вставить страницу в документ.
Шаги:
Щелкаем правой кнопкой мыши по панели инструментов.
И выбираем что указано.
Переходим в защиту и выбирает что указано
Возвращаемся в главное меню, нажав "сохранить" внизу этого окошка.
Жмем на кнопочку появившуюся в панели инструментов
Не забудьте сохранить очищенный файл.
Спасибо за внимание)
Молодец! Познавательно! Я такого,лично, не знал!)
Почему бы было просто не сканировать в JPEG?
Потому что заказчику нужен именно этот ,"родной" многостраничный PDF.
Можно было и так подойти, конвертировать все страницы в JPG, а потом снова собрать из них PDF или распечатать этот PDF на PDF принтере, но при этом нет уверенности что конвертер или принтер туда тоже чего то скрытого не напихает.
Мне кажется что предложенный мной метод оптимален.