Na první pohled je PDF dokument praktický soubor, který se používá v kancelářích, školách, u úřadů i při posílání životopisů. Otevírá se všude stejně, nepřesouvají se v něm řádky jako ve Wordu, a navíc působí profesionálně. Jenže má i svou temnější stránku: dokáže nést více informací, než si uvědomujeme. Když totiž PDF vytvoříte nebo upravíte, nezůstane to bez digitální stopy. A právě tyto stopy mohou někdy říct víc než samotný text.
Když metadata mluví
Každý PDF dokument má tzv. metadata – skryté informace, které popisují, kdy a kde byl soubor vytvořen, kým, v jakém programu a kolikrát byl upraven. U některých typů dokumentů můžete najít i jméno autora (např. uživatelské jméno počítače), název firmy, verzi softwaru nebo dokonce čas poslední editace až na sekundy přesně. Proč je to problém? Představte si, že posíláte anonymní připomínku, citlivý dokument do médií, nebo životopis. A někdo v metadatech najde vaše celé jméno, název počítače, e-mail nebo oddělení, ve kterém pracujete. Co měla být anonymita, se rázem rozpadá.
Skryté vrstvy a nechtěné zbytky
PDF není jen „plochý“ text. Často v něm zůstávají i skryté vrstvy, které tam autor zapomněl. Například předchozí verze dokumentu, komentáře, interní poznámky nebo přeškrtnuté pasáže, které si příjemce dokáže zpětně zobrazit. Jedním z nejznámějších případů byl unik státního dokumentu, kde autoři zamazali části textu černou barvou – ale neuložili PDF správně. Příjemci pak stačilo označit „černý pruh“ a smazat ho. Pod ním se ukázal původní text v celé kráse.
OCR a hledání ve zdánlivě „nečitelném“
Pokud naskenujete papírový dokument jako obrázek do PDF, možná si myslíte, že ho nelze prohledávat. Jenže moderní nástroje umí automaticky spustit OCR (optické rozpoznávání znaků) – a text je rázem čitelný. Tedy i dohledatelný.
Co s tím?
Dobrá zpráva je, že se proti PDF můžete chránit. Existují nástroje pro čištění metadat, např. ve Wordu při exportu do PDF můžete metadata vypnout. Adobe Acrobat má funkci „Sanitize Document“, která soubor „očistí“ od citlivých informací. Existují i bezplatné nástroje jako PDF Redact Tools nebo ExifCleaner. Také se vyplatí exportovat přes tisk do PDF (virtuální tiskárna), protože tím často vzniká „čistý“ soubor bez původních vrstev a poznámek.
V digitální době nestačí jen smazat citlivou větu, musíte se naučit smazat i digitální stopy kolem ní.
Čtěte také
Přečtěte si i ostatní články z blogu.