Dostępny PDF to dokument, który można odczytać nie tylko wzrokiem na ekranie, ale także za pomocą technologii wspomagających, wyszukiwarki w dokumencie, kopiowania tekstu i logicznej nawigacji po treści. Nie każdy plik z rozszerzeniem PDF spełnia te warunki. Dwa dokumenty mogą wyglądać podobnie dla osoby widzącej, ale pod spodem działać zupełnie inaczej. Jeden będzie tekstem z nagłówkami, listami, opisami i prawidłową kolejnością odczytu. Drugi będzie tylko obrazem strony, czyli skanem, którego czytnik ekranu nie rozumie.
Najprostsza różnica jest taka: w dostępnym PDF-ie tekst można zaznaczyć, skopiować i wyszukać. Jeśli użytkownik otwiera dokument i może znaleźć nazwisko, datę, paragraf albo numer telefonu przez wyszukiwarkę, to dobry znak. Jeśli nie da się zaznaczyć pojedynczych słów, a kliknięcie obejmuje całą stronę jak zdjęcie, najprawdopodobniej mamy do czynienia ze skanem. Taki plik może wyglądać oficjalnie, ale dla wielu osób jest praktycznie zamknięty.
Samo zaznaczanie tekstu nie wystarcza jednak, żeby PDF był dostępny. Dokument może zawierać tekst rozpoznany przez OCR, ale nadal nie mieć struktury. Osoba korzystająca z czytnika ekranu potrzebuje czegoś więcej niż ciągu znaków. Potrzebuje informacji, które elementy są nagłówkami, które są akapitami, które tworzą listę, gdzie zaczyna się tabela, jaki jest sens linku i w jakiej kolejności treść powinna być odczytana. To właśnie dlatego w dostępnych PDF-ach tak ważne są tagi.
Tagi PDF można porównać do ukrytej struktury dokumentu. Dla osoby patrzącej na stronę nagłówek jest większy, pogrubiony albo oddzielony odstępem. Dla czytnika ekranu sam wygląd nie wystarcza. Dokument musi zawierać informację, że dany fragment jest nagłówkiem, a nie zwykłym tekstem powiększonym ręcznie. Podobnie jest z listami, tabelami, przypisami, obrazami i linkami. Tagi pozwalają technologiom wspomagającym zrozumieć, jak zbudowany jest dokument.
Nagłówki w PDF-ie powinny odzwierciedlać rzeczywisty porządek treści. Tytuł dokumentu, rozdziały, podrozdziały i sekcje muszą tworzyć logiczną hierarchię. Jeśli regulamin ma część o zasadach udziału, płatnościach, rezygnacji i kontakcie, każda z tych części powinna być możliwa do odnalezienia. Użytkownik nie powinien być zmuszony do słuchania całego dokumentu od początku, żeby dotrzeć do jednej informacji. Dobrze przygotowane nagłówki działają jak spis orientacyjny.
Tabele są jednym z trudniejszych elementów. W dokumencie wizualnie prosta tabela może być dla czytnika ekranu niezrozumiała, jeśli nie ma oznaczonych nagłówków kolumn i wierszy. Dotyczy to na przykład harmonogramów wydarzeń, cenników, zestawień projektów, budżetów, wyników naboru czy tabel z terminami. Użytkownik widzący szybko łączy komórkę z nagłówkiem. Użytkownik słuchający treści potrzebuje, żeby dokument przekazywał te relacje. W przeciwnym razie usłyszy ciąg danych bez kontekstu.
Kolejność odczytu jest równie ważna. PDF często powstaje z dokumentu złożonego wizualnie: dwie kolumny, ramki, podpisy, stopki, grafiki, tabele i wyróżnienia. Dla oka układ może być czytelny, bo widzimy całą stronę naraz. Czytnik ekranu odczytuje jednak elementy po kolei. Jeśli kolejność jest błędna, użytkownik może usłyszeć najpierw stopkę, potem fragment tabeli, później nagłówek, a dopiero na końcu początek akapitu. Taki dokument formalnie zawiera tekst, ale w praktyce jest trudny do zrozumienia.
Dostępny PDF powinien mieć także opisany język dokumentu. Czytnik ekranu musi wiedzieć, czy ma czytać po polsku, angielsku czy w innym języku. Jeśli język nie jest ustawiony, wymowa może być błędna i męcząca. W dokumentach dwujęzycznych warto oznaczać fragmenty w innym języku, zwłaszcza jeśli są dłuższe lub ważne dla zrozumienia treści.
Obrazy w PDF-ie również wymagają decyzji. Nie każdy obraz trzeba opisywać. Element dekoracyjny, który nie wnosi informacji, może zostać oznaczony jako artefakt, żeby czytnik ekranu go pominął. Jeśli jednak grafika niesie treść, potrzebuje tekstu alternatywnego. Logo instytucji w nagłówku dokumentu zwykle nie wymaga długiego opisu, ale wykres pokazujący wyniki ankiety już tak. Plakat wydarzenia umieszczony w PDF-ie jako obraz musi mieć tekstowy odpowiednik informacji: nazwę wydarzenia, datę, miejsce, godzinę, organizatora i sposób udziału.
Linki w dostępnym PDF-ie powinny być aktywne i opisowe. Sam adres URL wklejony do dokumentu bywa mniej wygodny niż link opisany treścią, zwłaszcza gdy jest długi i pełen parametrów. „Formularz zgłoszeniowy na warsztaty” mówi więcej niż ciąg znaków zaczynający się od https. Jednocześnie w dokumentach przeznaczonych do druku czasem warto pozostawić pełny adres w przypisie lub obok linku. To kwestia funkcji dokumentu, ale dla wersji cyfrowej najważniejsze jest, żeby link miał sens i dał się uruchomić.
Kiedy PDF nie powinien być PDF-em? Częściej, niż się wydaje. Jeśli treść jest krótką informacją o wydarzeniu, aktualnością, ogłoszeniem, instrukcją albo komunikatem, lepiej opublikować ją jako zwykłą podstronę. HTML jest zwykle łatwiejszy do dostosowania do telefonu, prostszy do aktualizacji i bardziej dostępny, jeśli strona jest dobrze zrobiona. PDF ma sens przy dokumentach, które mają określoną formę, są przeznaczone do pobrania, archiwizacji, druku albo podpisu. Regulaminy, raporty, formularze, publikacje i programy w wersji do pobrania mogą być PDF-ami, ale powinny być przygotowane świadomie.
Wiele problemów z dostępnością PDF-a powstaje jeszcze przed eksportem. Jeśli autor dokumentu w edytorze tekstu ręcznie powiększa tytuły, robi odstępy spacjami, układa tabelę tabulatorami, wkleja obraz z tekstem i nie korzysta ze stylów, późniejsza naprawa PDF-a będzie trudniejsza. Dostępność zaczyna się w pliku źródłowym. Trzeba używać stylów nagłówków, prawdziwych list, prawdziwych tabel, opisowych linków i tekstów alternatywnych. Eksport do PDF-a powinien zachować strukturę dokumentu, a nie spłaszczyć go do obrazu.
Z perspektywy redaktora najważniejsza decyzja brzmi: czy ten materiał naprawdę ma być PDF-em, a jeśli tak, czy został przygotowany z myślą o czytaniu cyfrowym. W instytucjach często PDF staje się domyślnym rozwiązaniem dla wszystkiego: programu zajęć, aktualności, plakatu, regulaminu, cennika i formularza. To wygodne dla osoby publikującej, ale nie zawsze wygodne dla odbiorcy. Na telefonie PDF może być uciążliwy, a skan bywa całkiem nieprzydatny.
Z perspektywy użytkownika dostępny PDF daje niezależność. Można go przeszukać, powiększyć, odsłuchać, skopiować fragment, przejść między nagłówkami, odczytać tabelę i skorzystać z linków. Dla osoby niewidomej to często różnica między samodzielnym dostępem do informacji a koniecznością proszenia kogoś o pomoc. Dla osoby pracującej szybko z dokumentami to oszczędność czasu. Dla instytucji to mniej maili z prośbą o wyjaśnienie tego, co powinno być dostępne od razu.
W Bearded Wolf temat dostępnych PDF-ów pojawia się często przy stronach instytucji, NGO i firm publikujących dokumenty dla klientów lub uczestników wydarzeń. Czasem wystarczy poprawić sposób przygotowywania nowych plików. Czasem trzeba przejrzeć najważniejsze dokumenty i zdecydować, które naprawić, które przenieść na stronę jako HTML, a które zostawić jako archiwalne z informacją o możliwości uzyskania dostępnej wersji.
Najrozsądniej zacząć od dokumentów, które mają największe znaczenie: regulaminów, formularzy, programów wydarzeń, deklaracji, cenników, instrukcji i materiałów wymaganych w projektach publicznych. Warto sprawdzić, czy tekst da się zaznaczyć, czy dokument ma strukturę, czy kolejność odczytu jest logiczna, czy linki są aktywne, a tabele zrozumiałe. Dostępny PDF nie jest ozdobą procesu publikacji. Jest dokumentem, który naprawdę można przeczytać i wykorzystać.
