Jak zmniejszyć rozmiar pliku PDF bez utraty jakości
PDF-y rosną z przewidywalnych powodów: zeskanowane obrazy, osadzone czcionki, pozostałości historii rewizji i bitmapowe eksporty grafiki wektorowej. Jeśli rozumiesz, co naprawdę jest w środku pliku, najczęściej tniesz jego rozmiar o 60–90% bez widocznej straty jakości. Oto praktyczna wersja, jak to zrobić.

Dlaczego PDF-y są duże
PDF to kontener. W środku może mieć tekst, grafikę wektorową, osadzone obrazy rastrowe, czcionki, pola formularza, załączniki, metadane stron i historię rewizji. Końcowy rozmiar pliku to suma tych części plus mała narzutka na strukturę. To oczywiste, ale kluczowe dla mądrej kompresji — zamiast przepuszczać każdy PDF przez ten sam ogólny przycisk „kompresuj", pytasz „co waży w tym konkretnym pliku?" i atakujesz tylko tę część.
W większości plików odpowiedź to jedna z trzech rzeczy. Po pierwsze: rastrowe obrazy zapisane w rozdzielczości druku (300 DPI), gdy PDF będzie czytany tylko na ekranie. Po drugie: skany, gdzie cała strona to jeden duży obraz, choć wizualnie wygląda jak tekst. Po trzecie: czcionki osadzone w całości zamiast podzbiorów ograniczonych do glifów rzeczywiście używanych w dokumencie. Trzy te przyczyny pokrywają niemal każdy realny przypadek.
Kompresja obrazów — największy zysk
Jeśli Twój PDF został wyeksportowany z Worda, Pages, Keynote, Google Docs lub LaTeXa z fotografiami z telefonu, obrazy w środku prawie na pewno ważą więcej niż trzeba. Foto z nowoczesnego telefonu to ~4000 × 3000 px i 5–8 MB skompresowane. Autor wrzuca to do dokumentu, zmienia rozmiar wizualny do 4 cm szerokości — ale w pliku wciąż siedzi oryginalne JPEG 4000 px. Pomnóż przez 12 takich obrazów i masz 70 MB raport, który wizualnie nie różni się od wersji 4 MB.
Rozwiązaniem jest downsampling obrazów do rozdzielczości pasującej do ich rozmiaru na stronie. Reguła kciuka: 150 DPI to świetna jakość dla wszystkiego co czyta się na ekranie, 200 DPI to dobry uniwersalny cel jeśli dokument bywa drukowany, 300 DPI to wyłącznie wysokojakościowy druk i prawie nigdy nie jest potrzebne na co dzień.
Skany — inny problem
Zeskanowane PDF-y to specjalny przypadek, bo to nie są PDF-y tekstu — to PDF-y zdjęć tekstu. Każda strona to jeden duży obraz rastrowy. Skutki są dwa: plik jest ogromny (jedna strona A4 w 300 DPI w kolorze to ~5 MB), a tekstu nie da się przeszukać ani skopiować. Trzy sensowne strategie kompresji skanów:
Obniż rozdzielczość
Większość skanów robi się w 300 DPI domyślnie, ale na ekranie 200 lub 150 DPI czyta się idealnie. Re-render w 200 DPI typowo połowi rozmiar bez widocznej straty.
Skala szarości lub czerń-biel
Jeśli oryginał to czarny atrament na białym papierze, zapisywanie w 24-bitowym kolorze jest marnotrawstwem. Konwersja do 8-bit szarości połowi rozmiar dwukrotnie. Dla czystego tekstu 1-bit czerń-biel skraca dziesięciokrotnie.
OCR + zachowanie obrazu
Narzędzia jak Tesseract lub komercyjne silniki OCR tworzą „PDF z możliwością wyszukiwania" — rozpoznany tekst jest niewidocznie nakładany na skan. Plik staje się przeszukiwalny, a obraz pod spodem często można re-zakodować mniejszy.
Limity rozmiaru maila
W większości przypadków pytanie „jak zmniejszyć ten PDF" znaczy w rzeczywistości „jak zmieścić go pod limitem załącznika u dostawcy poczty". Przydatne liczby:
- Gmail: 25 MB wychodzące, 50 MB przychodzące. Powyżej 25 MB Gmail oferuje link Drive automatycznie.
- Outlook.com / Microsoft 365: 33 MB domyślnie, czasem obniżone do 20 MB przez administratorów firmy.
- WP / Onet / Interia: zwykle 25 MB.
- Bramki firmowe: często 10 MB. Jeśli nie znasz limitu odbiorcy, 10 MB to bezpieczny cel.
Jeśli pojedynczy PDF jest za duży nawet po kompresji, podzielenie na kilka plików i wysłanie w dwóch wiadomościach to prawie zawsze lepsze doświadczenie niż wgrywanie do serwisu udostępniania. Nasze narzędzie do dzielenia PDF wycina konkretne zakresy stron w jednym kroku.
Czego nie kompresować
Niektóre PDF-y nie powinny być przerabiane mimo dużego rozmiaru. Dwie ważne kategorie: dokumenty z podpisem cyfrowym (podpis jest hashem bajtów pliku — przy ponownym zapisie staje się nieważny) oraz dokumenty prawne lub audytowe (niektóre regulowane workflow wymagają zachowania dokładnych bajtów pliku).
Krótkie podsumowanie
- Zidentyfikuj co waży: zdjęcia, czcionki czy skan.
- Jeśli zdjęcia: downsample do 150–200 DPI, koduj jako JPEG.
- Jeśli czcionki: użyj podzbiorów, nie osadzaj pełnych plików.
- Jeśli skan: obniż rozdzielczość, w razie możliwości usuń kolor, opcjonalnie OCR.
- Zapisz „save as optimized" żeby usunąć balast.
- Jeśli wciąż za duży — rozdziel zamiast dalej obniżać jakość.
Pełną wersję angielską z dokładnymi zasadami nazewnictwa i case studies znajdziesz w English version.