PDF-Prüfer

Ist meine PDF gescannt oder durchsuchbar?

Für alle, die den Text nicht aus einer PDF kopieren können und wissen müssen, warum.

Lege eine PDF ab und finde sofort heraus, ob ihre Seiten echter, markierbarer Text oder nur gescannte Bilder sind. Die Prüfung läuft komplett in deinem Browser — die Datei wird nie hochgeladen.

So funktioniert die Prüfung

Was dieser PDF-Prüfer wirklich macht

01

PDF im Browser öffnen

Lege eine PDF auf das Feld oder wähle eine aus. Sie wird mit einem integrierten PDF-Reader direkt auf der Seite gelesen und nie an einen Server gesendet.

02

Die Textebene jeder Seite lesen

Der Prüfer sucht auf jeder Seite nach markierbarem Text. Digitale Seiten enthalten echte Zeichen; gescannte Seiten enthalten keine.

03

Ein klares Ergebnis erhalten

Du erfährst, ob die PDF durchsuchbar, gescannt oder gemischt ist — und was das bedeutet, um die Tabellen nach Excel zu bekommen.

Was das Ergebnis bedeutet

Durchsuchbar, gescannt oder gemischt?

Durchsuchbare PDF

Der Text ist echt und markierbar. Du kannst ihn kopieren, aber Kopieren und Einfügen drückt eine Tabelle meist in eine einzige Spalte zusammen, weil eine PDF positionierten Text speichert, keine Zellen. Extrahiere die Tabelle samt Struktur, um Zeilen und Spalten zu erhalten.

Gescannte PDF

Die Seite ist ein Bild, es gibt also überhaupt keinen Text zum Kopieren. Um die Tabellen herauszuholen, braucht es OCR, das Zeilen und Spalten aus dem Bild rekonstruiert — genau die Aufgabe, für die die Bild-zu-Excel-Erweiterung gemacht ist.

Gemischte PDF

Manche Seiten sind digital, andere sind gescannte Einschübe. Der Prüfer sagt dir, wie viele Seiten markierbaren Text enthalten, sodass du weißt, welche OCR benötigen.

Nächster Schritt

Sobald du es weißt, mach aus den Tabellen eine Tabellenkalkulation.

Egal ob die PDF gescannt oder durchsuchbar ist, die Tabelle steckt weiterhin in der Seite fest. Die Bild-zu-Excel-Chrome-Erweiterung liest Tabellen aus PDFs, Scans, Screenshots und Bildern, lässt dich das Ergebnis prüfen und exportiert ein sauberes XLSX oder CSV — direkt aus dem Tab, in dem du gerade bist.

FAQ

Fragen zu gescannter vs. durchsuchbarer PDF

Wie erkenne ich, ob eine PDF gescannt oder durchsuchbar ist?

Versuche, Text in der PDF zu markieren. Wenn du Wörter markieren kannst, ist es eine durchsuchbare, digitale PDF. Lässt sich nichts markieren, ist die Seite ein Bild und die PDF ist gescannt. Dieser Prüfer liest die Textebene jeder Seite und nennt dir die Antwort.

Wird meine PDF irgendwohin hochgeladen?

Nein. Die Prüfung läuft komplett in deinem Browser mit einem integrierten PDF-Reader. Die Datei wird nie an einen Server gesendet.

Meine PDF ist gescannt — wie bekomme ich die Tabellen nach Excel?

Gescannte Seiten sind Bilder, du brauchst also OCR, das Zeilen und Spalten aus dem Bild rekonstruiert. Die Bild-zu-Excel-Chrome-Erweiterung liest Tabellen aus gescannten PDFs und Bildern und exportiert nach einer kurzen Prüfung XLSX oder CSV.

Warum verliert Kopieren und Einfügen aus einer durchsuchbaren PDF meine Tabellenspalten?

Eine PDF speichert positionierte Textfragmente, keine echten Zellen, sodass das Kopieren eine Tabelle meist in eine einzige zusammengelaufene Spalte zusammendrückt. Um Zeilen und Spalten zu erhalten, extrahiere die Tabelle samt ihrer Struktur, statt den rohen Text zu kopieren.

Kann eine PDF teils gescannt und teils durchsuchbar sein?

Ja. Viele Dokumente mischen digitale Seiten mit gescannten Einschüben. Der Prüfer nennt dir, wie viele der geprüften Seiten markierbaren Text enthalten, sodass du weißt, welche Seiten OCR benötigen.