Skip to main content

Tag 26: OCR in Google Docs

30 Tage mit ... Google Text & Tabellen: Tag 26

Es gibt genügend verschiedene Funktionen und Szenarien, die Sie mit Google Text & Tabellen erkunden können. 30 Tage mit ... Google Docs kratzen nur an der Oberfläche. Zum Beispiel sind wir hier mit 25 Tagen und nur einer Handvoll, und wir haben die OCR-Funktion (optische Zeichenerkennung) noch nicht untersucht.

Ich habe in den letzten Jahren nicht viel mit OCR gemacht. Ich erinnere mich, dass ich in den frühen Tagen der Mainstream-Consumer-Scanner sehr enttäuscht von dem Konzept war. Damals war OCR ungefähr so ​​präzise wie Google Voice, um Text zu transkribieren. Genau wie Google Voice-Transkriptionen zu mehr Kauderwelsch als kohärenten Sätzen führen, haben OCR-Ergebnisse mehr Arbeit geleistet, als das Leben einfacher zu machen. Ich war besorgt, hoffe aber, dass die OCR in Google Docs besser ist als das, woran ich mich erinnere.

Aktivieren Sie das Kontrollkästchen in den Google Text & Tabellen-Upload-Einstellungen, um Text aus PDF- oder Bilddateien zu konvertieren.

Wenn Sie eine Datei oder einen Ordner hochladen Bei Google Text & Tabellen sind in den Upload-Einstellungen zwei Kontrollkästchen verfügbar. Der erste weist Google Text & Tabellen an, Microsoft Office-Dateiformate in native Google Docs-Formate zu konvertieren. Das zweite Kontrollkästchen weist jedoch Google Text & Tabellen an, OCR zu verwenden und Text in PDF- oder Bilddateien in bearbeitbaren Inhalt zu konvertieren.

[Weiterführende Literatur: Die besten TV-Streaming-Dienste]

Um es auszuprobieren, habe ich hochgeladen eine PDF-Datei aus meinem Ordner Dokumente. Es war ein 4-seitiges PDF-Dokument mit einem Gewicht von 225 Kb, aber Google Docs konnte es hochladen und in Sekundenschnelle konvertieren. Aber die Millionen-Frage lautet: "Hat die OCR den Inhalt der Datei korrekt erfasst?"

Das erste, was mir beim Auschecken meiner neu hochgeladenen Datei aufgefallen ist, ist, dass es nun acht Seiten umfasst. Warum? Nun, Google Docs macht etwas Cooles, das Ihnen hilft, die Genauigkeit der OCR-Übersetzung zu gewährleisten - es enthielt das Original-PDF / Bild, gefolgt von der editierbaren Abschrift des Inhalts. Jede der vier Seiten der ursprünglichen PDF-Datei enthielt nun zwei Seiten - ein Originalbild und einen bearbeitbaren Inhalt.

Ich war angenehm überrascht. Die Abschrift des Textes scheint makellos zu sein. Die OCR-Version verliert etwas an Formatierung in Bezug auf eingefügte Bilder oder Symbole auf dem Original, aber es gelingt sogar, die Größe der Überschrift und Aufzählungslisten zu vergleichen. Alles in allem ist die OCR von Google Docs beeindruckend.

Ich werde einen kleinen Vorbehalt anbringen. Die PDF-Datei, die ich hochgeladen habe, war ein ziemlich einfaches Textdokument in einer ziemlich standardmäßigen Schriftart. Die Ergebnisse können variieren, wenn Sie versuchen, einzigartige Schriften oder ausgefallenen Text hochzuladen und zu konvertieren.

Wie auch immer, das ist ein cooles Feature, das hält, was es verspricht. Es kommt mir nicht häufig vor, aber bei den Gelegenheiten, bei denen ich ein Bild oder eine PDF-Datei habe und ich den Textinhalt bearbeiten möchte, kann ich mit Google Docs den Text in etwas umwandeln, mit dem ich arbeiten kann.

Holen Sie sich die kompletten 30 Tage Mit Google Docsseries zusammengestellt in ein Kindle eBook.

Tag 25: Verlieren Sie Ihre Google Docs-Daten nicht

Tag 27: Google Docs-Skripts und Power-Tipps