Die Google-Texterkennung im Verlauf der letzten 10 Jahre: Kann Google heute Texte wie ein Mensch bewerten?

04. Juli 2022
Kann Google lesen?

Die Technologien zur Texterkennung haben sich in den vergangenen Jahren kontinuierlich weiterentwickelt. Mit Hilfe von Verfahren der Kontextanalyse können nicht nur einzelne Zeichen identifiziert, sondern diese auch im Gesamtkontext gesehen und analysiert werden. Auch Google zählt dabei zu den Vorreitern im Bereich der Texterkennung. Wir stellen Ihnen die Entwicklung der letzten 10 Jahre und die daraus resultierenden Ergebnisse vor.

von Literat Pro
Bild zeigt Mann der Google benutzt
Rawpixel / shutterstock

Was bedeutet Texterkennung?

Die Texterkennung ist ein Verfahren, das dazu genutzt wird, Buchstaben und Zahlen beim Scannen, Faxen, oder Fotografieren als solche zu identifizieren, und eine Bearbeitung von Dokumenten, z. B. im PDF-Format zu ermöglichen. Dies geschieht mit Hilfe von Techniken, wie der OCR (Optical Character Recognition), bei der Schriftzeichen in einem grafischen Raster als solche erkannt und entsprechend codiert werden können. Dieses Verfahren findet in vielen Bereichen Anwendung, sowohl im Arbeitsumfeld verschiedenster Unternehmen als auch im B2B Marketing.

Was ist der Unterschied zwischen OCR und ICR Texterkennung?

Neben der OCR, die lediglich ein einzelnes Zeichen anhand bestimmter Merkmale als Buchstaben oder Zahl identifizieren kann, hat sich in den letzten Jahren zusätzlich eine intelligentere Art der Texterkennung entwickelt, die als ICR (Intelligent Character Recognition) bezeichnet wird. Hierbei werden die einzelnen Symbole in Zusammenhang miteinander gebracht und das jeweilige Programm "liest" einen Text, statt nur einzelne Zeichen, so wie das Lesen auch im menschlichen Gehirn funktioniert. Die ICR Technologie ist ein Verfahren, bei dem künstliche Intelligenz eingesetzt wird, um z. B. auch handschriftliche Dokumente digital entziffern zu können. Allerdings ist deren Entwicklungsstand derzeit noch nicht so weit, dass die flächendeckende Nutzung wirtschaftlich Sinn machen würde. Daher nutzen die meisten Unternehmen die OCR-Methode der Texterkennung, die in den letzten 10 Jahren immer weiter verfeinert und entwickelt wurde.

Diese Vorteile bietet die Texterkennung im Einzelnen:

  • Bei einer digitalen Dokumentensuche können Texte gefunden werden, selbst wenn das Schlagwort nicht im Dokumententitel enthalten ist.
  • Die Texterkennung hilft bei der digitalen Archivierung von verschiedensten Dokumenten. Auf diese Weise wird Text bereits beim Scannen von Dokumenten erkannt und kann gespeichert werden.
  • Auch im Bereich der Buchhaltung ist die Technologie der Texterkennung von großem Wert. Dadurch ist eine manuelle Eingabe von Rechnungsinformationen nicht mehr notwendig, und menschliche Fehler bei der Übertragung von Daten können vermieden werden.

Texterkennung bei Google früher und heute

Der globale Megakonzern Google geht beim Thema Texterkennung mit Riesenschritten voran. Was vor 10 Jahren unvorstellbar schien, ist heute Realität. Die Suchfunktion von Google erkennt nicht nur Gesichter oder andere Objekte, auch Texte innerhalb eines Bildes können identifiziert werden. Dadurch ergeben sich vielfältige Möglichkeiten wie z. B. die maschinelle Übersetzung des erkannten Textes in eine andere Sprache. Handschriftliche Dokumente können von der OCR-Technologie Googles bislang jedoch nicht optimal gelesen werden, weshalb in diesem Bereich noch Entwicklungspotenzial liegt.

Fazit

Auch wenn Google bislang nicht die Fähigkeit hat, Texte zu lesen, wie ein Mensch, ist die Entwicklung dorthin bereits abzusehen. Die OCR-Technologie von Google Drive und Google Lens erlaubt es bereits, Texte in Bilddateien zu erkennen und als solche abzuspeichern. Dies ist ein großer Vorteil für viele Unternehmen im B2B- und B2C-Bereich, da hierdurch Ressourcen eingespart und anderweitig genutzt werden könne.