Entwicklung eines KI-basierten Bucherkennungssystems

ADVANCED ANALYTICS

Wissensmanagement TIQ

Unser Kunde, eine Firma im Vertrieb von gebrauchten Büchern, suchte methodische und technische Unterstützung im Bereich der automatischen Suche und Anreicherung von Informationen zu Büchern, wie etwa Verlag, Erscheinungsjahr etc.

Diese Informationen werden benötigt, um einen Vertrieb dieser Bücher zu gewährleisten.

Die aktuellen Bestandsinformationen zu den einzelnen Büchern umfassen teils nicht alle benötigten Informationen, weswegen der Kunde manuell nach den fehlenden Informationen suchen muss. Da die manuelle Suche zeitaufwendig für die Mitarbeiter ist, sollte ein KI-basiertes Bucherkennungssystem entwickelt werden, welches automatisiert läuft.

In diesem Projekt unterstützte das Team von TIQ Solutions bei der Erstellung und Implementierung einer KI-basierten Lösung auf Basis von Python mithilfe von Azure-Services. Der bisherige Arbeitsablauf des Kunden umfasste einen initialen Scan des Buchcovers und die folgende manuelle Suche der Informationen.

Die von TIQ Solutions entwickelte Herangehensweise setzt bei dem Scan des Buchcovers an. Auf Basis des Buchcovers werden folgende Schritte ausgeführt:

  1. Bildvorverarbeitung
  2. OCR (optische Zeichenerkennung)
  3. Featureextraktion
  4. Datenbankabfrage

Das Kernstück der Lösung ist die optische Zeichenerkennung. Diese erkennt jegliche auf dem Buchcover abgebildete Schrift, welche mit der vorangehenden Bildvorverarbeitung zur Performanzsteigerung, ausgeführt wird. Daraufhin werden aus dem erkannten Text Features, wie zum Beispiel Titel, extrahiert.  Diese Informationen werden dazu benutzt, um eine Datenbankabfrage durchzuführen und die Daten des gesuchten Buches zu erhalten. Diese Technologien wurden in Microsoft Azure implementiert, um eine permanent erreichbare Lösung zu gewährleisten, ohne eine lokale Implementierung zu benötigen.

Es wurde eine dezentrale cloudbasierte Lösung geschaffen, die von jedem Computer aus gestartet werden kann und mit der keine lokalen Installationen nötig sind. Der gesamte Prozess ab dem Scan von der Bildvorverarbeitung bis hin zur Datenbankabfrage ist vollautomatisch in Azure implementiert. Die Lösung unterstützt den Kunden bei seinen täglichen Arbeitsprozessen.

PROJEKT INFORMATIONEN

Kunde
Buchbranche

Anwendungsfall
Entwicklung und Implementierung einer neuen automatischen KI-basierten Lösung zur Unterstützung der Katalogisierung von Literaturbeständen

Zielsetzung

  • Ablösung von manuellen Arbeitsschritten durch die Entwicklung einer automatisierten Lösung
  • Automatisierung mithilfe von Python und Azure-Services
  • Plattformunabhängige Bereitstellung der automatisierten Lösung

Technologie
Python, Azure Postgres Database, Azure Functions, Tesseract OCR, Image-Processing

Kundenvorteile

  • Vollautomatisch
  • Zugriff von jedem Computer
  • Einfache Wartung
  • Ressorcen- und Kosteneffizient durch Azure-Services