Data Engineering

Die Herausforderung

Ein führendes Unternehmen wollte aus einer großen Menge extern bezogener Online-Daten gezielt relevante Geschäftskontakte identifizieren und für die weitere Bearbeitung nutzbar machen. Diese Informationen lagen intern nicht strukturiert vor. Als geeignete Grundlage wurden eingekaufte Daten aus öffentlich zugänglichen Quellen identifiziert, aus denen anschließend ein konkreter fachlicher Mehrwert erzeugt werden sollte.
Die Aufgabe bestand darin, aus einer großen Menge an Profilen, Metadaten und verlinkten Webseiten automatisiert relevante Kandidaten zu erkennen, zu priorisieren und mit verwertbaren Unternehmensinformationen anzureichern. Die Herausforderungen lagen dabei auf mehreren Ebenen: Die zugrunde liegenden Datenquellen folgten unterschiedlichen Strukturen. Viele Einträge enthielten weiterführende Verlinkungen, die eine deutlich größere Anzahl an zu verarbeitenden URLs erzeugten als ursprünglich erwartet. Über alledem stand die Frage, wie sich aus dieser Datenmasse belastbare, priorisierbare Ergebnisse ableiten lassen – und wie sich deren Qualität systematisch sicherstellen lässt.

Logistikunternehmen

Automatisiertes Scraping und Auswertung großer Datenmengen aus öffentlich zugänglichen Online-Quellen zur systematischen Identifikation und Qualifizierung relevanter Geschäftskontakte.

Der Lösungsweg

Wir entwickelten eine automatisierte und wiederverwendbare Datenpipeline, die Onlineprofile und Links strukturiert verarbeitet und daraus priorisierbare Kandidaten erzeugt.
Die Lösung bestand aus vier zentralen Bausteinen: Zunächst lasen wir alle verfügbaren Profile und Metadaten automatisiert über API-Abrufe ein. Im zweiten Schritt verarbeiteten wir alle verlinkten URLs inklusive weiterführender Verlinkungsstrukturen. Dabei kam eine regelbasierte Erkennungslogik zum Einsatz, die auf definierte Signale und Merkmale prüft.
Die Extraktion und Klassifikation von Unternehmensinformationen setzten wir mithilfe eines lokal betriebenen Large Language Models um. So konnten wir Firma, Adresse und weitere relevante Angaben direkt aus den verlinkten Seiten gewinnen – ohne externe Abhängigkeiten und mit hoher Datensouveränität. Die Ergebnisqualität haben wir mehrstufig validiert: durch Abfragen- und Ergebniszählung, die Speicherung von Zwischenresultaten und gezielte Stichprobenprüfungen.
Statt eines statischen Berichts lieferten wir einen strukturierten Datenexport in mehreren auswertbaren Tabellen: Profilübersichten mit Metadaten, Ergebnisse auf Link-Ebene sowie eine deduplizierte Übersicht aller untersuchten Quellen mit Erkennungsmerkmalen und Unternehmensinformationen. Die technische Steuerung erfolgte in kurzen, iterativen Zyklen.

Das Ergebnis

Das Unternehmen verfügt nun über eine strukturierte Datenbasis, auf deren Grundlage relevante Kandidaten eigenständig gefiltert, priorisiert und weiterbearbeitet werden können. Insgesamt wurden mehrere zehntausend Profile sowie hunderttausende Link-Einträge verarbeitet. Ein Großteil davon ließ sich eindeutig definierten Erkennungsmerkmalen zuordnen. Die Extraktion von Unternehmensinformationen lieferte für einen Großteil der untersuchten Quellen verwertbare Firmen- und Adressinformationen.
Die Ergebnisdaten lassen sich vielseitig nutzen: Kandidaten können nach Häufigkeit relevanter Signale priorisiert, Profile und ihre Reichweite ausgewertet sowie geeignete Kontakte für eine gezielte Weiterbearbeitung identifiziert werden. Aus dem einmaligen Projektauftrag ist ein technisch robustes, wiederverwendbares Muster entstanden, das sich für ähnliche datengetriebene Use Cases direkt adaptieren lässt.
Der Mehrwert liegt dabei nicht allein in den gelieferten Daten selbst: Aus extern bezogenen Rohdaten wurden strukturierte, angereicherte Business-Insights – eine saubere Grundlage, auf der sich weiterführende Analysen und perspektivisch auch automatisierte Prozesse aufbauen lassen.

Wie wir Sie unterstu00fctzen ku00f6nnen

Unsere Data Services

Business Intelligence & Data Analytics

Data Engineering

Webscraping

Wertvolle News zu Daten und KI in Ihrem Postfach!

TIQ Newsletter

Erhalten Sie mit unserem Newsletter die neuesten Informationen rund um Daten, KI und Wertschöpfung.

Logo TIQ Solutions

Wir setzen uns ein, dass Sie mit Ihren Daten & KI die besseren Entscheidungen für Ihr Unternehmen treffen und Ihren Geschäftserfolg nachhaltig steigern. Nutzen Sie das Potential von KI und Daten für mehr Profitabilität, Innovation und Wachstum. Wir sind Ihre Daten- und KI-Experten!

Mehr erfahren

Kontakt
 
Deutschland
 
Leipzig
Weißenfelser Str. 84
04229 Leipzig
 

Dresden
Fetscherstraße 24
01307 Dresden

Hamburg
Ludwig-Erhard-Straße 37
20459 Hamburg

München
Hofmannstraße 54
81379 München

Mit 🧡 TIQ Solutions 2026