Strategie

Wenn Ihr größter Kunde KI-gestütztes Lieferantenscoring einführt:
Wie digital vergleichbar sind Sie?

Großkunden bewerten Lieferanten seit etwa 2024/2025 zunehmend in einer KI-gestützten Vorstufe — automatisiert, aus öffentlich verfügbaren Daten, lange bevor ein Einkäufer das erste Angebot liest. Wer in dieser Vorstufe nicht maschinenlesbar auftritt, fällt aus der engeren Auswahl. Was Systeme heute auslesen, wo Mittelständler typischerweise unsichtbar bleiben — und wie sich die Außendarstellung gezielt darauf einstellen lässt.

13 Min. Lesezeit17. Mai 2026

Es gibt eine Tür in den großen Einkaufsabteilungen, durch die Lieferanten heute nicht mehr persönlich kommen. Die Tür heißt Vorauswahl, sie ist seit etwa zwei Jahren teilweise automatisiert, und sie öffnet sich oder bleibt zu, bevor der erste Telefonanruf stattfindet. Wer durch sie geht, kommt zu einem Termin. Wer vor ihr stehen bleibt, weiß meist nicht einmal, dass sie überhaupt da war.

Die Tür ist keine Verschwörung gegen den Mittelstand. Sie ist eine sehr nüchterne Reaktion großer Unternehmen auf zwei Druckpunkte: die Berichtspflichten zur Lieferkette und die schiere Menge an potenziellen Lieferanten, die in modernen Einkaufs-Systemen verwaltet werden müssen. Wer effizient vorauswählen will, muss automatisieren — und wer automatisieren will, braucht maschinenlesbare Eingangs-Daten. Das ist der Punkt, an dem Mittelständler entscheidet, ob ihre Außendarstellung im B2B-Geschäft trägt oder bröselt.

So läuft eine typische Vorauswahl ab

Vier Stufen vom Daten-Sammeln bis zur engen Auswahl

1. Daten sammeln

WebsiteRegisterPresse

Sekunden pro Lieferant

2. Strukturieren

Schema.orgFelderKonfidenz

automatisch

3. Scoren

ESGComplianceReputation

regelbasiert

4. Vorauswahl

ShortlistBriefingAnfrage

Mensch übernimmt

Stufe 1 und 2 entscheiden zu rund 70 Prozent, ob ein Lieferant in der Shortlist landet — wer hier nicht sauber gelesen wird, kommt selten in Stufe 4 an.

Wenn der Einkauf nicht mehr persönlich beginnt

Der erste Kontakt zwischen Großkunde und neuem Lieferanten war jahrzehntelang persönlich: Empfehlung, Messe, Anruf, Termin. Heute ist diese Reihenfolge in vielen mittleren und großen Einkaufsabteilungen umgedreht — die Vorauswahl läuft anhand vorhandener Datenbanken und externer Quellen, und der persönliche Termin steht am Ende einer maschinellen Vorbereitung. Das ist keine Frage des Geschmacks, sondern eine Konsequenz aus Berichtspflichten und Bestand: Einkaufsabteilungen verwalten zunehmend mehrere tausend potenzielle Lieferanten, und ohne automatisierte Vorauswahl wäre die Pflege dieser Bestände nicht leistbar.

Treiber sind vor allem zwei Regulierungswellen. Das Lieferkettensorgfaltspflichtengesetz gilt seit Januar 2023 für Unternehmen mit mehr als 3.000 Mitarbeitenden, seit Januar 2024 auch für Unternehmen ab 1.000 Mitarbeitenden — mit dokumentierten Pflichten zu Menschenrechten und Umweltstandards in der gesamten Lieferkette. Die CSRD-Berichtspflicht erweitert das ab 2024/2025 um detaillierte Nachhaltigkeitsberichte. Beide Welle erzeugen denselben Druck: Wer Lieferanten beauftragt, muss ihre Eigenschaften belegen können. Wer das skalieren will, braucht maschinenlesbare Quellen.

Was Mittelständler zuerst merken

Ein bestehender Kunde fragt plötzlich Datenblätter zu Nachhaltigkeit und Zertifikaten ab — nicht aus Misstrauen, sondern weil sein eigenes Reporting-System die Daten fordert.
Anfragen werden komplexer, vor dem Erstgespräch: Online-Formulare mit fünfzehn Pflichtfeldern, Selbstauskunfts-Tools, Plattformen Dritter, in die man Daten einspeisen soll.
Wettbewerber, die sichtbar schwächer agieren, kommen trotzdem in Ausschreibungen — und es ist nicht klar, warum.

Was beim KI-Scoring eigentlich passiert

Hinter dem Begriff „KI-gestütztes Lieferantenscoring" verbergen sich in der Regel zwei Komponenten, die zusammenarbeiten. Die erste ist eine Sammel- und Strukturier-Stufe: Ein KI-System durchsucht öffentlich verfügbare Quellen, extrahiert Lieferanten-Eigenschaften und legt sie in einem strukturierten Profil ab. Die zweite ist ein klassisches Bewertungs-Modell — meist regelbasiert oder leicht lernend — das anhand der extrahierten Felder einen Punktwert oder eine Kategorisierung vergibt.

Der entscheidende Unterschied zum klassischen Lieferanten-Setup ist die Geschwindigkeit und der Maßstab. Was eine Einkaufs-Mitarbeiterin früher in Wochen für zwölf Lieferanten-Kandidaten manuell zusammengesucht hat, läuft heute automatisiert über mehrere hundert Kandidaten in einer Nacht. Das bedeutet auch: Ein einzelner schwach gepflegter Außenauftritt wird nicht wohlwollend ergänzt, sondern als schwacher Datensatz behandelt. Die KI hat keine Geduld mit Marketing-Sprache, aus der sich das Geschäftsfeld erst rekonstruieren lässt — sie senkt schlicht die Konfidenz auf den Datensatz und damit die Vergleichbarkeit.

Wer den breiteren Hintergrund zu maschinenlesbarer Außendarstellung vertiefen will, findet im Beitrag Sichtbar in KI-Suchen die parallelen Mechanismen, die in KI-Suchsystemen für Endkunden wirken — die technische Basis ist sehr ähnlich.

Welche Datenquellen Systeme heute lesen

In der Praxis greifen die meisten Scoring-Systeme auf sechs Klassen von Quellen zu — in unterschiedlicher Tiefe, aber regelmäßig kombiniert.

Unternehmens-Website

Die Hauptquelle. Strukturierte Daten (Organization, Service, Person), Leistungs-Beschreibungen, Kontaktdaten, AreaServed, Sprache. Je strukturierter, desto belastbarer der extrahierte Datensatz.

Öffentliche Unternehmensregister

Stammdaten, Geschäftsführung, Sitz, Branchencodes, Bilanz-Veröffentlichungen. Diese Daten haben hohes Gewicht, weil sie als verifiziert gelten.

Zertifizierungs-Datenbanken

ISO-Zertifikate (9001, 14001, 27001, 45001), Branchen-spezifische Siegel, Akkreditierungen. Quellen sind die Stellen, die die Zertifikate ausstellen — keine Selbstauskunft.

ESG- und Nachhaltigkeits-Berichte

Eigene Berichte, Code-of-Conduct-Erklärungen, Auditergebnisse. Verlangt werden konkrete Kennzahlen mit Bezugsjahr und Quelle — Floskeln werden ignoriert.

Pressemitteilungen und News

Mit Datum versehene Veröffentlichungen über Investitionen, Personalia, Auszeichnungen, Vorfälle. Frische und Frequenz fließen in den Score ein.

Reputations-Treffer

Erwähnungen in Branchen-Medien, Bewertungs-Plattformen, Vergabe-Verzeichnisse. Insbesondere Krisen-Treffer (Klagen, Rückrufe) gewichten stark.

Konsistenz-Prüfung:

Die wichtigste Vorab-Übung ist nicht das Hinzufügen von Daten, sondern der Abgleich der bereits vorhandenen. Häufig stimmen Geschäftsführer-Namen, Adresse, Telefonnummern oder Gründungsjahr zwischen Website, Unternehmensregister, Branchen-Plattformen und Pressemitteilungen nicht überein. Jede Abweichung senkt die Konfidenz im Scoring — und ist mit geringem Aufwand reparierbar.

Wo Mittelständler typischerweise unsichtbar bleiben

Es gibt sechs wiederkehrende Stellen, an denen Mittelständler im Scoring schwach abschneiden — nicht weil das Angebot schwach ist, sondern weil die Außendarstellung an diesen Stellen nicht maschinenlesbar gepflegt ist.

Leistungs-Beschreibungen als Marketing-Sprache: „Wir sind Ihr starker Partner für individuelle Lösungen" sagt einem System nichts. „Fertigung von CNC-gedrehten Edelstahlteilen für die Lebensmittel-Industrie, Stückzahlen 50 bis 10.000" ist eine funktionale Beschreibung, die sich extrahieren lässt.
Fehlende Person-Schemas zur Geschäftsführung: Geschäftsführer-Namen tauchen nur auf der „Über uns"-Seite als Fließtext auf, ohne strukturierte Verknüpfung zur Organization. Im Scoring fehlt damit die Person als Datenpunkt.
Zertifikate nur als Bilder: JPG- oder PDF-Darstellungen ohne maschinenlesbare Verknüpfung über hasCredential-Eigenschaften. Was im PDF steht, wird im Scoring oft nicht erfasst.
ESG-Aussagen ohne Belege: „Wir handeln nachhaltig" ohne Bezugsjahr, ohne Kennzahl, ohne Audit-Verweis. Das System klassifiziert solche Aussagen als nicht belegt und ignoriert sie.
Veraltete Presse-Bereiche: Letzte Mitteilung von vor drei Jahren, kein Datums-Schema, kein NewsArticle-Markup. Das System interpretiert die Datenlage als „Unternehmen wenig aktiv".
Inkonsistente Standortdaten: Adresse auf der Website ist anders geschrieben als im Unternehmensregister. Dieselbe Telefonnummer steht in fünf Varianten in Online-Verzeichnissen. Konfidenz auf die Identität sinkt.

Wer diese sechs Punkte sauber adressiert, erreicht in den meisten Scoring-Systemen einen deutlich höheren Konfidenzwert — ohne dass am eigentlichen Angebot etwas geändert werden müsste.

Was maschinenlesbare Präsenz konkret heißt

Maschinenlesbarkeit bedeutet nicht, die Website für Maschinen statt für Menschen zu schreiben. Es bedeutet, beide Lese-Ebenen parallel zu bedienen — der menschliche Leser bekommt Texte, die KI bekommt strukturierte Daten, die hinter denselben Texten liegen. Vier strukturelle Bausteine machen den Unterschied.

1. Organization-Schema mit allen Identitäts-Feldern

Im Hauptdokument der Website wird die Organisation strukturiert ausgewiesen — mit Rechtsname, Steuernummer (sofern öffentlich), Sitz, Branchencode, Gründungsjahr, Geschäftsführung. Diese Daten werden vom Scoring-System als „verifizierbar" eingestuft, wenn sie konsistent mit den Daten in den öffentlichen Registern sind.

2. Service-Schemas für die Hauptleistungen

Jede zentrale Leistung wird als eigenes Service-Schema ausgewiesen — mit Service-Type, AreaServed, Provider-Verknüpfung zur Organization. Was menschlich auf einer Leistungs-Seite als Text steht, hat dahinter strukturierte Felder, die das System direkt extrahiert.

3. Person-Schemas für die Schlüsselpersonen

Geschäftsführung und Schlüsselpersonen werden als Person-Schemas ausgewiesen, mit Verknüpfung zur Organization über die employee-Eigenschaft. Sofern die Personen öffentlich aktiv sind (Vorträge, Veröffentlichungen, Branchenmedien), kann das System die Treffer dann zur Reputations-Berechnung dem Unternehmen zuordnen.

4. Press-Bereich mit NewsArticle-Markup

Pressemitteilungen werden mit Datum, Autor und NewsArticle-Schema versehen. Das System liest daraus die Aktivität des Unternehmens über die Zeit — und kann zwischen einem dauerhaft aktiven Unternehmen und einem ruhenden unterscheiden, ohne dass ein Mensch die Pressemitteilungen einzeln lesen muss.

Maßnahmen sortiert nach Aufwand und Wirkung

Die Reihenfolge der Maßnahmen entscheidet darüber, wann sich der Aufwand auszahlt. Vier Stufen, in dieser Reihenfolge.

Stufe 1 — Konsistenz-Audit (eine bis zwei Personentage)

Abgleich Stammdaten: Adresse, Telefonnummer, Geschäftsführer, Rechtsform zwischen Website, Unternehmensregister, Branchen-Plattformen und Presseaussendungen vereinheitlichen.
Domain-Eindeutigkeit: Sicherstellen, dass alle veröffentlichten Daten auf eine konsistente Hauptdomain verweisen und alte Varianten weiterleiten.

Stufe 2 — Strukturelle Grundlagen (zwei bis fünf Personentage)

Organization-Schema einbauen: Mit allen Identitäts-Feldern und Verknüpfung zu öffentlichen Registern (sameAs).
Service-Schemas für Hauptleistungen: Drei bis sieben zentrale Leistungen mit funktionaler Beschreibung und AreaServed.
Person-Schemas für die Geschäftsführung: Mit jobTitle, employee-Verknüpfung und sameAs auf öffentliche Profile, sofern vorhanden.

Stufe 3 — Inhalts-Refactoring (mehrere Wochen)

Marketing-Sprache zu funktionaler Sprache: Leistungs-Beschreibungen so umschreiben, dass das Geschäftsfeld direkt erkennbar ist.
Zertifikate strukturiert anbinden: hasCredential-Eigenschaft mit Verweis auf die ausstellende Stelle, statt nur Logo-Galerie.
ESG-Bereich mit Belegen: Konkrete Kennzahlen, Bezugsjahr, Audit-Verweise. Wer dazu Hilfe bei der rechtssicheren Formulierung braucht, findet in Nachhaltige Produkte bewerben die Regeln, die seit September 2026 gelten.

Stufe 4 — Aktivitäts-Signale (laufend)

Press-Bereich pflegen: Realistische Mitteilungs-Frequenz, mit NewsArticle-Markup, Datum, Autor.
Stammdaten aktuell halten: Geschäftsführer-Wechsel, neue Standorte, Zertifikats-Erneuerungen zeitnah in alle Quellen einpflegen.
Domain als Anker: Die eigene Website als zentrale Quelle behandeln, von der aus Daten in andere Plattformen fließen — nicht umgekehrt. Warum diese Reihenfolge wichtig ist, behandelt Eigene Website vs. Plattform-Abhängigkeit.

Häufige Fehl-Investition:

Die Versuchung ist groß, mit Stufe 3 oder 4 zu starten — neue Pressemitteilungen, neue ESG-Aussagen, neue Marketing-Texte. Ohne die Stufen 1 und 2 verpuffen diese Maßnahmen im Scoring: Inkonsistente Stammdaten senken die Konfidenz auf den gesamten Datensatz, und ohne strukturelle Schemas wird der neue Inhalt nicht zuverlässig extrahiert. Reihenfolge schlägt Volumen.

Was sich oft nicht lohnt

Genauso wichtig wie die Frage, was hilft, ist die Frage, was als Lösung verkauft wird, aber im B2B-Scoring wenig bewirkt.

1

Massen-Pressemitteilungen ohne Substanz

Veröffentlichungen, die nur produziert werden, um Frequenz zu zeigen. Scoring-Systeme erkennen unsubstantielle Mitteilungen am Verhältnis von Wortzahl zu echten Datenpunkten.

2

ESG-Buzzword-Bingo

„Nachhaltig", „klimaneutral", „verantwortungsvoll" ohne Belege. Seit September 2026 zusätzlich abmahnbar — und im Scoring werden solche Aussagen ohnehin als nicht belegt ignoriert.

3

Plattform-Auftritte als Ersatz für eigene Website

Wer den Außenauftritt überwiegend auf Branchenportalen pflegt, statt die eigene Domain zu stärken, verliert Kontrolle über Konsistenz und Updates — beides senkt die Scoring-Konfidenz.

4

Pauschal-Tools zum „Score-Pushen"

Werkzeuge, die einen einzelnen Scoring-Wert versprechen zu steigern, ohne die strukturelle Basis zu sanieren. Was sich kurz steigern lässt, fällt im nächsten System-Update wieder zurück.

5

Doppel-Pflege ohne Quelle

Dieselben Daten in fünf Plattformen einzeln pflegen, ohne dass eine zentrale Quelle existiert. Über Zeit driften die Versionen auseinander — und das Scoring registriert die Abweichungen.

6

Übertreibung in Selbstauskunfts-Tools

Wer in einem Selbstauskunfts-Formular eines Großkunden Eigenschaften angibt, die auf der eigenen Website nicht belegt sind, riskiert die Inkonsistenz-Markierung im Scoring — und die ist schlechter als der ehrliche, niedrigere Wert.

Wann externe Hilfe nötig ist

Vieles davon lässt sich intern angehen, wenn jemand mit Ruhe an den Daten arbeitet. Drei Konstellationen sprechen für externe Hilfe.

Wenn die strukturierten Daten noch gar nicht existieren: Der Aufbau von Organization-, Service-, Person- und NewsArticle-Schemas ist eine einmalige Architektur-Arbeit, die ohne Routine erfahrungsgemäß doppelt so lange dauert wie nötig — und dann oft nicht konsistent ist.
Wenn die Stammdaten zwischen Quellen stark abweichen: Ein systematischer Abgleich zwischen Website, Unternehmensregister, Branchen-Plattformen und Pressestellen lohnt sich einmalig mit fachlicher Begleitung, statt mehrfach mit halben Maßnahmen.
Wenn ESG-Aussagen rechtssicher belegbar gemacht werden müssen: Die Schnittstelle zwischen Scoring-relevanten Belegen und UWG-rechtssicherer Formulierung ist eng — falsche Belege sind schlechter als gar keine.

Ein seriöses Vorgehen beginnt mit dem Konsistenz-Audit, nicht mit dem Schema-Einbau. Wer in der ersten Sitzung schon Pressemitteilungs-Pakete anbietet, ohne die Identitäts-Daten geprüft zu haben, optimiert auf Verdacht.

Häufig gestellte Fragen

Was bedeutet „KI-gestütztes Lieferantenscoring" konkret?

Welche Datenquellen wertet ein typisches Scoring-System aus?

Was passiert, wenn meine Website keine strukturierten Daten hat?

Müssen wir jetzt überall ESG-Aussagen einbauen?

Wie lange dauert es, eine Website maschinenlesbar zu machen?

Lohnt sich das auch für kleine B2B-Unternehmen ohne Großkunden?

Vergleichbarkeit ist kein Marketing-Thema — sie ist Voraussetzung

Wer sein Geschäft in den nächsten Jahren überwiegend im B2B-Sektor macht, wird nicht darum herumkommen, in Vorauswahl-Systemen sichtbar zu sein. Das ist kein Marketing-Trend, sondern eine direkte Folge der Berichtspflichten in der Lieferkette und des Effizienzdrucks in modernen Einkaufsabteilungen. Die gute Nachricht: Die Arbeit ist einmalig strukturell, dann läuft sie mit überschaubarem Pflegeaufwand weiter — und sie zahlt parallel auf die Sichtbarkeit in KI-gestützten Suchsystemen ein, die für Endkunden zunehmend relevant werden.

Die teuerste Variante ist nicht die saubere Vorbereitung. Es ist das Warten auf die erste konkrete Anfrage eines Großkunden, in dem Moment ohne Zeitfenster für die strukturelle Arbeit. Wer dann noch reagieren will, reagiert hektisch — und produziert genau die Inkonsistenzen, die im Scoring am stärksten gewichten. Wer hingegen jetzt mit dem Konsistenz-Audit beginnt und in drei Stufen weiterarbeitet, kommt nach wenigen Monaten mit einer Außendarstellung an, die in jedem Vorauswahl-System lesbar ist — ohne dass am eigentlichen Angebot etwas verändert werden musste.

ÜBER DIE AUTORIN

Dagmar Seebo, CEO von ProXWorks®

Dagmar Seebo

Dagmar Seebo, B.A., ist seit 1999 im E-Commerce tätig. Als CEO von ProXWorks® verbindet sie über 27 Jahre Marketing-Erfahrung mit digitalem Know-how.

Die Inhalte entstehen unter redaktioneller Verantwortung und fachlicher Prüfung unter Einsatz moderner KI-gestützter Systeme.

Antwort in 1 Werktag

Wir prüfen in 1 Werktag, wie maschinenlesbar Ihr Auftritt für B2B-Scoring ist — und nennen 3 schnelle Hebel.

Vergleichbarkeits-Check anfordern

ProXWorks® KI-News

KI für Entscheider, sachlich aufbereitet.

Wöchentlich ein vollständiger Fachbeitrag über Künstliche Intelligenz im Mittelstand. Jederzeit abbestellbar.