Wenn Ihr größter Kunde KI-gestütztes Lieferantenscoring einführt:
Wie digital vergleichbar sind Sie?
Großkunden bewerten Lieferanten seit etwa 2024/2025 zunehmend in einer KI-gestützten Vorstufe — automatisiert, aus öffentlich verfügbaren Daten, lange bevor ein Einkäufer das erste Angebot liest. Wer in dieser Vorstufe nicht maschinenlesbar auftritt, fällt aus der engeren Auswahl. Was Systeme heute auslesen, wo Mittelständler typischerweise unsichtbar bleiben — und wie sich die Außendarstellung gezielt darauf einstellen lässt.
Es gibt eine Tür in den großen Einkaufsabteilungen, durch die Lieferanten heute nicht mehr persönlich kommen. Die Tür heißt Vorauswahl, sie ist seit etwa zwei Jahren teilweise automatisiert, und sie öffnet sich oder bleibt zu, bevor der erste Telefonanruf stattfindet. Wer durch sie geht, kommt zu einem Termin. Wer vor ihr stehen bleibt, weiß meist nicht einmal, dass sie überhaupt da war.
Die Tür ist keine Verschwörung gegen den Mittelstand. Sie ist eine sehr nüchterne Reaktion großer Unternehmen auf zwei Druckpunkte: die Berichtspflichten zur Lieferkette und die schiere Menge an potenziellen Lieferanten, die in modernen Einkaufs-Systemen verwaltet werden müssen. Wer effizient vorauswählen will, muss automatisieren — und wer automatisieren will, braucht maschinenlesbare Eingangs-Daten. Das ist der Punkt, an dem Mittelständler entscheidet, ob ihre Außendarstellung im B2B-Geschäft trägt oder bröselt.
So läuft eine typische Vorauswahl ab
Vier Stufen vom Daten-Sammeln bis zur engen Auswahl
Stufe 1 und 2 entscheiden zu rund 70 Prozent, ob ein Lieferant in der Shortlist landet — wer hier nicht sauber gelesen wird, kommt selten in Stufe 4 an.
Wenn der Einkauf nicht mehr persönlich beginnt
Der erste Kontakt zwischen Großkunde und neuem Lieferanten war jahrzehntelang persönlich: Empfehlung, Messe, Anruf, Termin. Heute ist diese Reihenfolge in vielen mittleren und großen Einkaufsabteilungen umgedreht — die Vorauswahl läuft anhand vorhandener Datenbanken und externer Quellen, und der persönliche Termin steht am Ende einer maschinellen Vorbereitung. Das ist keine Frage des Geschmacks, sondern eine Konsequenz aus Berichtspflichten und Bestand: Einkaufsabteilungen verwalten zunehmend mehrere tausend potenzielle Lieferanten, und ohne automatisierte Vorauswahl wäre die Pflege dieser Bestände nicht leistbar.
Treiber sind vor allem zwei Regulierungswellen. Das Lieferkettensorgfaltspflichtengesetz gilt seit Januar 2023 für Unternehmen mit mehr als 3.000 Mitarbeitenden, seit Januar 2024 auch für Unternehmen ab 1.000 Mitarbeitenden — mit dokumentierten Pflichten zu Menschenrechten und Umweltstandards in der gesamten Lieferkette. Die CSRD-Berichtspflicht erweitert das ab 2024/2025 um detaillierte Nachhaltigkeitsberichte. Beide Welle erzeugen denselben Druck: Wer Lieferanten beauftragt, muss ihre Eigenschaften belegen können. Wer das skalieren will, braucht maschinenlesbare Quellen.
Was Mittelständler zuerst merken
- Ein bestehender Kunde fragt plötzlich Datenblätter zu Nachhaltigkeit und Zertifikaten ab — nicht aus Misstrauen, sondern weil sein eigenes Reporting-System die Daten fordert.
- Anfragen werden komplexer, vor dem Erstgespräch: Online-Formulare mit fünfzehn Pflichtfeldern, Selbstauskunfts-Tools, Plattformen Dritter, in die man Daten einspeisen soll.
- Wettbewerber, die sichtbar schwächer agieren, kommen trotzdem in Ausschreibungen — und es ist nicht klar, warum.
Was beim KI-Scoring eigentlich passiert
Hinter dem Begriff „KI-gestütztes Lieferantenscoring" verbergen sich in der Regel zwei Komponenten, die zusammenarbeiten. Die erste ist eine Sammel- und Strukturier-Stufe: Ein KI-System durchsucht öffentlich verfügbare Quellen, extrahiert Lieferanten-Eigenschaften und legt sie in einem strukturierten Profil ab. Die zweite ist ein klassisches Bewertungs-Modell — meist regelbasiert oder leicht lernend — das anhand der extrahierten Felder einen Punktwert oder eine Kategorisierung vergibt.
Der entscheidende Unterschied zum klassischen Lieferanten-Setup ist die Geschwindigkeit und der Maßstab. Was eine Einkaufs-Mitarbeiterin früher in Wochen für zwölf Lieferanten-Kandidaten manuell zusammengesucht hat, läuft heute automatisiert über mehrere hundert Kandidaten in einer Nacht. Das bedeutet auch: Ein einzelner schwach gepflegter Außenauftritt wird nicht wohlwollend ergänzt, sondern als schwacher Datensatz behandelt. Die KI hat keine Geduld mit Marketing-Sprache, aus der sich das Geschäftsfeld erst rekonstruieren lässt — sie senkt schlicht die Konfidenz auf den Datensatz und damit die Vergleichbarkeit.
Wer den breiteren Hintergrund zu maschinenlesbarer Außendarstellung vertiefen will, findet im Beitrag Sichtbar in KI-Suchen die parallelen Mechanismen, die in KI-Suchsystemen für Endkunden wirken — die technische Basis ist sehr ähnlich.
Welche Datenquellen Systeme heute lesen
In der Praxis greifen die meisten Scoring-Systeme auf sechs Klassen von Quellen zu — in unterschiedlicher Tiefe, aber regelmäßig kombiniert.
Die Hauptquelle. Strukturierte Daten (Organization, Service, Person), Leistungs-Beschreibungen, Kontaktdaten, AreaServed, Sprache. Je strukturierter, desto belastbarer der extrahierte Datensatz.
Stammdaten, Geschäftsführung, Sitz, Branchencodes, Bilanz-Veröffentlichungen. Diese Daten haben hohes Gewicht, weil sie als verifiziert gelten.
ISO-Zertifikate (9001, 14001, 27001, 45001), Branchen-spezifische Siegel, Akkreditierungen. Quellen sind die Stellen, die die Zertifikate ausstellen — keine Selbstauskunft.
Eigene Berichte, Code-of-Conduct-Erklärungen, Auditergebnisse. Verlangt werden konkrete Kennzahlen mit Bezugsjahr und Quelle — Floskeln werden ignoriert.
Mit Datum versehene Veröffentlichungen über Investitionen, Personalia, Auszeichnungen, Vorfälle. Frische und Frequenz fließen in den Score ein.
Erwähnungen in Branchen-Medien, Bewertungs-Plattformen, Vergabe-Verzeichnisse. Insbesondere Krisen-Treffer (Klagen, Rückrufe) gewichten stark.
Die wichtigste Vorab-Übung ist nicht das Hinzufügen von Daten, sondern der Abgleich der bereits vorhandenen. Häufig stimmen Geschäftsführer-Namen, Adresse, Telefonnummern oder Gründungsjahr zwischen Website, Unternehmensregister, Branchen-Plattformen und Pressemitteilungen nicht überein. Jede Abweichung senkt die Konfidenz im Scoring — und ist mit geringem Aufwand reparierbar.
Wo Mittelständler typischerweise unsichtbar bleiben
Es gibt sechs wiederkehrende Stellen, an denen Mittelständler im Scoring schwach abschneiden — nicht weil das Angebot schwach ist, sondern weil die Außendarstellung an diesen Stellen nicht maschinenlesbar gepflegt ist.
- Leistungs-Beschreibungen als Marketing-Sprache: „Wir sind Ihr starker Partner für individuelle Lösungen" sagt einem System nichts. „Fertigung von CNC-gedrehten Edelstahlteilen für die Lebensmittel-Industrie, Stückzahlen 50 bis 10.000" ist eine funktionale Beschreibung, die sich extrahieren lässt.
- Fehlende Person-Schemas zur Geschäftsführung: Geschäftsführer-Namen tauchen nur auf der „Über uns"-Seite als Fließtext auf, ohne strukturierte Verknüpfung zur Organization. Im Scoring fehlt damit die Person als Datenpunkt.
- Zertifikate nur als Bilder: JPG- oder PDF-Darstellungen ohne maschinenlesbare Verknüpfung über hasCredential-Eigenschaften. Was im PDF steht, wird im Scoring oft nicht erfasst.
- ESG-Aussagen ohne Belege: „Wir handeln nachhaltig" ohne Bezugsjahr, ohne Kennzahl, ohne Audit-Verweis. Das System klassifiziert solche Aussagen als nicht belegt und ignoriert sie.
- Veraltete Presse-Bereiche: Letzte Mitteilung von vor drei Jahren, kein Datums-Schema, kein NewsArticle-Markup. Das System interpretiert die Datenlage als „Unternehmen wenig aktiv".
- Inkonsistente Standortdaten: Adresse auf der Website ist anders geschrieben als im Unternehmensregister. Dieselbe Telefonnummer steht in fünf Varianten in Online-Verzeichnissen. Konfidenz auf die Identität sinkt.
Wer diese sechs Punkte sauber adressiert, erreicht in den meisten Scoring-Systemen einen deutlich höheren Konfidenzwert — ohne dass am eigentlichen Angebot etwas geändert werden müsste.
Was maschinenlesbare Präsenz konkret heißt
Maschinenlesbarkeit bedeutet nicht, die Website für Maschinen statt für Menschen zu schreiben. Es bedeutet, beide Lese-Ebenen parallel zu bedienen — der menschliche Leser bekommt Texte, die KI bekommt strukturierte Daten, die hinter denselben Texten liegen. Vier strukturelle Bausteine machen den Unterschied.
1. Organization-Schema mit allen Identitäts-Feldern
Im Hauptdokument der Website wird die Organisation strukturiert ausgewiesen — mit Rechtsname, Steuernummer (sofern öffentlich), Sitz, Branchencode, Gründungsjahr, Geschäftsführung. Diese Daten werden vom Scoring-System als „verifizierbar" eingestuft, wenn sie konsistent mit den Daten in den öffentlichen Registern sind.
2. Service-Schemas für die Hauptleistungen
Jede zentrale Leistung wird als eigenes Service-Schema ausgewiesen — mit Service-Type, AreaServed, Provider-Verknüpfung zur Organization. Was menschlich auf einer Leistungs-Seite als Text steht, hat dahinter strukturierte Felder, die das System direkt extrahiert.
3. Person-Schemas für die Schlüsselpersonen
Geschäftsführung und Schlüsselpersonen werden als Person-Schemas ausgewiesen, mit Verknüpfung zur Organization über die employee-Eigenschaft. Sofern die Personen öffentlich aktiv sind (Vorträge, Veröffentlichungen, Branchenmedien), kann das System die Treffer dann zur Reputations-Berechnung dem Unternehmen zuordnen.
4. Press-Bereich mit NewsArticle-Markup
Pressemitteilungen werden mit Datum, Autor und NewsArticle-Schema versehen. Das System liest daraus die Aktivität des Unternehmens über die Zeit — und kann zwischen einem dauerhaft aktiven Unternehmen und einem ruhenden unterscheiden, ohne dass ein Mensch die Pressemitteilungen einzeln lesen muss.
Maßnahmen sortiert nach Aufwand und Wirkung
Die Reihenfolge der Maßnahmen entscheidet darüber, wann sich der Aufwand auszahlt. Vier Stufen, in dieser Reihenfolge.
Stufe 1 — Konsistenz-Audit (eine bis zwei Personentage)
- Abgleich Stammdaten: Adresse, Telefonnummer, Geschäftsführer, Rechtsform zwischen Website, Unternehmensregister, Branchen-Plattformen und Presseaussendungen vereinheitlichen.
- Domain-Eindeutigkeit: Sicherstellen, dass alle veröffentlichten Daten auf eine konsistente Hauptdomain verweisen und alte Varianten weiterleiten.
Stufe 2 — Strukturelle Grundlagen (zwei bis fünf Personentage)
- Organization-Schema einbauen: Mit allen Identitäts-Feldern und Verknüpfung zu öffentlichen Registern (sameAs).
- Service-Schemas für Hauptleistungen: Drei bis sieben zentrale Leistungen mit funktionaler Beschreibung und AreaServed.
- Person-Schemas für die Geschäftsführung: Mit jobTitle, employee-Verknüpfung und sameAs auf öffentliche Profile, sofern vorhanden.
Stufe 3 — Inhalts-Refactoring (mehrere Wochen)
- Marketing-Sprache zu funktionaler Sprache: Leistungs-Beschreibungen so umschreiben, dass das Geschäftsfeld direkt erkennbar ist.
- Zertifikate strukturiert anbinden: hasCredential-Eigenschaft mit Verweis auf die ausstellende Stelle, statt nur Logo-Galerie.
- ESG-Bereich mit Belegen: Konkrete Kennzahlen, Bezugsjahr, Audit-Verweise. Wer dazu Hilfe bei der rechtssicheren Formulierung braucht, findet in Nachhaltige Produkte bewerben die Regeln, die seit September 2026 gelten.
Stufe 4 — Aktivitäts-Signale (laufend)
- Press-Bereich pflegen: Realistische Mitteilungs-Frequenz, mit NewsArticle-Markup, Datum, Autor.
- Stammdaten aktuell halten: Geschäftsführer-Wechsel, neue Standorte, Zertifikats-Erneuerungen zeitnah in alle Quellen einpflegen.
- Domain als Anker: Die eigene Website als zentrale Quelle behandeln, von der aus Daten in andere Plattformen fließen — nicht umgekehrt. Warum diese Reihenfolge wichtig ist, behandelt Eigene Website vs. Plattform-Abhängigkeit.
Die Versuchung ist groß, mit Stufe 3 oder 4 zu starten — neue Pressemitteilungen, neue ESG-Aussagen, neue Marketing-Texte. Ohne die Stufen 1 und 2 verpuffen diese Maßnahmen im Scoring: Inkonsistente Stammdaten senken die Konfidenz auf den gesamten Datensatz, und ohne strukturelle Schemas wird der neue Inhalt nicht zuverlässig extrahiert. Reihenfolge schlägt Volumen.
Was sich oft nicht lohnt
Genauso wichtig wie die Frage, was hilft, ist die Frage, was als Lösung verkauft wird, aber im B2B-Scoring wenig bewirkt.
Veröffentlichungen, die nur produziert werden, um Frequenz zu zeigen. Scoring-Systeme erkennen unsubstantielle Mitteilungen am Verhältnis von Wortzahl zu echten Datenpunkten.
„Nachhaltig", „klimaneutral", „verantwortungsvoll" ohne Belege. Seit September 2026 zusätzlich abmahnbar — und im Scoring werden solche Aussagen ohnehin als nicht belegt ignoriert.
Wer den Außenauftritt überwiegend auf Branchenportalen pflegt, statt die eigene Domain zu stärken, verliert Kontrolle über Konsistenz und Updates — beides senkt die Scoring-Konfidenz.
Werkzeuge, die einen einzelnen Scoring-Wert versprechen zu steigern, ohne die strukturelle Basis zu sanieren. Was sich kurz steigern lässt, fällt im nächsten System-Update wieder zurück.
Dieselben Daten in fünf Plattformen einzeln pflegen, ohne dass eine zentrale Quelle existiert. Über Zeit driften die Versionen auseinander — und das Scoring registriert die Abweichungen.
Wer in einem Selbstauskunfts-Formular eines Großkunden Eigenschaften angibt, die auf der eigenen Website nicht belegt sind, riskiert die Inkonsistenz-Markierung im Scoring — und die ist schlechter als der ehrliche, niedrigere Wert.
Wann externe Hilfe nötig ist
Vieles davon lässt sich intern angehen, wenn jemand mit Ruhe an den Daten arbeitet. Drei Konstellationen sprechen für externe Hilfe.
- Wenn die strukturierten Daten noch gar nicht existieren: Der Aufbau von Organization-, Service-, Person- und NewsArticle-Schemas ist eine einmalige Architektur-Arbeit, die ohne Routine erfahrungsgemäß doppelt so lange dauert wie nötig — und dann oft nicht konsistent ist.
- Wenn die Stammdaten zwischen Quellen stark abweichen: Ein systematischer Abgleich zwischen Website, Unternehmensregister, Branchen-Plattformen und Pressestellen lohnt sich einmalig mit fachlicher Begleitung, statt mehrfach mit halben Maßnahmen.
- Wenn ESG-Aussagen rechtssicher belegbar gemacht werden müssen: Die Schnittstelle zwischen Scoring-relevanten Belegen und UWG-rechtssicherer Formulierung ist eng — falsche Belege sind schlechter als gar keine.
Ein seriöses Vorgehen beginnt mit dem Konsistenz-Audit, nicht mit dem Schema-Einbau. Wer in der ersten Sitzung schon Pressemitteilungs-Pakete anbietet, ohne die Identitäts-Daten geprüft zu haben, optimiert auf Verdacht.
Häufig gestellte Fragen
Großkunden setzen seit etwa 2024/2025 zunehmend Einkaufs-Software ein, die in einer Vorstufe öffentlich verfügbare Daten zu Lieferanten automatisch zusammenträgt und vergleichbar macht. Die KI-Schicht darin liest Websites, Unternehmensregister, ESG-Berichte, Pressemitteilungen, Zertifikats-Verzeichnisse und Branchen-Plattformen aus und erzeugt daraus einen strukturierten Profil-Datensatz pro Lieferant — Geschäftsfeld, Standort, Zertifikate, Nachhaltigkeits-Aussagen, Geschäftsführung, Reputations-Treffer. Auf diesem Datensatz läuft anschließend ein klassisches Bewertungsmodell, das die Lieferantenliste vorsortiert. Wer in dieser Vorstufe nicht maschinenlesbar oder nicht konsistent auftritt, fällt aus der engeren Auswahl, bevor ein Mensch das Angebot überhaupt liest. Das ist kein Zukunfts-Szenario, sondern in größeren Einkaufsabteilungen heute gelebte Praxis.
In der Regel sechs Klassen: die Unternehmens-Website mit ihren strukturierten Daten, öffentliche Unternehmensregister mit Stammdaten, Zertifizierungs-Datenbanken mit ISO- und Branchen-Siegeln, ESG- und Nachhaltigkeits-Berichte, Pressemitteilungen mit Datum, und Reputations-Treffer aus Suchmaschinen. Je strukturierter eine Quelle ist, desto stärker fließt sie in den Score ein — eine Website mit korrektem Organization-Schema und ausgewiesenen Leistungs-Schemas wird belastbarer ausgewertet als eine Website mit reinen Marketing-Texten, aus denen die KI das Geschäftsfeld erst rekonstruieren muss. Wo die KI rekonstruieren muss, sinkt das Vertrauen in den Datensatz und damit die Vergleichbarkeit.
Das System rekonstruiert die fehlenden Felder aus dem Fließtext — und macht das mit niedrigerem Konfidenz-Wert. In Scoring-Modellen mit Schwellenwerten führt das oft dazu, dass das Unternehmen entweder in der „nicht klassifizierbar"-Kategorie landet oder pauschal niedriger einsortiert wird als Wettbewerber mit sauberer Datenausgabe. Beides verhindert das Hochkommen in die Vorauswahl. Wichtig: Strukturierte Daten allein machen kein Unternehmen besser; sie machen es nur vergleichbar. Ein gutes Angebot mit schlecht strukturierter Außendarstellung verliert gegen ein durchschnittliches Angebot mit sauberer Außendarstellung — nicht weil das schlechtere besser ist, sondern weil das schlechtere überhaupt geprüft wird und das bessere nicht.
Nur, wenn die Aussagen substantiell sind — und nur, wenn sie belegt werden können. Pauschale Floskeln wie „nachhaltig wirtschaftend" sind seit Inkrafttreten der EmpCo-Richtlinie im September 2026 abmahnbar und gleichzeitig für KI-Scoring praktisch wertlos, weil Systeme genau auf das Vorhandensein konkreter Belege prüfen. Sinnvoller sind dokumentierte Aussagen mit Kennzahlen, Bezugsjahr und Quelle: Energieverbrauch, Anteil zertifizierten Materials, Diversitäts-Kennzahlen, Auditergebnisse. Wer dazu keine belastbaren Daten hat, sollte den Bereich auslassen statt zu erfinden — ein leerer ESG-Bereich ist im Scoring schlechter als ein nicht vorhandener, aber ein erfundener ist juristisch und reputationell schlechter als ein leerer.
Die strukturellen Grundlagen — Organization-Schema, Service-Schemas für die Hauptleistungen, Person-Schemas für die Geschäftsführung, klare AreaServed-Angabe — lassen sich für eine mittelgroße Website in zwei bis fünf Personentagen sauber aufsetzen. Aufwendiger sind die Inhalts-Arbeiten dahinter: Leistungs-Beschreibungen aus Marketing-Sprache in funktionale Sprache überführen, Zertifikate als hasCredential anbinden, ESG-Aussagen mit Belegen versehen, einen sauberen Press- und News-Bereich mit Datumsangaben aufbauen. Dieser inhaltliche Teil dauert mehrere Wochen bis Monate, je nach Ausgangslage. Wichtig ist die Reihenfolge: erst Strukturen, dann Inhalte hineinhängen — nicht umgekehrt.
Differenziert: Wer ausschließlich an Endkunden oder an kleine lokale Geschäftskunden liefert, hat aktuell weniger Druck. Wer auch nur indirekt an größere B2B-Strukturen verkauft — als Sublieferant, in Konsortien, über Branchen-Plattformen — wird mittelfristig in solche Scoring-Logiken einbezogen, weil sich die Vorauswahl entlang der Lieferkette verlängert. Hinzu kommt: Die gleiche maschinenlesbare Aufbereitung verbessert auch die Sichtbarkeit in KI-gestützten Suchsystemen, in denen Endkunden zunehmend recherchieren. Der Aufwand zahlt also auf zwei Wirkungsebenen ein, nicht nur auf die Procurement-Schiene. Wer wartet, bis der erste Großkunde anfragt, hat in dem Moment nicht mehr genug Vorlaufzeit, die Außendarstellung sauber aufzustellen.
Vergleichbarkeit ist kein Marketing-Thema — sie ist Voraussetzung
Wer sein Geschäft in den nächsten Jahren überwiegend im B2B-Sektor macht, wird nicht darum herumkommen, in Vorauswahl-Systemen sichtbar zu sein. Das ist kein Marketing-Trend, sondern eine direkte Folge der Berichtspflichten in der Lieferkette und des Effizienzdrucks in modernen Einkaufsabteilungen. Die gute Nachricht: Die Arbeit ist einmalig strukturell, dann läuft sie mit überschaubarem Pflegeaufwand weiter — und sie zahlt parallel auf die Sichtbarkeit in KI-gestützten Suchsystemen ein, die für Endkunden zunehmend relevant werden.
Die teuerste Variante ist nicht die saubere Vorbereitung. Es ist das Warten auf die erste konkrete Anfrage eines Großkunden, in dem Moment ohne Zeitfenster für die strukturelle Arbeit. Wer dann noch reagieren will, reagiert hektisch — und produziert genau die Inkonsistenzen, die im Scoring am stärksten gewichten. Wer hingegen jetzt mit dem Konsistenz-Audit beginnt und in drei Stufen weiterarbeitet, kommt nach wenigen Monaten mit einer Außendarstellung an, die in jedem Vorauswahl-System lesbar ist — ohne dass am eigentlichen Angebot etwas verändert werden musste.
Wir prüfen in 2 Werktagen, wie maschinenlesbar Ihr Auftritt für B2B-Scoring ist — und nennen 3 schnelle Hebel.
