Dieses Webinar ist kostenlos für dich!

»Enterprise SEO: Qualitatives Indexmanagement von 10 Mio. PDPs«

Bei OTTO steht nachhaltige Sichtbarkeit im Zentrum der SEO-Strategie – insbesondere bei Millionen von Produktdetailseiten. Jan Wölk zeigt in diesem Webinar, warum selektives Indexmanagement nicht nur die Qualität der Domain stärkt, sondern auch ohne Trafficverluste funktioniert. Anhand eines eigens entwickelten Modells wird erläutert, wie Indexierungsentscheidungen getroffen und kontinuierlich optimiert werden. Zudem wird aufgezeigt, welche Features dem Modell helfen, fundiertere Entscheidungen zu treffen, und welche Learnings daraus entstanden sind.

Jan Wölk

Seit 2012 ist Jan Teil des SEO-Teams bei OTTO und hat seither in verschiedenen Rollen zur Sichtbarkeit von otto.de beigetragen. Der fachliche Schwerpunkt liegt im technischen SEO, mit langjähriger Verantwortung für das Thema „SEOenabling“ zur unternehmensweiten Verankerung von SEO. In der aktuellen Rolle als SEO-Produktmanager verantwortet Jan die strategische Ausrichtung und Weiterentwicklung der SEO-Services für die PDP und sorgt dafür, dass Anforderungen in Schnittstellenteams transparent kommuniziert und erfolgreich umgesetzt werden, um die Sichtbarkeit in Suchmaschinen und LLMs zu erhöhen.

Inhalt

Selektives Indexmanagement für Millionen Produktseiten

Jan zeigt in seinem Vortrag, wie Otto das Indexmanagement für mehrere Millionen Produktdetailseiten organisiert – mit dem klaren Ziel, möglichst viele irrelevante Seiten aus dem Index zu halten, ohne dabei nennenswert SEO-Traffic zu verlieren. Der zentrale Gedanke dahinter: Mehr indexierte Seiten bedeuten nicht automatisch mehr Sichtbarkeit. Im Gegenteil kann ein zu großer Index Crawl-Budget verschwenden, Kannibalisierung fördern und die Relevanz wichtiger Seiten verwässern.

Warum weniger oft mehr ist

Ausgangspunkt war die Erkenntnis, dass viele Seiten zwar technisch indexierbar waren, aber keinen relevanten Beitrag zum organischen Traffic geleistet haben. Bereits früh zeigte sich, dass eine deutliche Reduktion indexierter Seiten positive Effekte haben kann. Daraus entstand bei Otto ein langfristiger Fokus auf qualitatives statt quantitatives Indexmanagement. Entscheidend sind dabei vor allem vier Aspekte: effizientere Nutzung des Crawl-Budgets, geringere Kannibalisierung, stärkere Fokussierung auf relevante Seitentypen und ein systematischer Umgang mit schwach performenden Seiten.

Das Modell hinter der Entscheidung

Für die Bewertung der Produktdetailseiten nutzt Otto ein eigenes Machine-Learning-Modell auf Basis von CatBoost. Dieses Modell soll vorhersagen, ob eine Produktseite voraussichtlich organische Klicks erzielen wird. Dazu werden verschiedene Merkmale berücksichtigt, unter anderem Marke, Produkttyp, Produkttitel, Anzahl der Bilder, interne Pageviews und ein interner Qualitätswert für Produktdaten. Besonders wichtig ist, dass das Modell coldstartfähig ist: Auch neue Produkte sollen sofort bewertet werden können, ohne erst lange Daten sammeln zu müssen.

Das Modell trifft jedoch nicht allein die Entscheidung. Ergänzend gibt es Business Rules, etwa für Seiten mit bereits vorhandenen Klicks, interne Restriktionen oder sogenannte Low Performer. Letztere werden trotz positiver Modellbewertung später deindexiert, wenn sie über einen längeren Zeitraum kaum oder gar keine SEO-Klicks erzielen.

Der Holdout als Qualitätssicherung

Ein besonders spannender Teil des Vortrags ist der sogenannte Holdout. Dabei bleibt eine zufällig ausgewählte, repräsentative Teilmenge der Produktseiten indexiert – auch dann, wenn das Modell eigentlich zu Noindex raten würde. So kann das Team überprüfen, ob die negativen Modellentscheidungen wirklich korrekt sind. Wenn diese Seiten trotz Indexierung kaum Traffic erhalten, bestätigt das die Qualität des Modells. Auf diese Weise lässt sich der Grenzwert bestimmen, ab dem Seiten indexiert oder deindexiert werden sollen – immer mit dem Ziel, den potenziellen Trafficverlust auf ein definiertes Maß zu begrenzen.

Was besonders gut funktioniert hat

Jan macht deutlich, dass die Qualität des Modells nicht nur durch den Algorithmus selbst entsteht, sondern vor allem durch die richtigen Features und saubere Datengrundlagen. Einen starken Effekt hatten vor allem interne Pageviews, weil sie offenbar gut mit Relevanz korrelieren. Ebenso wichtig war, den Holdout strukturell sauber an die Gesamtmenge anzupassen. Nur wenn Trainingsmenge und tatsächlicher Produktbestand vergleichbar sind, können die Entscheidungen verlässlich sein.

Wichtigstes Learning und Ausblick

Als zentrales Learning empfiehlt Jan, Low-Performer regelmäßig zu analysieren und Indexmanagement nicht nur technisch, sondern strategisch zu denken. Wer viele Seiten im Index hat, sollte prüfen, welche davon wirklich Rankings und Traffic liefern. Für Otto ist das Thema längst nicht abgeschlossen: Nach den Produktseiten stehen nun auch Varianten-URLs im Fokus. Damit wächst die Zahl potenziell indexierbarer Seiten massiv – und die Bedeutung eines präzisen, selektiven Indexmanagements nimmt weiter zu.

Was sind die Online Expert Days?

Die Online Expert Days vereinen, was schon immer zusammengehört: die OMX und die SEOkomm. Die Fachkonferenzen für Online Marketing und Suchmaschinenoptimierung am 26. & 27.11.2026 im Herzen von Salzburg.
Gleich Ticket sichern!

Weitere kostenlose Videos von den Online Expert Days