Duplikate finden
Eine einfache und bewährte Lösung URL-Duplikate ausfindig zu machen, ist den vom Screaming Frog errechneten HASH-Wert zu Nutze zu machen. In den Crawl-Ergebnissen finden wir unter „Internal“ Angaben über jede einzelne URL.
Unter anderem wird ein HASH-Wert ermittelt. Dieser Wert wird anhand des Inhalts einer HTML-Seite erzeugt und ist einzigartig solange keine identische Kopie dieser Seite existiert.
Nachdem wir die Daten, über die Screaming Frog SEO Spider „Export“ Funktionalität, exportiert und in Excel importiert haben, stehen uns alle Daten zur Modellierung bereit. In der Spalte „HASH“ befinden sich alle errechneten HASH Werte für unsere HTML-Seiten. Als erstes markieren wir die Ganze „HASH“ Spalte. Abhängig von der verwendeten Excel-Version finden wir die „Bedingte Formatierung“ im Reiter „Start“. Im Dropdown der bedingten Formatierungen finden wir die Auswahlmöglichkeit „Doppelte Werte“.
Excel fragt uns in welcher Farbe Duplikate hervorgehoben werden sollen, die Auswahl der Farbe hat über die eigenen ästhetischen Vorstellungen hinweg keinen Einfluss auf unser Ergebnis.
Die Duplikate sind jetzt farblich markiert, wobei das Ergebnis noch nicht übersichtlich sein mag, weil sich Duplikate und Unique URL in derselben Übersicht befinden. Wir möchten als nächstes unsere Tabelle nach einer Farbe sortieren. Dazu verwenden wir entweder die Funktion „Filter“ die ihr unter „Daten“ findet oder die Funktion „als Tabelle formatieren“ die im Bereich „Formatvorlagen“ zu finden ist. In beiden Fällen erzeugen wir dadurch die Möglichkeit die Tabelle über einen kleinen Pfeil zu filtern. In dem Dropdown-Menü unter dem kleinen Pfeil können wir schließlich nach der Farbe unserer Wahl filtern.
Es folgt eine Auflistung aller Duplikate. Abhängig vom Ergebnis empfiehlt es sich die Daten alphabetisch zu sortieren. Die Duplikate sind jetzt klar hervorgehoben und in Paaren beziehungsweise Gruppen hintereinander aufgelistet. Im folgenden Schritt müssen wir schließlich entscheiden, welche die Original URL und welche die Kopie ist. In meinem Beispiel habe ich mir die Anzahl der eingehenden Links als weiteres Merkmal angeschaut. Hier bekommt eine Seite nur sechs „Unique inLinks“ gegen 742 für die andere Seite. Gerüstet mit diesem Wissen können wir weitere Untersuchungen angehen, um das Problem genauer zu identifizieren, um das Original von der Kopie zu unterscheiden und eine passende Maßnahme zu wählen. Die Gründe für Duplikate sind vielseitig. Sie können Fall abhängig einzeln oder müssen systematisch gelöst werden.
Das Erstellen einer Excel-Pivot-Tabelle
Wir verfolgen das Ziel eine Excel-Pivot-Tabelle zu erstellen, die uns ermöglichen wird, schnell und einfach unsere Datensätze zu modellieren.
Um eine Excel Pivot Tabelle zu erstellen, markieren wir eine beliebige Zelle in unserer Tabelle und wählen unter „Einfügen“ die Schaltfläche „PivotTable“ aus.
Nach einer Bestätigung des Befehls sehen wir in einem neuen Reiter auf der linken Seite eine leere Tabelle. Oben rechts stehen die Variablen, die wir verwenden können und unten rechts die Bereiche, in denen ihr Variablen einbinden könnt.
Die einzelnen Funktionalitäten einer Excel-Pivot-Tabelle können unter anderem unter folgendem Link nachgeschlagen werden: Excel-Pivot-Tabelle – Schritt für Schritt Einführung.