WDF*IDF

Hinter der Bezeichnung WDF*IDF steckt eine mathematische Formel. Damit lässt sich das Verhältnis von bestimmten Wörtern innerhalb eines Dokumentes zum Rest des Internets bestimmten. WDF*IDF ist ein Tool der OnPage-Optimierung.

Definition WDF*IDF

WDF*IDF ist eine Formel, die berechnet, in welchem Maße bestimmte Schlüsselwörter innerhalb eines Textes erscheinen. Außerdem setzt die Formel das Aufkommen des Keywords innerhalb des Textes mit anderen Texten im Internet ins Verhältnis. „WDF“ steht für „Within Document Frequency“ und „IDF“ steht für „Inverse Document Frequency“. Bei der Formel WDF*IDF geht es nicht um die Berechnung der Keyword-Dichte. Stattdessen gibt die Formel das Verhältnis der auf einer Webseite aufkommenden Keywords zum Rest des Internets wieder. Mit der Formel lassen sich Webseiten untersuchen, die mit bestimmten Keywords ranken. Dann vergleicht man das Verhältnis der dort aufkommenden Keywords mit der eigenen Webseite.

Aufbau der Formel

Zur Berechnung multipliziert man WDF mit IDF. WDF besteht aus der Häufigkeit eines Wortes (i) innerhalb des Dokumentes (j). Das Ergebnis ist die Gewichtung (w). Diese Häufigkeit innerhalb des Dokumentes multipliziert man mit der Häufigkeit innerhalb des gesamten Internets (i). Die Formel lautet also WDFi,j*IDFi.

WDF

Für die Berechnung der Within Document Frequency benötigt man die Häufigkeit des Wortes innerhalb des Textes (i) und die Gesamtanzahl der Wörter des Textes (L). Es folgt die Multiplikation mit einem Logarithmus. Die Häufigkeit des Wortes innerhalb des Textes dividiert man durch die Gesamtzahl der Wörter. Die Formel sieht dann wie folgt aus: WDFi = log2 (i,j + 1) / log2 (L).
Der Logarithmus dient dazu, eine Erhöhung des Schlüsselwortes zu verhindern, sodass ein besserer Wert das Ergebnis nicht verfälscht. Der Logarithmus staucht also das Ergebnis. Bei der Gesamtzahl der Wörter berechnet man nur sinntragende Wörter und keine Stoppwörter.

IDF

Die Inverse Document Frequency dient als eine Art Korrektiv. Hierbei dividiert man alle Texte durch die Anzahl der Texte, die das Schlüsselwort enthalten. Auch in diesem Fall erfolgt die Multiplikation der Division mit dem Logarithmus. Die Bezeichnung für die Gesamtanzahl aller geschätzten Texte ist ND, die Texte, welche das gesuchte Schlüsselwort enthalten, tragen die Bezeichnung fi. Die Formel lautet also IDFi = log (1 + ND / fi). Bei der Berechnung der Formel helfen einem WDF*IDF Tools.

Bedeutung von WDF*IDF im SEO

Das Tool hilft einem, eine Webseite besonders einzigartig zu gestalten. Ein Suchmaschinennutzer, der nach genau diesem Schlüsselwort sucht, wird wahrscheinlich eine Webseite finden, der Google eine hohe Relevanz hinsichtlich dieses Keywords zuspricht. Je relevanter der Text für dieses Keyword ist, desto besser rankt es in den organischen Suchergebnissen.
Google kann mit Wörtern, die häufig in einem Dokument vorkommen, wenig anfangen. Dem Google Bot, der die Texte analysiert, sagen diese häufigen Wörter wenig und geben kaum Auskunft darüber, was genau der Inhalt des Textes ist. Es fällt ihm damit schwerer, den Text inhaltlich zu bestimmen. Seltene Schlüsselwörter machen es ihm einfacher, den Inhalt zuzuordnen.
WDF*IDF gewann seit 2012 immer mehr Bedeutung für das SEO. Ursprünglich stammt die Formel von der Informationswissenschaftlerin Donna Harman, welche die Formel bereits im Jahr 1992 beschrieb.

Die Formel lässt sich allerdings nicht auf alle Arten von Webseiten optimal anwenden. Online-Shops zum Beispiel weisen meist nur ein geringes Textvolumen auf. Sind die Produkte nicht besonders selten, lassen sich schwer seltene Schlüsselwörter für die Texte finden. Darüber hinaus darf der Spam von seltenen Schlüsselwörtern die Lesbarkeit eines Textes nicht beeinträchtigen. Googles Algorithmus erkennt ohnehin, wenn bestimmte Wörter gespamt werden, um künstlich die Relevanz einer Webseite zu erhöhen. Ein weiteres Problem ergibt sich bei der Verwendung von Synonymen. Synonyme finden in der Formel keine Beachtung. Die Verteilung des Keywords innerhalb des Textes spielt ebenfalls keine Rolle in der Formel. Aufgrund solcher und anderer Probleme zweifeln manche Experten über die Effektivität der Formel. WDF*IDF ist letztlich nicht der Garant für das bestmögliche Ranking.