Co to jest TF-IDF?

TF-IDF (Term Frequency–Inverse Document Frequency) to statystyczna metoda oceny ważności słowa w dokumencie na tle innych dokumentów. W SEO służy do optymalizacji treści poprzez identyfikację terminów, które wyróżniają stronę na tle konkurencji.

TF-IDF składa się z dwóch elementów:

  • TF (Term Frequency) – częstotliwość występowania słowa w dokumencie
  • IDF (Inverse Document Frequency) – rzadkość terminu w zbiorze dokumentów

W uproszczeniu:

  • wysoki TF = słowo często występuje w tekście
  • wysoki IDF = słowo jest rzadkie w innych tekstach
  • TF-IDF = TF × IDF → im wyższy wynik, tym większe znaczenie terminu

Przykład:

  • słowo pojawia się 10 razy w tekście o 1000 słów → TF = 0,01
  • jeśli występuje rzadko w innych dokumentach → wysoki IDF
  • wynik TF-IDF będzie wysoki → termin jest istotny dla tematu

Zastosowanie w SEO:

Narzędzia wykorzystujące TF-IDF lub jego warianty:

  • Surfer SEO
  • Clearscope
  • Frase
  • MarketMuse

Ważne:

  • TF-IDF nie jest bezpośrednim czynnikiem rankingowym
  • Google używa bardziej zaawansowanych modeli (np. BERT, MUM)
  • to narzędzie pomocnicze do analizy i optymalizacji treści

Dobre praktyki:

  • nie używaj TF-IDF do „upychania” słów kluczowych
  • traktuj je jako wskazówkę, jakie tematy i terminy warto uwzględnić
  • pisz naturalnie i kompleksowo, pokrywając temat z różnych perspektyw

TF-IDF pomaga znaleźć luki semantyczne – a ich uzupełnienie zwiększa trafność treści zarówno dla Google, jak i użytkowników.


← Powrót do słownika SEO


Szukasz konsultanta SEO dla firm SaaS i B2B? Zobacz, jak mogę pomóc Twojej firmie rosnąć dzięki SEO.

Przewijanie do góry