Co to jest Noindex Tag?
Noindex tag to dyrektywa HTML lub HTTP informująca wyszukiwarki, że dana strona nie powinna być uwzględniana w indeksie – strona z noindex nie pojawi się w wynikach wyszukiwania, nawet jeśli Google ją zna i crawluje.
Dwa sposoby implementacji:
- meta tag w sekcji <head>: <meta name=”robots” content=”noindex”>
- nagłówek HTTP X-Robots-Tag: noindex (przydatny dla plików PDF, obrazków i stron, w których nie można edytować HTML)
Można łączyć dyrektywy:
- <meta name=”robots” content=”noindex, nofollow”> – noindex blokuje indeksowanie, nofollow mówi botowi, aby nie podążał za linkami
Kiedy stosować noindex:
- strony thank you / podziękowania po formularzach
- strony wewnętrznego wyszukiwania
- strony paginacji (kontrowersyjne – zależy od strategii)
- strony z thin content bez wartości dla SEO
- tymczasowe strony (staging, draft)
- strony z duplicate content, które nie mogą być skonsolidowane canonicalem
- panele administracyjne i zalogowane sekcje
Ważna różnica:
- noindex ≠ blokada w robots.txt
- robots.txt blokuje crawlowanie – bot nie odwiedza strony
- noindex pozwala botowi odwiedzić stronę, ale mówi mu „nie dodawaj do indeksu”
Krytyczny błąd:
- blokowanie strony w robots.txt i dodanie noindex
- bot nie zobaczy noindex, bo nie może crawlować strony, więc może ją mimo wszystko zaindeksować (np. jeśli inne strony do niej linkują)
Google potwierdził, że strony z noindex, które nie są crawlowane przez dłuższy czas, tracą przekazywanie wartości linkowej. Dlatego noindex powinien być stosowany świadomie – dla stron, które celowo chcesz wykluczyć z wyników wyszukiwania, nie jako „łatka” na problemy z treścią.
Szukasz konsultanta SEO dla firm SaaS i B2B? Zobacz, jak mogę pomóc Twojej firmie rosnąć dzięki SEO.
Ekspert SEO, który od blisko dekady buduje strategie pozycjonowania dla firm SaaS i nie tylko - takie, które działają mimo ciągłych zmian algorytmów i rosnącej roli AI w wyszukiwaniu.
