Jeśli prowadzisz stronę internetową lub bloga, na pewno zależy Ci na dobrej widoczności w wyszukiwarkach. Ale co, jeśli chcesz świadomie ukryć niektóre podstrony przed Google? Właśnie do tego służy znacznik noindex – jedno z podstawowych narzędzi w arsenale każdego specjalisty SEO.
Noindex to dyrektywa, która mówi robotom wyszukiwarek: „nie indeksuj tej strony”. To oznacza, że dana podstrona nie pojawi się w wynikach wyszukiwania – nawet jeśli zawiera unikalną treść, wartościowe informacje czy słowa kluczowe.
Dyrektywę noindex można zastosować na dwa sposoby:
<meta name="robots" content="noindex">
2. W nagłówkach HTTP (przy serwowaniu strony z serwera):
X-Robots-Tag: noindex
Choć ukrywanie treści przed Google może wydawać się sprzeczne z celem SEO, są sytuacje, kiedy to najlepsze możliwe rozwiązanie. Oto kilka przykładów:
Nie myl noindex z nofollow. Ten drugi mówi robotom, by nie podążały za linkami na stronie – ale sama strona nadal może być indeksowana. Często spotyka się połączenie obu: noindex, nofollow
, ale warto zrozumieć ich działanie osobno.
Najprostsze sposoby:
<meta name="robots"
.W ramach własnych działań badawczo-analitycznych przeprowadziliśmy szeroko zakrojone skanowanie ponad 1 000 000 polskich stron internetowych, wykorzystując nasze autorskie narzędzie do analizy kodu źródłowego.
W wyniku tego badania wykryliśmy ponad 5 000 aktywnych adresów URL stron komercyjnych, które miały ustawiony tag noindex
– mimo że ich treść i struktura jednoznacznie wskazywały, że powinny być widoczne w wynikach wyszukiwania.
Co ciekawe, w aż 90% przypadków były to strony oparte na WordPressie. Analiza wskazuje, że najczęściej noindex
został dodany na etapie projektowania witryny – co jest uzasadnione technicznie, by uniknąć przedwczesnej indeksacji wersji roboczej. Niestety, później został przypadkowo pozostawiony przez twórcę strony i tak trafił do wersji produkcyjnej.
Efekt? Gotowa strona trafia do internetu, ale nigdy nie pojawia się w Google, mimo że właściciel inwestuje w treści, pozycjonowanie czy kampanie marketingowe.
To realny, a jednocześnie zaskakująco częsty błąd – i jedno z najlepiej ukrytych zagrożeń dla widoczności strony.
Noindex to dyrektywa dla robotów wyszukiwarek, która mówi im, aby nie dodawały danej strony do indeksu. Można ją dodać za pomocą tagu meta w kodzie HTML lub przez nagłówek HTTP.
Warto go używać na stronach tymczasowych, technicznych, zduplikowanych, stronach polityki prywatności lub podziękowaniach za formularz. Wszystkich, które nie wnoszą wartości SEO i nie powinny pojawiać się w wynikach wyszukiwania.
Tak. Jeśli znacznik noindex zostanie nieświadomie pozostawiony na stronie produkcyjnej, może całkowicie wykluczyć ją z wyników wyszukiwania Google — nawet jeśli strona zawiera unikalną i wartościową treść.
Można to zrobić przez analizę kodu źródłowego (Ctrl+U), wyszukiwanie meta tagów „robots”, korzystając z Google Search Console, testowania adresów URL lub rozszerzeń SEO w przeglądarce.
W ramach naszego badania przeanalizowaliśmy kod źródłowy ponad 1 miliona polskich stron internetowych, używając autorskiego narzędzia. Wykryliśmy ponad 5 tysięcy przypadków nieświadomego użycia noindex — głównie w WordPressie, gdzie znacznik został pozostawiony przez pomyłkę przez wykonawcę strony.