preloader
Wypełnij formularz
Przygotujemy dla Ciebie bezpłatną wycenę!

Dodatkowo otrzymasz bezpłatnie dostęp do kursów z marketingu internetowego.


Co to jest adresacja kanoniczna i do czego służy?

Co to jest adresacja kanoniczna i do czego służy?

Google nie lubi powielania treści – zarówno tych zewnętrznych, umieszczonych na różnych witrynach, jak i wewnętrznych, znajdujących się w obrębie tej samej strony www. Na szczęście w walce z duplikatami wewnętrznymi nie jesteśmy sami – mamy sprzymierzeńca w postaci adresacji kanonicznej.

Problem kanoniczności podstron

Algorytmy wyszukiwarki Google są wyczulone na powielenia z prostej przyczyny – Google ma za mało zasobów, by indeksować wszystkie strony internetowe. Jeszcze kilka lat temu roboty Google indeksowały możliwie jak największą liczbę adresów URL w sieci, pozyskując je z różnych źródeł. Wśród tego typu źródeł znajdowały się:

  1. Linki prowadzące do strony – stanowiące jasny sygnał dla robota, że powinien odwiedzić witrynę. W tej kwestii wiele się do dziś nie zmieniło.
  2. Zgłoszenie strony w GSC, dodanie jej do kolejki indeksowania – Google uznało, że to najlepszy sposób powiadomienia o nowych podstronach w witrynie i swego czasu udostępniło nawet narzędzie do indeksowania nowych adresów dostępne bez logowania. Obecnie narzędzie to zostało przeniesione do GSC (jest dostępne dla właścicieli usług po zalogowaniu) i ma spore limity użycia dziennego.
  3. Dodanie wzmianki o stronie – w formie zwykłego tekstu bez linku – czasem tyle wystarczyło, by strona wskoczyła do indeksu. Ten sposób jednak już od dawna nie działa.
  4. Pobieranie linków z usług Google – czasem wystarczyło wysłać link Gmailem i Google w jakiś cudowny sposób dowiadywał się o danej stronie. Mocno komplikowało to prace nad wersjami testowymi witryn. Obecnie, jak nietrudno się domyślić, ta funkcja nie działa.
  5. Korzystanie z historii i zakładek w Google Chrome – dzięki dodaniu strony do zakładek wcześniej niezaindeksowane witryny pojawiały się w indeksie. Obecnie ta opcja prawdopodobnie nie działa.

Jak widać, sposobów na zaproszenie robotów było mnóstwo, a sam Google chciał indeksować wszystko i wszędzie, więc bez problemu w indeksie (najpierw w podstawowym, po jakimś czasie w dodatkowym) pojawiały się powielone treści, automatycznie generowane strony tagów czy kalendarzy.

Pewnego dnia okazało się jednak, że Google ma problem, ponieważ strony zgłaszane do indeksacji nie pojawiały się tygodniami w indeksie. Na początku Google zaprzeczył, a po jakimś czasie ogłosił, że nie będą indeksować każdej podstrony w każdej witrynie. W efekcie z indeksu zaczęły znikać strony słabej jakości (oznaczone przez Pandę, Pingwina, Disavow itp.) oraz powielone treści.

Google wprowadziło też budżet crawlowania, czyli liczbę stron, które są w stanie odwiedzić dla danej witryny. Dla każdej strony ta wartość jest inna. Trzeba wykonać sporo pracy, by ją zmienić.

Wprowadzono też pojęcie strony kanonicznej, czyli takiej, którą odwiedził i zaindeksował robot wyszukiwarki. Jest to witryna, którą wybrał, by pokazać ją w wynikach wyszukiwania. Ma to znaczenie przede wszystkim wtedy, gdy mamy kilka stron z tą samą zawartością oraz kilka adresów URL prowadzących do tej samej strony. Jak to możliwe? Przykładem może być strona kategorii dostępna pod adresem:

https://www.example.com/jakas-kategoria

oraz możliwość sortowania produktów wraz z dostępem z innego adresu URL np.:

https://www.example.com/jakas-kategoria?sort=cena

https://www.example.com/jakas-kategoria?sort=kolor

https://www.example.com/jakas-kategoria?sort=id

Technicznie rzecz biorąc, mamy tę samą treść (produkty, tekst) dostępną pod kilkoma adresami URL – czyli klasyczny przykład wewnętrznego powielania treści.

Niektóre systemy CMS generują różne adresy URL w zależności od tego, gdzie znajduje się dany użytkownik np.:

https://www.example.com/jakis-produkt

https://www.example.com/nowosci/jakis-produkt

https://www.example.com/promocje/jakis-produkt

Dodatkowo produkt ten ma przyjazny adres URL https://www.example.com/jakis-produkt oraz widoczny dla systemu URL nieprzyjazny np. https://www.example.com/54212314wesvd. Wystarczy tylko błąd w konfiguracji albo wykorzystanie tego nieprzyjaznego URL przez jakiś moduł, aby został on upubliczniony dla użytkowników i robotów…

Co to jest adresacja kanoniczna i dlaczego jest taka ważna

 Adresacja kanoniczna wskazuje na stronę, która jest pierwowzorem treści, i pomaga algorytmom zrozumienie wyszukiwarki Google, np. które podstrony powinny znaleźć się w indeksie, a które nie.

Dzięki adresacji kanonicznej możemy pozbyć się powieleń wewnętrznych, które powstały na skutek działania naszego skryptu. Canonicale zabezpieczają nas też przed automatycznym kopiowaniem całej struktury strony przez roboty, które kopiują cały kod źródłowy stron www i umieszczają go na innej domenie, dodając tam złośliwe skrypty czy reklamy. Jeśli w tym kodzie znajdzie się link wskazujący pierwowzór treści, algorytmy wyszukiwarki pominą indeksowanie skopiowanej podstrony, ponieważ od razu będą wiedziały, który adres jest oryginałem.

Linki kanoniczne stanowią też zabezpieczenie przed wszelkiego rodzaju literówkami, które zostały umieszczone umyślnie lub nieumyślnie przez użytkowników. Przykładowo dla adresu https://www.example.com/jakis-produkt-id-123456 użytkownik może skopiować jedynie fragment adresu URL np. https://www.example.com/jakis-produkt. Natomiast w przypadku braku ustawionych przekierowań bez www -> www można wygenerować adresy, które stanowią powielenie wewnętrzne:

https://example.com/jakis-produkt-id-123456

http://www.example.com/jakis-produkt-id-123456

https://ww.example.com/jakis-produkt-id-123456

Dodając dla takiego adresu linkowanie kanoniczne, zabezpieczamy witrynę przed powstaniem powieleń wewnętrznych.

Jak sprawdzić, czy na stronie jest włączona adresacja kanoniczna

Najprostszym sposobem weryfikacji jest zajrzenie do jej kodu wynikowego HTML, który widzi przeglądarka. W tym celu wystarczy użyć kombinacji klawiszy CTRL + U i odnaleźć sekcję HEAD dokumentu HTML. Znajduje się ona na górze. Wewnątrz tej sekcji powinna znaleźć się informacja o adresie kanonicznym.

Alternatywnie możemy użyć wyszukiwarki w kodzie HTML. Po wybraniu CTRL + U klikamy CTRL + F i wpisujemy „canonical”, potwierdzając enterem. Nasza przeglądarka przeniesie nas do linii, w której znajduje się ta dyrektywa, o ile została ona użyta na naszej stronie www.

Jak wstawić link kanoniczny na mojej stronę www

Link kanoniczny możemy umieścić na dwa sposoby. Pierwszy z nich to dodanie go do sekcji head dla wybranej przez nas podstrony, a drugi – przekazanie adresu kanonicznego w nagłówku żądania HTTP.

Należy jednak pamiętać, by każda podstrona serwisu miała swój unikalny adres kanoniczny – nie można dodać jednego adresu dla całej domeny. Większość znanych systemów CMS (np. WordPress) sama dba o poprawną adresację kanoniczną w serwisie, więc w tym przypadku niewiele trzeba zrobić – wystarczy się upewnić, że adresacja kanoniczna znajduje się na stronie.

Pierwszy sposób jest najczęściej spotykany i odpowiada za 99% wdrożeń, gdyż jest najwygodniejszy w implementacji. W celu wstawienia adresu kanonicznego w kodzie należy w sekcji head umieścić następującą linię kodu:

<link rel=”canonical” href=”[adres strony z pierwowzorem treści” />

Wskazany przez nas adres powinien być podlinkowany poprzez link bezwzględny, czyli zawierający protokoły i domenę, np. https://example.com/jakis-produkt-id-123456.

Drugim ze sposobów na dodanie adresacji kanonicznej do strony jest przesłanie linku kanonicznego w nagłówku żądania HTTP. Można to zrobić, wstawiając następujący kod:

link: < https://example.com/jakis-produkt-id-123456 >; rel=”canonical”

Dlaczego warto dodawać linki kanoniczne w ten sposób? Odpowiedź jest prosta – możemy dzięki temu zarządzać adresacją kanoniczną dla plików, np. PDF, gdzie nie ma możliwości ustawienia adresacji kanonicznej w kodzie HTML.

W celu dodania takiej dyrektywy wystarczy fragment kodu:

<Files „produkty-123456-instrukcja-PL.pdf”>

Header add Link „< https://example.com/jakas-instrukcja-id-123456  >; rel=\”canonical\””

</Files>

Kanoniczne adresy URL – jak do tego podejść

Adresacja kanoniczna rządzi się swoimi prawami. Warto ich przestrzegać, by struktura naszej witryny widoczna dla robotów wyszukiwarek była spójna. Przede wszystkim należy pamiętać, by adres kanoniczny miała każda podstrona na naszej witrynie.

Domyślnym rozwiązaniem dla każdej podstrony jest włączenie na niej adresacji kanonicznej. Jeśli mamy stronę produktu: https://example.com/jakis-produkt-id-123456, to powinna mieć ona w swoim kodzie zaszytą informację o wersji kanonicznej, czyli https://example.com/jakis-produkt-id-123456.

Wchodząc na tę stronę z dowolnym parametrem, powinniśmy w znaczniku kanonicznym otrzymać wersję strony bez parametrów, czyli dla https://example.com/jakis-produkt-id-123456?parametr=wartosc&inny_parametr=inna_wartosc adres kanoniczny powinien wyglądać następująco: https://example.com/jakis-produkt-id-123456.

Oczywiście dla produktu https://example.com/jakis-produkt-id-333444 adres kanoniczny powinien wskazywać na https://example.com/jakis-produkt-id-333444 zarówno dla jego głównego adresu, jak i tego z parametrami. Mając więc w witrynie łącznie tysiąc adresów URL, powinniśmy też mieć tysiąc adresów kanonicznych.

W większości popularnych systemów CMS, np. WordPress, zarządzanie adresacją kanoniczną odbywa się automatycznie. To skrypt dba o to, by każdy adres miał swój kanoniczny odpowiednik. Jak wcześniej wspomniano, adresy kanoniczne umieszczane są w sekcji head podstrony lub (znacznie rzadziej) w nagłówku HTTP. To pierwsze rozwiązanie wykorzystywane jest przez większość najpopularniejszych systemów CMS.

Umieszczanie adresów kanonicznych na stronach sortowania i filtrowania

Podstrony kategorii w sklepie internetowym są jednymi z najczęściej odwiedzanych przez użytkownika. W większości przypadków mają one mechanizmy, które pozwalają na sortowanie i filtrowanie wyników np. z użyciem jakiejś cechy. Oba te typy adresów należy koniecznie zabezpieczyć z użyciem adresu kanonicznego, gdyż stanowią powielenie głównej zawartości podstrony. Filtrowanie i sortowanie to nic innego jak przedstawienie tego samego asortymentu w sklepie w nieco inny sposób.

Podobnie rzecz się ma, jeśli chodzi o dość popularny widok produktów w formie listy oraz kafelków. Kolejnym ustawieniem, które na stronie kategorii może spowodować powielenie treści. Mowa tutaj o prezentacji liczby wyników na stronie. Zwykle użytkownik może wybrać, czy chce zobaczyć 10, 20, 50 czy 100 wyników na jednej podstronie.

Wszystkie wyżej wymienione przypadki powinny zostać rozwiązane w ten sam sposób – poprzez dodanie odnośnika kanonicznego do głównej podstrony kategorii. Nie ma znaczenia sposób zapisu adresu URL, więc dla https://example.com/jakas-kategoria?sort=cena_min oraz dla https://example.com/jakas-kategoria/wyniki/100 adres kanoniczny powinien być taki sam, czyli https://example.com/jakas-kategoria.

Adresy kanoniczne na stronie produktów

Podstrony produktowe powinny mieć przemyślaną strategię dotyczącą adresacji kanonicznej. Przede wszystkim należy zacząć od tego, by każdy produkt w wersji bazowej miał adres kanoniczny, który prowadzi do strony tego produktu. Taki self-canonical to podstawa do dalszych działań, dzięki niemu wszystkie ewentualne parametry zostaną kanonicznie przekierowane na główną wersję produktu.

Głównym problemem, który dotyka stron produktowych, jest mnogość wariantów jednego produktu. Często dany produkt, np. koszulka, jest dostępny w wielu wariantach (np. rozmiarach S, M, L, XL, XXL) czy kolorach (pomarańczowy, zielony, niebieski, żółty, biały). Łącznie daje nam to aż 25 możliwych kombinacji (pomarańczowy XXL, niebieski XXL, biały XXL, … pomarańczowy S, niebieski S, biały S). Produkty te niczym nie różnią się dla wyszukiwarki, mają jedynie nieco inny kolor lub rozmiar.

Rozwiązaniem tego problemu może być adresacja kanoniczna. Na etapie projektowania strony można wdrożyć następujące rozwiązanie:

  1. Tworzymy główny wariant danego produktu, np. koszulka sportowa Nike. Umieszczamy na tej stronie główny, podstawowy wariant, np. biały L. Produkt jest dostępny pod adresem https://example.com/koszulka-nike.
  2. Tworzymy warianty produktu dla każdej pary kolor-rozmiar, zachowując adresację produktu, i umieszczamy je pod adresem: https://example.com/koszulka-nike?kolor=pomaranczowy&rozmiar=XXL.
  3. Za pomocą adresacji kanonicznej wskazujemy każdy adres z parametrami na adres główny produktu.

Dzięki temu mamy kilka wariantów tego samego produktu. Co więcej, każdy z nich może mieć ten sam opis, bo i tak kanonicznie wskazują na podstawowy wariant produktu.

Problem zaczyna się wówczas, gdy co najmniej dwie wersje produktu mają większą wyszukiwalność niż pozostałe. W przypadku pary kolor-rozmiar taka sytuacja ma najczęściej miejsce przy kolorach białym i czarnym, rozmiarach M oraz L (trzeba to oczywiście zweryfikować za pomocą narzędzi). Rozwiązaniem tego problemu jest „odbezpieczenie” niektórych wariantów produktu. Wówczas mamy wariant podstawowy biały L, na który kanonicznie wskazują wszystkie inne warianty oprócz białego L, czarnego M i czarnego L. Te trzy warianty powinny mieć ustawione adresy kanoniczne wskazujące na siebie oraz poprawiony i rozbudowany opis produktu.

Adresacja kanoniczna na podstronach paginacji oraz stronach błędu

Należy być bardzo ostrożnym podczas implementacji adresacji kanonicznej w swoim serwisie internetowym. Canonicale mają dużą moc i mogą przenieść reputację podstrony na inną stronę. Szczególnie należy uważać na strony błędu – „strona, której szukasz, nie została odnaleziona”. Zwykle zwracają one kod HTTP 404. Należy upewnić się, czy w tym przypadku:

  1. Strona ma canonical, który prowadzi do samej siebie, czyli na https://www.example.com/404 wskazuje na https://www.example.com/404.
  2. Strona błędu nie ma żadnego adresu kanonicznego.

Jeśli adres kanoniczny na takiej stronie błędu będzie wskazywać na inną podstronę, istnieje prawdopodobieństwo, że Google podąży za taką wskazówką i sprawi, że docelowa strona również zostanie uznana za pozorny błąd 404 i wyindeksowana.

Nieco inaczej sprawa się ma, jeśli chodzi o strony paginacji, np. dla kategorii produktów czy listy wpisów. Zwykle adresy takich stron to https://example.com/jakas-kategoria?p=1, https://example.com/jakas-kategoria?p=2 itp.

W tym przypadku poza pierwszą stroną paginacji obowiązują podstawowe zasady tworzenia znaczników kanonicznych, z tym że stroną bazową będzie każda podstrona paginacji. Oznacza to, że przykładowo strona https://example.com/jakas-kategoria?p=2 powinna wskazywać kanonicznie na https://example.com/jakas-kategoria?p=2, a strona https://example.com/jakas-kategoria?p=2 na https://example.com/jakas-kategoria?p=2. W przypadku dalszych parametrów, np. sortowania czy filtrowania, należy wskazać stronę bazową. W naszym przykładzie strona https://example.com/jakas-kategoria?p=2&sort=cena_min powinna wskazać na https://example.com/jakas-kategoria?p=2.

Pierwsza podstrona paginacji (https://example.com/jakas-kategoria?p=1) nie może wskazywać na samą siebie, gdyż mamy tutaj do czynienia z powieleniem treści z produktami znajdującymi się na głównej kategorii. Musimy więc, dla tej pierwszej strony, wskazać kanonicznie główną stronę kategorii. Podstrona https://example.com/jakas-kategoria?p=1 powinna kanonicznie wskazywać na https://example.com/jakas-kategoria. Podobnie rzecz się ma, jeśli chodzi o parametry – strona https://example.com/jakas-kategoria?p=1&sort=cena_min powinna wskazywać na https://example.com/jakas-kategoria.

Canonical a mobilna wersja strony www

Adresacja kanoniczna odgrywa bardzo ważną rolę podczas implementacji mobilnej wersji strony. Przypadek, o którym mowa, występuje tylko wówczas, gdy wersja strony www na komputery jest dostępna pod adresem https://www.example.com, a wersja strony na urządzenia mobilne znajduje się pod adresem https://m.example.com. Przyjmijmy też, że obie strony mają taką samą strukturę i treści przeniesione 1:1.

Zgodnie z zaleceniami Google powinniśmy wprowadzić dwie poprawki w kodzie wszystkich podstron wersji desktopowej i mobilnej.

  1. Na każdej podstronie w wersji desktopowej (https://www.example.com) w jej sekcji head powinniśmy dodać tag link alternate, który wskazuje na odpowiednik danej podstrony w wersji mobilnej.
  2. Na każdej podstronie wersji mobilnej (https://m.example.com) należy umieścić kanoniczny odnośnik, który wskazuje daną podstronę w wersji desktopowej. W naszym przykładzie https://m.example.com wskaże na https://www.example.com, a https://m.example.com/jakas-kategoria na https://www.example.com/jakas-kategoria.

Dzięki zastosowaniu takiej kombinacji adresów kanonicznego i alternatywnego treści na wersji desktopowej i mobilnej dostępne pod różnymi adresami nie będą uznawane za powielenie treści.

Wpływ adresów kanonicznych na indeksowanie stron

Adresacja kanoniczna odgrywa też szczególnie ważną rolę w procesie selekcji kandydatów do umieszczenia w indeksie wyszukiwarki Google. Jak wiadomo, obecnie występują spore problemy z indeksacją podstron. Roboty Google nie chcą ich odwiedzać i umieszczać w indeksie, zmniejsza się również crawl budget, coraz mniej nowych treści umieszczanych jest w indeksie wyszukiwarki i coraz dłużej trwa proces indeksacji podstrony.

Dzięki poprawnemu zastosowaniu adresacji kanonicznej algorytmy wyszukiwarki Google wiedzą, które podstrony są ważne, a które są wskazane przez użytkownika jako mało istotne. Dlatego też stosowanie adresacji kanonicznej pomoże w umieszczeniu w indeksie Google stron, na których najbardziej nam zależy, kosztem duplikatów podstron wynikających np. z sortowania czy filtrowania.

Adresacja kanoniczna a mapa witryny

Warto wspomnieć o tym, że podczas budowania mapy witryny w formie pliku xml również należy korzystać z adresacji kanonicznej. Google zaleca, by strony, które umieszczamy w mapie xml, były kanonicznymi adresami URL.

Mapa xml również stanowi spore wsparcie dla robotów i algorytmów wyszukiwarki Google w procesie indeksowania, dlatego należy zadbać o to, by nie umieszczać w niej adresów, które wskazują kanonicznie na inny adres URL.

Adresy kanoniczne w Google Search Console

Google uznaje adresację kanoniczną za bardzo ważny element, o którym należy informować webmasterów, dlatego też publikuje różne dane dotyczące witryny i zawartych w niej linków kanonicznych w narzędziu Google Search Console będącym łącznikiem pomiędzy właścicielami stron a Google.

W zakładce indeks strony możemy sprawdzić, jak roboty indeksujące Google analizują nasze adresy kanoniczne. Z uwagi na to, że tag kanoniczny to tylko wskazówka, może on być różnie interpretowany przez algorytmy Google. Search Console prezentuje tam następujące kategorie błędów powiązane z danymi kanonicznymi:

  • Alternatywna strona zawierająca prawidłowy tag strony kanonicznej – jest to informacja, że dana strona adresem kanonicznym wskazuje na inną podstronę. Może to być strona sortowania, filtrowania bądź inny przypadek, gdy to użytkownik wskazał dres kanoniczny, a Google tą wskazówkę zaakceptował – w tym przypadku nie ma konieczności podjęcia żadnych dodatkowych działań, o ile adresacja kanoniczna jest w serwisie zaprojektowana prawidłowo.
  • Duplikat, użytkownik nie oznaczył strony kanonicznej – jest to błąd, który oznacza, że dana strona nie ma znacznika kanonicznego. Należy sprawdzić jakie to podstrony i umieścić w nich linki kanoniczne. W tej kategorii Google Search Console pokazuje tylko adresy, które zwracają kod HTTP 200.
  • Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik – ta grupa stron powinna zostać przeanalizowana przez nas bardzo dokładnie, gdyż wskazane tam strony mają ustawiony adres kanoniczny, ale z pewnych powodów Google wybrało inną stronę jako kanoniczną.

W przypadku wystąpienia błędów należy przeanalizować każdą stronę z osobna. Pierwszym krokiem jest otwarcie listy stron i szybka analiza, jakie typy podstron (paginacja, filtry) są pokazane jako błędne. Następnie należy dla każdego z takich typów wybrać jedną stronę i pobrać o niej dane z indeksu. Ta czynność może trochę potrwać, ale w rezultacie otrzymujemy komplet danych o konkretnej podstronie, w tym kilka adresów kanonicznych: zaproponowany przez użytkownika i wybrany przez Google.

Podsumowanie

Adresacja kanoniczna jest bardzo ważna, aby zarządzać pulą podstron, które Google umieści w indeksie. Odpowiednio przygotowana adresacja kanoniczna pozwala osiągnąć spore wzrosty, a adresacja, która jest zbudowana niepoprawnie, może hamować i niwelować efekty prac nad stroną.

Z uwagi na to, że Google ma coraz mniej czasu i zasobów na indeksację stron, warto popracować nad poprawnymi linkami kanonicznymi i dbać o nie, doglądając je w narzędziu Google Search Console. Dzięki temu unikniemy indeksacji niechcianych podstron, co w obecnych czasach jest niezwykle ważne.

Kursy z marketingu internetowego online!

Zarejestruj się do bezpłatnej platformy.

Dołącz do newslettera i otrzymuj regularną dawkę wiedzy oraz ciekawostek ze świata digital marketingu!

Z naszą pomocą zawsze będziesz na bieżąco – bez spamu!

Poznaj historie, które odmienią Twój biznes

Oglądaj na YouTube!