Narzędzia do sprawdzania powielonej treści
Spis treści:
Dbanie o unikalność contentu jest jednym z ważniejszych zadań w codziennej pracy związanej z pozycjonowaniem stron internetowych. Treść oraz jej optymalizacja to jedne z kluczowych obszarów pracy nad stroną w kontekście SEO. Sporą część czynności związanych z analizą strony wykonuje się ręcznie. Można w tym celu użyć programów, które nieco ułatwią weryfikację powieleń treści na stronie.
Segment treściowy strony obejmuje wiele prac związanych z doborem i umieszczeniem fraz kluczowych oraz konstrukcją i redakcją tekstu. Osobnym etapem jest praca nad treścią w kontekście jej unikalności.
W poprzedniej części wpisu: Audyt powielonej treści na stronie internetowej opisano jak wykonywać audyt treści. W pierwszej części: Duplikacja treści – największy wróg SEO pokazano jak ręcznie sprawdzić, czy treść jest powielona. Opisane poniżej narzędzia pomogą w weryfikacji, czy dany fragment treści jest unikalny.
Wiele z czynności, które na co dzień wykonujemy w trakcie procesu pozycjonowania, to prace powtarzalne. Sporo kwestii jest dość prostych w zaprogramowaniu, stąd też wiele rzeczy da się zautomatyzować.
Proces automatyzacji w pozycjonowaniu obejmuje tworzenie oprogramowania, które pomoże w szybszym wykonaniu codziennych zadań. Aplikacje te działają w sposób automatyczny (podają wynik działania) lub półautomatyczny (wykonują tylko część zadań i wymagają nadzoru). W każdym z tych przypadków konieczna jest jeszcze analiza wyników przez specjalistę ds. pozycjonowania.
Aplikacje do kontroli powielenia treści
Pierwszą grupą narzędzi, o których warto wspomnieć, są aplikacje, których zadaniem jest sprawdzenie, czy dana treść jest unikalna. Działanie tych webowych programów jest dość proste i ogranicza się do przedstawienia wyników wyszukiwania dla zadanego fragmentu treści.
Testy narzędzi będziemy przeprowadzać za pomocą strony internetowej, dzięki której każdy może wygenerować fragment treści „lorem ipsum”, służącej do prezentacji graficznej wersji treści w sieci.
Duplicate Content Checker
Narzędzie to posiada dwa tryby analizy powielonego tekstu. Pierwszy z nich sprawdza treść na podstawie podanego przez użytkownika adresu URL. Drugi umożliwia wklejenie treści i sprawdzenie, czy jest ona unikalna.
Użytkownik może przed sprawdzeniem wybrać dodatkowe opcje, czyli ilość fragmentów treści, którą sprawdza narzędzie. Przed uruchomieniem testu konieczne jest jeszcze rozwiązanie CAPTCHA lub rejestracja, która umożliwia wykonywanie większej liczby odpytań.
Wynikiem działania narzędzia jest lista powielonych adresów, która przypomina stronę wyników wyszukiwania Google. Możemy zobaczyć powielony fragment treści oraz sprawdzić, które z fragmentów treści zostały wybrane przez narzędzie. Sami nie możemy decydować o tym, które fragmenty treści zostaną sprawdzone.
Dla badanego adresu URL narzędzie znalazło 10 kopii treści oraz poinformowało o dużej liczbie kopii (większej niż 5).
Narzędzie jest darmowe i można je znaleźć pod adresem: https://www.seoreviewtools.com/duplicate-content-checker/ .
Duplichecker
Aplikacja ta ma trzy tryby sprawdzania powieleń dla fragmentu treści. Pierwszym z nich (domyślnym) jest możliwość wklejenia treści, która ma być sprawdzana. Drugi tryb to możliwość wgrania pliku z tekstem – akceptowane formaty to między innymi txt, doc czy odt. Trzeci tryb pozwala na sprawdzenie powieleń dla zadanego adresu URL.
Narzędzie nie ma żadnych dodatkowych opcji konfiguracyjnych, jego obsługa jest bardzo prosta. Warto wspomnieć o tym, że Duplichecker potrafi też sprawdzać poprawność zapisanych słów – sprawdza literówki, ale tylko w języku angielskim.
Po wybraniu opcji analizy za pomocą adresu URL, narzędzie samo kopiuje z niej treść do głównego pola, jednocześnie pokazując błąd, który informuje nas o tym, że narzędzie przetwarza jedynie 100 słów dla pojedynczego zapytania. Należy więc ręcznie poprawić tekst, usuwając nadmiarowe słowa z treści.
Wynikiem pracy narzędzia jest lista stron, które posiadają powieloną treść wraz z zaznaczeniem, które jej fragmenty są powielone, a które unikalne. Dla każdego wyniku otrzymujemy też statystyki. Dzięki zasugerowanym przez narzędzie odnośnikom możemy też poprawić treść w edytorze tworzącym synonimy oraz wykonać inne akcje – skorzystać z innych narzędzi.
Dla naszego testowego fragmentu treści narzędzie znalazło 3 powielenia. Adres, pod którym narzędzie jest dostępne to: https://www.duplichecker.com/.
QUEtext
Narzędzie QUEtext działa na podobnej zasadzie, co dwa opisywane wcześniej narzędzia. Jego zadaniem jest również sprawdzenie, czy na innych stronach nie ma powielonego fragmentu treści, którą do narzędzia wkleił użytkownik. Aplikacja nie ma żadnych innych trybów czy dodatkowych opcji konfiguracyjnych. Możliwe jest jedynie wklejenie fragmentu treści, który chcemy sprawdzić pod kątem powieleń.
Po wklejeniu fragmentu treści narzędzie informuje nas o konieczności zalogowania się lub utworzenia konta. Rejestracja w narzędziu jest prosta, wymaga podania adresu e-mail oraz hasła. Nie jest możliwe zalogowanie się z pomocą konta Google lub loginem na portalach społecznościowych.
Zasada działania narzędzia jest bardzo intuicyjna. W pierwszym kroku wysłana do narzędzia treść jest dzielona na zdania. W kolejnym kroku sprawdzane są powielenia dla każdego zdania z osobna.
Narzędzie za każdym razem pokazuje tylko jeden wynik, który ma stanowić informację, czy dane zdanie jest powielone, czy unikalne.
Dla testowego przykładu znaleziono więc 1 powielenie. Aplikacja jest dostępna pod adresem: https://www.quetext.com/.
Small SEO Tools – Plagiarism Checker
Pakiet narzędzi Small SEO Tools to wciąż udoskonalany i rozbudowywany zbiór mini narzędzi, które mogą być pomocne w codziennej pracy nad pozycjonowaniem strony internetowej. Strona zawiera kilka sekcji z narzędziami, podzielonymi na różne kategorie. W grupie związanej z analizą i przetwarzaniem treści mamy obecnie 17 narzędzi. Jedno z nich potrafi sprawdzać powielenie treści w wyszukiwarce Google.
Narzędzie Plagiarism Checker pozwala na sprawdzenie powieleń za pomocą fragmentu treści, który wystarczy wkleić bezpośrednio do pola tekstowego, które udostępnia to narzędzie. Inną metodą wprowadzania treści jest przesłanie pliku z treścią w formacie .tex, .txt, .doc, .docx, .odt, .pdf, .rtf.
Ostatnią metodą na wprowadzenie danych wejściowych do narzędzia jest podanie adresu URL, który ma zostać sprawdzony. W ramach dodatkowych opcji możemy również podać adres URL, który ma zostać wykluczony ze sprawdzania powieleń treści. Oprócz sprawdzenia powieleń możemy również sprawdzić poprawność pisowni dla danego fragmentu treści.
Narzędzie dzieli tekst na zdania i dla każdego z nich sprawdza powielenia treści w wyszukiwarce Google. Dodatkowo Plagiarism Checker pokazuje, z jakich stron znaleziono powielenie i podaje procentową wartość powielonej zawartości strony.
Dla testowego fragmentu narzędzie znalazło 4 powielenia. Adres URL aplikacji to: https://smallseotools.com/plagiarism-checker/.
Copyscape
Aplikacja Copyscape to już legenda, jeśli chodzi o sprawdzanie powieleń treści. Narzędzie jest obecne na rynku od wielu lat i jest szeroko wykorzystywane przez wielu specjalistów w swojej codziennej pracy.
Interfejs narzędzia jest bardzo prosty – składa się z pola tekstowego do wklejenia adresu URL docelowej strony oraz przycisku GO. Nie ma innych metod wprowadzania treści do narzędzia oraz dodatkowych opcji, co sprawia, że korzystanie z aplikacji jest szybkie.
Wynikiem pracy narzędzia jest lista adresów URL, które posiadają powieloną treść z naszej strony. Narzędzie pokazuje maksymalnie 10 takich wyników. Aby zobaczyć więcej, należy wykupić wersję premium.
Copyscape w wersji darmowej odnalazł minimum 10 powielonych adresów. Narzędzie jest dostępne pod adresem https://www.copyscape.com/.
Siteliner
Narzędzie Siteliner działa na innej zasadzie niż wcześniej opisywane aplikacje. Przede wszystkim sprawdza ono, czy treść z zadanej strony internetowej nie jest powielona nie tylko dla jednego fragmentu tekstu, pliku czy podstrony, ale dla wielu podstron serwisu. Wystarczy tylko podać domenę do sprawdzenia a narzędzie rozpocznie jej crawlowanie i skanowanie. Zebrane zostaną adresy URL z witryny i dla każdego z nich nastąpi weryfikacja unikalności contentu.
Siteliner potrafi automatycznie pominąć niektóre podstrony, na przykład takie, które są przekierowane lub zablokowane przed indeksacją. Sprawdzanie powieleń treści na takich stronach nie ma sensu.
Wynikiem pracy narzędzia jest tabela zawierająca podstrony, które mają powieloną treść zarówno zewnętrznie, jak i wewnętrznie. Od razu widzimy też procentowy udział powieleń oraz ich liczbę. Oprócz tego aplikacja informuje o zerwanych odnośnikach (broken links) oraz o zawartości podstron.
Każdy wynik możemy podejrzeć. Dzięki temu zobaczymy, które części strony są powielone, a które unikalne. Narzędzie wyróżnia je odpowiednio kolorem czerwonym i zielonym.
Również ta aplikacja ma swoje limity w wersji podstawowej, ale jest za to bardzo rozbudowana i pozwala na analizę wielu podstron jednocześnie. Sam proces oceny powielenia trochę trwa, ale zaprezentowane wyniki są bardzo czytelne. Adres URL narzędzia to: https://www.siteliner.com/.
Content Quality – narzędzie od Ahrefs.com
W ramach narzędzia ahrefs.com dostępy jest również raport, który zawiera informacje o powielonej treści w witrynie. Jego zlokalizowanie nie jest łatwe. W celu dotarcia do raportu Duplicate Content należy:
- Zalogować się na swoje konto Ahrefs.
- Z górnego menu wybrać pozycję Site Audit.
- Skonfigurować lub wybrać audyt dla odpowiedniej domeny.
- Wybrać konkretną instancję audytu, np. z danego dnia.
- Z bocznego menu wybrać pozycję Duplicates.
Raport podzielony jest na dwie części. Pierwsza z nich to podsumowanie dotyczące powielonej treści, którą znalazło narzędzie. Przedstawiona jest informacja o powieleniach znaczników title, opisów meta description, nagłówków H1 oraz treści. Kolorem zielonym oznaczono procentowy udział treści bez powieleń, kolor czerwony oznacza brak, np. treści lub nagłówka, a kolor pomarańczowy oznacza powielenie treści wykryte przez narzędzie.
Druga część raportu to klastry danych. Są one przedstawione w formie kolorowych kwadratów i reprezentują treść, która posiada adres kanoniczny (kolor zielony) oraz taką, która go nie posiada, oznaczoną kolorem czerwonym.
Po wybraniu jednego z kwadratów, który przedstawia dany klaster stron, zobaczymy jego zawartość będącą listą podstron. Dodatkowe dane o ruchu organicznym oraz adresie kanonicznym pozwolą na sprawdzenie jak ważna jest dana podstrona. Wybierając konkretny URL, przechodzimy do szczegółów, gdzie możemy zobaczyć ilość powieleń w danym fragmencie treści.
Screaming Frog
Popularny crawler SEO – Screaming Frog ma również możliwość sprawdzenia, czy treść na stronie jest unikalna. Domyślne ustawienia programu pozwalają na wykrycie powielenia treści podstrony w stosunku 1:1. Zabezpiecza to nas w czasie wykonywania audytu strony przed sytuacją, gdy gdzieś w obrębie naszej witryny występuje skopiowana cała treść. Screaming Frog pozwala też na szereg innych działań związanych z analizą powieleń treści strony. Większość z nich kryje się w zaawansowanych ustawieniach i nie jest włączona domyślnie.
Pierwszą z opcji, którą warto włączyć, jest wykrywanie powieleń przybliżonych. Opcja ta jest do włączenia w menu config -> content -> duplicates. W tym miejscu można ustawić wykrywanie duplikatów przybliżonych – wówczas crawler będzie szukał powieleń także wśród podstron, które nie mają całej treści z innej naszej podstrony, a posiadają jedynie część z niej. Dodatkowo możemy określić jaki procent treści zostanie uznany za powielenie. W przypadku wybrania np. 80% – oznacza to, że obie sprawdzane strony muszą mieć 80% takiej samej treści, by zostało to zaraportowane jako powielenie. Ostatnią z opcji jest możliwość włączenia powyższych ustawień tylko dla stron, które są zaindeksowane przez roboty wyszukiwarki Google. Dzięki temu, w sytuacji, gdy jedna podstrona wskazuje inną linkiem kanonicznym i posiada taką samą treść, nie zostanie to rozpatrzone jako powielenie.
Algorytmy Screaming Froga potrafią wykluczyć z analizy zarówno elementy nawigacyjne, takie jak menu czy stopka strony, jak i stałe przestrzenie, które są wspólne dla większości podstron, np. prawa bądź lewa kolumna z dodatkową nawigacją, wyszukiwarką itp. Dzięki temu możliwe jest skupienie swojej uwagi tylko na głównej treści podstrony. W przypadku witryn, które nie są budowane w oparciu o uniwersalne wzorce projektowe istnieje możliwość samodzielnego wykluczenia dowolnego fragmentu kodu z analizy powielonej treści na stronie internetowej. W tym celu można wskazać dowolną klasę CSS albo element HTML, który posiada ID. Fragmenty te będą przez algorytmy wykluczone i nie będzie na nich sprawdzana unikalność tekstu, co z jednej strony znacznie przyspieszy wynik analizy, a z drugiej pozwoli na osiąganie o wiele lepszych rezultatów.
Po wykonaniu crawla wyniki można zobaczyć w zakładce content. Informacje zebrane na temat powieleń treści są podzielone na 2 części. Exact duplicates pokazuje nam znalezione powielenia treści (dane tam zebrane są dostępne od razu po wykonaniu crawla). Near duplicates (wartość tę trzeba dodatkowo przeliczyć w ustawieniach) ma za zadanie pokazać powielenia, które nie stanowią 100% naszej treści. Za pomocą funkcji dostępnej z menu programu (crawl analysis) można uruchomić dodatkową analizę, a jej wyniki zobaczyć w tym samym miejscu, co duplikaty w wersji exact, czyli w zakładce content.
Tak zebrane dane można wyeksportować do dalszej analizy korzystając ze standardowych funkcji programu Screaming Frog SEO Spider.
Sitebulb
Oprogramowanie Sitebulb również posiada dość rozbudowany moduł, którego celem jest kontrola powielonych treści w obrębie witryny. Narzędzie może zdziałać wiele, jeśli chodzi o powielenie treści na stronach internetowych, a właściwie rzecz ujmując, w przypadku powieleń w obrębie badanej strony, gdyż możliwe jest znalezienie powieleń:
- znaczników title,
- nagłówków Hx,
- opisów meta description,
- adresów URL,
- zawartości podstron.
Sitebulb ma także możliwość (tak jak Screaming Frog) wyszukiwania powieleń treści, która nie jest kopią 1:1 innego tekstu, ale posiada różne zmiany. Narzędzie radzi sobie dość dobrze w wyszukiwaniu przybliżonych duplikatów strony.
Sitebulb umożliwia porównanie różnych wersji tej samej treści dzięki możliwości zestawienia dwóch podstron w porównaniu. Opcja ta jest szczególnie przydatna podczas próby analizy powielonych treści.
Podsumowanie
Wiele narzędzi SEO może być pomocnych podczas analizy powieleń treści na stronie internetowej. Istnieją różne typy narzędzi, które mają za zadanie pomóc w takiej analizie. Są to dedykowane narzędzia do oceny powieleń treści oraz moduły lub funkcje w popularnych crawlerach SEO.
W zależności od wybranego narzędzia możemy się oczywiście spodziewać różnych wyników. Wiele zależy też od próbki tekstu lub podstrony w naszym serwisie, którą chcemy przeanalizować za pomocą tych narzędzi.
Narzędzia przedstawione w tym artykule są zwykle darmowe (poza opisanymi na końcu crawlerami). Oznacza to, że do analizy podstawowych problemów ze stroną, jeśli chodzi o treść, jest dostępne oprogramowanie, które pomoże bezpłatnie zdiagnozować problem. Pozostaje tylko wybrać taką aplikację, która najlepiej nam odpowiada i zacząć korzystać.
Nie zamierzam oceniać merytoryki – jestem raczej laikiem w temacie… Jednak Twój styl wypowiedzi i ogólne poprowadzenie tematu mnie przekonuje i jak najbardziej na plus. Będę częściej tu zaglądał, pozdrawiam 🙂