Jak na duplicitu v SEO pomocí kanonizace (canonical)

Co je to kanonizace? Elegantní řešení na duplicitu stránek, které chceme nechat přístupné pro uživatele. Duplicita je velmi častý problém mnoha webů, zejména těch větších jako jsou e-shopy. Její řešení je v SEO zásadní záležitost a jednou z možností je právě kanonizace pomocí tagu canonical. Oba české vyhledávače jej podporují víceméně stejně, takže není důvod ji nepoužívat. Podívejme se na všechny možnosti.

Co je kanonizace

Kanonizace, v kontextu SEO, je označení jedné URL (nebo i více URL) za duplicitní a označení jiné URL jako originální. Jednu hlavní a neduplicitní URL nazýváme pak jako kanonickou. Do určité míry vyhledávač dokáže dělat kanonizaci sám (typicky www.domena.cz a domena.cz atp.).

Výhody kanonizace

Pokud kanonizaci nastavíte správně a vyhledávač ji akceptuje, tak přenese všechny (skoro, znáte to :-)) signály z duplicitní URL na originální. Duplicitní URL se nebude zobrazovat v SERPu a originální posílí.

Kanonizace je JEN doporučení

Důležité: Označujte pomocí kanonizace je 2 opravdu duplicitní URL. Vyhledávače tyhle 2 URL porovnávají a pokud se jim to nezná, mohou vaši definici kanonizace vesele ignorovat. Sean Butcher ve svém experimentu jasně ukázal, co Google bere a co ne. Prostě pokud shoda není dostatečně velká, bude vás ignorovat.

Jak správně nastavit kanonizaci

Oba dva vyhledávače mají docela dobré návody na svých stránkách. Pročtěte si pořádně doporučení od Seznamuod Google.

Řádek v HTML hlavičce

Do HTML hlavičky <head>...</head> vložte tag link s parametrem canonical kdy jeho hodnotou (odkazem href) bude originální stránka, tedy ta URL kterou chcete zobrazovat ve vyhledávačích. Například na https://www.mall.cz/tablety?o=price je nastavená kanonizace na https://www.mall.cz/tablety pomocí zápisu:

<link rel="canonical" href="https://www.mall.cz/tablety">

Řádek v HTTP v hlavičce (jen pro Google)

Google podporuje i označení kanonizace v HTTP hlavičce, což Seznam nepodporuje. Je to dobré pro kanonizaci například PDF. Stačí do HTTP hlavičky dát:

Link: <https://www.mall.cz/tablety>; rel="canonical"

Pomocí .htaccess

Opět podporuje jen Google. Stačí do .htaccesu přidat:

<Files "seo-guide.pdf">
Header add Link "< https://www.mall.cz/tablety >; rel="canonical""
</Files>

V HTTP hlavičce se to opět objeví jako:

Link: < https://www.mall.cz/tablety >; rel="canonical"

Kdy kanonizaci použít?

Jak už bylo řečeno, primárně pro označení přesné duplicity nebo pro velmi, velmi podobné stránky. Také, a to je rozdíl oproti přesměrování, duplicitní stránka je stále přístupná uživatelům nebo jiným zařízením, která nejsou vyhledávače (vyhledávačům teda také, ale v SERPu ji nenajdete). Toto jsou typické scénáře kdy kanonizaci použít:

  • podkategorie nebo produkt je umístěn ve více kategoriích a URL je špatně řešena, takže vytváří duplicitu,
  • všechny možné řazení a stránkování, které nejsou důležité pro přístupy z vyhledávačů,
  • nedůležité parametry z kampaní nebo UTM parametry,
  • označení alternativního obsahu jako mobilní web na samostatné subdoméně, AMP web nebo obecně duplicitní verze webu pro jiná zařízení,
  • agregace nebo republikace vašeho obsahu na jiných webech,
  • stránkování (s velkou nechutí – vysvětleno níže).

Kanonizace a crawl budget

Kanonizace nepomůže, pokud řešíte a optimalizujete crawl budget. Aby vyhledávač zjistil, že je na URL kanonizace, musí stránku navštívit a stáhnout a tím “užere” část crawl budgetu. Pokud chcete řešit crawl budget, použijte přesměrování.

Nejčastější chyby při použití kanonizace

  1. Použití kanonizace na jinou jazykovou mutaci. Na to používejte hreflang a ne canonical.
  2. Nepoužívejte kanonizaci na stránkování tak, že kanonizaci nastavíte na 1. stránku stránkování. Použijte raději správně rel="next"rel="prev".
    Google také doporučuje použít kanonizaci na stránkování, ale tak, abyste vytvořili jednu stránku, kde budou všechny produkty (či jiné obsahy) ze stránkování (třeba i 1 000+ produktů) na kterou budete stránky ve stránkování kanonizovat. Osobně to nepovažuji za dobré řešení – z pohledu konzistence navigace, UX i rychlosti stránky. Tedy i toto řešení považuji za chybu.
  3. Nepoužívejte kanonizaci místo přesměrování. Pokud existence URL nemá význam, použijte 301 přesměrování.
  4. Nepoužívejte vícenásobnou kanonizací (na jedné URL vícekrát canonical).
  5. Používáte relativní URL místo absolutní.
  6. Cíl kanonizované stránky není shodný, tedy se nejdná o duplicitu.
  7. Vložení kanonizace do <body> namísto do <head>.
  8. Kanonizace vede na stránku, která vrací jiný kód než 200.
  9. Kanonizace vede na stránku se zakázaným procházením nebo indexací.

Nejlepší tipy pro použití kanonizace

  1. Nastavte si kanonizaci u každé stránky na sebe sama, vyřešíte si tím všechny možné známé i neznámé parametry.
  2. Kanonizaci můžete nastavit i pomocí Google Tag Manažeru, jen to trvá.
  3. Kanonizaci můžete použít i cross-domain, tedy může být nasměrována i mezi různými doménami.
  4. Stránky v sitemap vyhledávače vnímají jako originální – které budou zobrazovat v SERPu, můžete tedy sitemapu použít jako inverzní definici kanonizace.
  5. Zda vyhledávač správně použil kanonizaci, ověříte pomocí operátoru info:. Pokud tam zadáte stránku s kanonizací, tak vám vyhledávač vrátí originál. Tohle umí automatizovaně i Marketing Miner nebo Collabim.

    Test kanonizace v SERPu pomocí operátorů
    Test kanonizace v SERPu pomocí operátorů
  6. Informace o (ne)úspěšné nebo (ne)přirozené kanonizaci najdete také v nové betě Search Console:

    Kanonizace Search Console
    Kanonizace Search Console

Další zdroje o kanonizaci ke čtení:

V dubnu 2018 proběhl SEOloger s lidmi z fulltextu Seznam.cz o tom jak pracuje Seznam s canonicalem.

14114 zhlédnutí (celkově) 1 zhlédnutí (dnes)
Rate this post

Jsem konzultant online marketingu a specializuji se na SEO a inbound marketing. Od roku 2009 jsem pracoval jako senior SEO konzultant pro největší klienty agentur Ataxo a H1.cz. Úspěšně publikuji, školím a přednáším o online marketingu, který doopravdy miluju. Jsem důsledný, zodpovědný, kritický, se smyslem pro detail.

Pavel Ungr
Jsem konzultant online marketingu a specializuji se na SEO a inbound marketing. Od roku 2009 jsem pracoval jako senior SEO konzultant pro největší klienty agentur Ataxo a H1.cz. Úspěšně publikuji, školím a přednáším o online marketingu, který doopravdy miluju. Jsem důsledný, zodpovědný, kritický, se smyslem pro detail.

Komentáře: 13

  1. Není tu vůbec zmíněné, že v případě duplicit je lepší řešit příčinu, pokud je to možné. Alespoň dříve to sice trochu pomohlo ve vyhledávači, ale například Facebook canonical nepodporoval. Nebo už i tady máme nějaký pokrok?

    1. Ano, protože to není článek o tom jak řešit duplicitu ale o tom jak používat canonical. Na Facebooku ve vyhledávání stránky nenacházíme, takže není důvod proč by měl Facebook podporovat canonical. Tohle moc nechápu.

  2. Vôbec nezávidím veľkým e-shopom nastavovať toto. Ale pokial je tá canonical nastavený fakt dobre tak to veľmi pomôže SEO – mal by sa s tym každý pohrať a skontrolovať si weby či to je všetko správne nastavené ak canonical je potrebný.

  3. Podle mě je kanonizace důležitá hlavně při využití parametrů. Pokud si dáte do URL parametr např. utm_source, a nemáte nastavenou kanonizaci, tak Google bude indexovat i URL s parametry. A pak se to bude navzájem mezi sebou bít. V tomhle docela hodně pomáhá nová verze Search Console od Google, kde vidíte, které URL se zobrazují pro daný dotaz a pokud vidíte více URL pro jeden dotaz, máte problém s duplicitou. Největší potíž v duplicitním obsahu vidím v tom, že nastane volatilita pozic a Google začne A/B testovat tyto duplicitní stránky… Kanonizace je důležitá věc a není dobré ji podceňovat.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

CommentLuv badge