Jak číst nový crawling report v Google Search Console

25.11.2020 · On-page SEO

Už delší dobu se zabývám i analýzou access logů. Vědět kam, kdy a jak často Googlebot chodí, je základ úspěchu v SEO hlavně pro rozsáhlé weby. Donedávna byl Google na tyto informace skoupý a dozvěděli jsem se pouze, jak rychle stáhne jednu URL (klíčová věc), kolik eventů se za den událo a kolik si stáhl dat. Na cokoliv podrobnějšího jste si museli připravit vlastní nástroj a data, či využít službu třetí strany. To se včera (částečně) změnilo.

Google totiž spustil novou verzi crawling reportu. Najdete ji (snad zatím) ukrytou v záložce Nastavení v GSC (vlevo dole:).

Data zatím vidím o 1.11. do dnešního dne. Původní report ukazoval maximálně 90 dnů, podle (zatím) aktuální nápovědy se hodnota nemění.

Nově vidíte:

přehled požadavků podle stavových kódů
přehled požadavků podle typu souboru
přehled podle účelu
podle typu Googlebota

Jak číst nový crawling report v Google Search Console 1 — *Úvodní stránka reportu*

Co z nových dat vyčíst a co podle dat udělat?

Přehled požadavků podle stavových kódů

Velmi cenný report, pro jehož čtení musíte ovšem dobře znát platformu, s níž pracujete. V normálním ideálním provozu byste měli vidět pouze kódy 200 a případně 304 (URL beze změny). Cokoliv mimo je věc hodná k prozkoumání.

Jak číst nový crawling report v Google Search Console 2 — *Přehled stavových kódů*

Tady musím ocenit, že Google rovnou do náhledu přidal i trendový graf. Pokud totiž víte, že určitý objem přesměrování (3O1 či 302) a nebo nedostupných (404) URL k vašemu webu patří, pak je trend přesně to, co máte sledovat. Jakmile se tedy objeví nějaký výkyv, máte dvě možnosti.

Otevřít si detail stavového kódu a za pomoci filtru si najít scénáře, které na webu idenfitikuje pomocí části URL. Jde třeba o produktový detail, výpis produktů, filtry a podobně. Jakmile takový scénář najdete, můžete jej řešit dál.

Druhou možností je po objevení trendu získat přímo access log ze serveru a pokusit se podívat přímo tam. Z větších dat a za pomocí nástrojů pro analýzu logů vyčtete potíže snadněji. Opět tím lépe, čím více informací obsahuje vaše URL o typu obsahu.

Přehled požadavků podle typu souboru

Tato data pro mě osobně velkou hodnotu nemají. HTML soubory analyzujte přes stavové kódy. XML mapy už dlouho vidíte v jiném reportu a zde se žádná odlišná data nenachází. Určitý potenciál má analýza obrázků s jiným stavovým kódem, než je 200.

Jak číst nový crawling report v Google Search Console 3 — *Přehled požadavků podle typu souboru*

Přehled podle účelu

Tento report naopak zajímavý je. Jestliže děláte SEO pro platformu, která obshaově roste, bude vás zajímat report Nalezení. Měl by ideálně mít vzrůstající trend a můžete si zde ověřovat, jaký nový obsah spadne do indexu. Opět ideálně přes jednotlivé šablony obsahu na vašem webu, jestliže je dokážete identifikovat díky URL.

Jak číst nový crawling report v Google Search Console 4 — *Přehled požadavků podle typu souboru*

Podle typu Googlebota

Tento report je spíše pro hračičky. A ani těm neukáže přesně třeba verzi Chromu, kterou Google používá. Nově by Googlebot měl stejně držet krok s poslední verzí Chrome pro smrtelníky, ale v access lozích najdete současně i návštěvy bota se starším Chromem.

Jak číst nový crawling report v Google Search Console 5 — *Podle typu Googlebota*

Třešničky navíc

Díky funkci Export si můžete klíčové metriky, jako je počet requestů a dobu ke stažení stránky ukládat do vlastní tabulky. Dřív na to byl třeba bookmarklet. Dlouhodobou evidenci rozhodně doporučím dělat.

Jak číst nový crawling report v Google Search Console 6 — *Vlastní grafy ze staré GSC*

Jak číst nový crawling report v Google Search Console 7 — *Vlastní grafy ze staré GSC*

Osobně mám dojem, že dat je v novém reportu o něco méně. V původní verzi jsem měl u některých webů i miliony requestů denně, v nové verzi jsou čísla o řád nižší. Něco se tedy muselo v metodice změnit.

Taky doufám, že významné změny v datech budou součástí notifikačního systému, který GSC má. Usnadní to tak reakci na případné problémy.

2 komentářů

Jan Pokorný

28.11.2020 22:11

Věděl bys o způsobu, jak pro větší množství webů data vytáhnout ať už do té tabulky nebo zpracovat pomocí Google Data Studio? Např. ty trendy v nalezení, aby bylo z jednoho dashboardu jasné, že je tam rostoucí trend a nemusely se weby procházet jednotlivě? Nebo bys uměl doporučit někoho, kdo by takový dashboard byl schopen připravit? Díky.

Odpovědět
1. Zdeněk Dvořák
  
  1.12.2020 08:49
  
  Ahoj, zatím nevěděl. GSC má API, přes ni jdou dostat ven AFAIK jen kliky, imprese, CTR a pozice. Detaily jsou tady https://developers.google.com/webmaster-tools/search-console-api-original/v3
  
  Odpovědět