Jak číst nový crawling report v Google Search Console
Už delší dobu se zabývám i analýzou access logů. Vědět kam, kdy a jak často Googlebot chodí, je základ úspěchu v SEO hlavně pro rozsáhlé weby. Donedávna byl Google na tyto informace skoupý a dozvěděli jsem se pouze, jak rychle stáhne jednu URL (klíčová věc), kolik eventů se za den událo a kolik si stáhl dat. Na cokoliv podrobnějšího jste si museli připravit vlastní nástroj a data, či využít službu třetí strany. To se včera (částečně) změnilo.
Google totiž spustil novou verzi crawling reportu. Najdete ji (snad zatím) ukrytou v záložce Nastavení v GSC (vlevo dole:).
Data zatím vidím o 1.11. do dnešního dne. Původní report ukazoval maximálně 90 dnů, podle (zatím) aktuální nápovědy se hodnota nemění.
Nově vidíte:
- přehled požadavků podle stavových kódů
- přehled požadavků podle typu souboru
- přehled podle účelu
- podle typu Googlebota
Co z nových dat vyčíst a co podle dat udělat?
Přehled požadavků podle stavových kódů
Velmi cenný report, pro jehož čtení musíte ovšem dobře znát platformu, s níž pracujete. V normálním ideálním provozu byste měli vidět pouze kódy 200 a případně 304 (URL beze změny). Cokoliv mimo je věc hodná k prozkoumání.
Tady musím ocenit, že Google rovnou do náhledu přidal i trendový graf. Pokud totiž víte, že určitý objem přesměrování (3O1 či 302) a nebo nedostupných (404) URL k vašemu webu patří, pak je trend přesně to, co máte sledovat. Jakmile se tedy objeví nějaký výkyv, máte dvě možnosti.
Otevřít si detail stavového kódu a za pomoci filtru si najít scénáře, které na webu idenfitikuje pomocí části URL. Jde třeba o produktový detail, výpis produktů, filtry a podobně. Jakmile takový scénář najdete, můžete jej řešit dál.
Druhou možností je po objevení trendu získat přímo access log ze serveru a pokusit se podívat přímo tam. Z větších dat a za pomocí nástrojů pro analýzu logů vyčtete potíže snadněji. Opět tím lépe, čím více informací obsahuje vaše URL o typu obsahu.
Přehled požadavků podle typu souboru
Tato data pro mě osobně velkou hodnotu nemají. HTML soubory analyzujte přes stavové kódy. XML mapy už dlouho vidíte v jiném reportu a zde se žádná odlišná data nenachází. Určitý potenciál má analýza obrázků s jiným stavovým kódem, než je 200.
Přehled podle účelu
Tento report naopak zajímavý je. Jestliže děláte SEO pro platformu, která obshaově roste, bude vás zajímat report Nalezení. Měl by ideálně mít vzrůstající trend a můžete si zde ověřovat, jaký nový obsah spadne do indexu. Opět ideálně přes jednotlivé šablony obsahu na vašem webu, jestliže je dokážete identifikovat díky URL.
Podle typu Googlebota
Tento report je spíše pro hračičky. A ani těm neukáže přesně třeba verzi Chromu, kterou Google používá. Nově by Googlebot měl stejně držet krok s poslední verzí Chrome pro smrtelníky, ale v access lozích najdete současně i návštěvy bota se starším Chromem.
Třešničky navíc
Díky funkci Export si můžete klíčové metriky, jako je počet requestů a dobu ke stažení stránky ukládat do vlastní tabulky. Dřív na to byl třeba bookmarklet. Dlouhodobou evidenci rozhodně doporučím dělat.
Osobně mám dojem, že dat je v novém reportu o něco méně. V původní verzi jsem měl u některých webů i miliony requestů denně, v nové verzi jsou čísla o řád nižší. Něco se tedy muselo v metodice změnit.
Taky doufám, že významné změny v datech budou součástí notifikačního systému, který GSC má. Usnadní to tak reakci na případné problémy.
Jan Pokorný
28.11.2020 · 22:11
Věděl bys o způsobu, jak pro větší množství webů data vytáhnout ať už do té tabulky nebo zpracovat pomocí Google Data Studio? Např. ty trendy v nalezení, aby bylo z jednoho dashboardu jasné, že je tam rostoucí trend a nemusely se weby procházet jednotlivě? Nebo bys uměl doporučit někoho, kdo by takový dashboard byl schopen připravit? Díky.
Zdeněk Dvořák
1.12.2020 · 08:49
Ahoj, zatím nevěděl. GSC má API, přes ni jdou dostat ven AFAIK jen kliky, imprese, CTR a pozice. Detaily jsou tady https://developers.google.com/webmaster-tools/search-console-api-original/v3