Je operátor info: spolehlivý pro kontrolu indexace?

31.8.2018 · On-page SEO

Už dlouho dělávám na webech kontrolu indexace. Dříve přes Rank Tracker, nově pak přes Marketing Miner. Z výsledků pak hledám problémové vzory, aby u klientů bylo v indexu vše, co má, protože bez indexace nejsou pozice a bez těch není návštěvnost. Před časem jsem ale narazil na problém.

Můj běžný proces

Z Marketing Mineru dostanete URL označené podle toho, jestli jsou nebo nejsou indexované. Zašel jsem si tak udělat namátkovou kontrolu, než seznam jako obvykle předám dál.

Donedávna taková kontrola spočívala v ručním zadání dotazu do Google. S novou Google Search Console se ale můžete zeptat Google jinak. A tam byl kámen úrazu.

Výstupy z obou služeb se neshodují.

Rozpor info: a Google Search Console

Dotaz s info: přímo v Google tvrdí, že URL v indexu není.

Je operátor info: spolehlivý pro kontrolu indexace? 1 — Adresa prý v indexu není

Dotaz na tu samou URL v GSC vrátí opačnou odpověď.

Je operátor info: spolehlivý pro kontrolu indexace? 2 — Ta samá URL v Google Search Console

A teď babo raď.

Pro pořádek musím uvést, že URL je stará minimálně rok, podle dat z Google Analytics v minulosti přivedla organickou návštěvnost. Tudíž v indexu už musela být. Což neznamená, že tam bude navždy.

Příčina

Na vině mohou být různá data centra Google, odkud se servírují výsledky, což je teorie, se kterou přišel Filip Podstavec. Mně ale zajímá řešení, které má vliv na moji práci.

Řešení

Z nějakého důvodu mám tendenci věřit více Search Consoli. Než ale budu údajně neindexované URL zkoumat dál a zadávat řešení, potřeboval jsem najít nějakou cestu, jak vyloučit nesprávné výsledky. A to nejde dělat ručně.

První mě napadl site: operátor. Bohužel výsledek byl negativní, URL stále nevidím.

Druhý pokud byl s hledáním čisté URL ve vyhledávání Google. Tam už se adresa objevila na prvním místě.

Řešení pro dvojitou kontrolu výstupu dat pořízených s pomocí info: operátoru spočívá v tom, že si:

necháte nějakým nástrojem naměřit pozici pro dotaz v podobě čisté URL
scraperem stáhnete SERP na dotaz s čistou URL

Verze číslo 1 mi přijde rychlejší, protože dostanu jen URL na prvním naměřeném výskytu a to už snadno spáruji s výstupem z Marketing Mineru. Kde je shoda, URL označím jako indexovanou a pracuji se zbylými daty.

Odbočka nakonec – jiný problém s info: operátorem pozorovali i v Collabimu.

Filip Podstavec

31.8.2018 16:34

“Na vině mohou být různá data centra Google, odkud se servírují výsledky, což je teorie, se kterou přišel Filip Podstavec. Mně ale zajímá řešení, které má vliv na moji práci.”
To mohou, ale pouze v případě, že na dotaz s operátorem info: se URL občas vrátí jako zaindexovaná a občas jako nezaindexovaná (třeba na jiném zařízení). Toto většinou platí pro nově zaindexované stránky, ale to není případ, který popisuješ.

Z toho, co jsi popisoval výše, to vypadá, že GSC zobrazuje informace o tom, jestli vůbec někdy URL v indexu měla. Díky ruční kontrole, kterou jsi dělal (a nemohl ji najít krom samotné URL) to vypadá, že o URL Google ví, ale nepoužívá ji ve výsledcích vyhledávání. V tom případě je pro mě kontrola skrze operátor info: stále relevantnější, jelikož to, že Google URL indexuje, ale nepoužívá, je pro mě přínosnější a aktuálnější informace, než pouze vědět, že ji někdy měl někdy zaindexovanou (a používal).

Nebo v nejlepším případě dělat kontrolu kombinovanou. Tedy ty, které vidím jako neindexované prohnat způsobem, který jsi popsal výše a brát takové URL jako “Již indexované, ale s obsahem, který Google časem zahodil”. Stále je pro mě ale v takovém případě prioritní výstup operátoru info, jelikož ten mi dává přehled nad tím, co vyhledávač reálně používá a co ne, s čímž mohu pracovat (zlepšit obsah, najít proč se k němu ještě nedostal,…).

Mě v tomto nejvíce pomáhá vytahat si přímo z Google Analytics API data o počtu vstupů na dané stránky z jednotlivých vyhledávačů a pak porovnávat, které z nich jsou kde zaindexované (a hledat rozdíly mezi vyhledávači), které zbytečně (a v nich hledat vzory k blokaci a ulehčení prostupu robota webem) a které nejsou (zjistit, jestli ji robot vyhledávače někdy navštívil a pokud ano, tak zapracovat na obsahu).

Odpovědět

Jeden komentář

Filip Podstavec

31.8.2018 16:34

“Na vině mohou být různá data centra Google, odkud se servírují výsledky, což je teorie, se kterou přišel Filip Podstavec. Mně ale zajímá řešení, které má vliv na moji práci.”
To mohou, ale pouze v případě, že na dotaz s operátorem info: se URL občas vrátí jako zaindexovaná a občas jako nezaindexovaná (třeba na jiném zařízení). Toto většinou platí pro nově zaindexované stránky, ale to není případ, který popisuješ.

Z toho, co jsi popisoval výše, to vypadá, že GSC zobrazuje informace o tom, jestli vůbec někdy URL v indexu měla. Díky ruční kontrole, kterou jsi dělal (a nemohl ji najít krom samotné URL) to vypadá, že o URL Google ví, ale nepoužívá ji ve výsledcích vyhledávání. V tom případě je pro mě kontrola skrze operátor info: stále relevantnější, jelikož to, že Google URL indexuje, ale nepoužívá, je pro mě přínosnější a aktuálnější informace, než pouze vědět, že ji někdy měl někdy zaindexovanou (a používal).

Nebo v nejlepším případě dělat kontrolu kombinovanou. Tedy ty, které vidím jako neindexované prohnat způsobem, který jsi popsal výše a brát takové URL jako “Již indexované, ale s obsahem, který Google časem zahodil”. Stále je pro mě ale v takovém případě prioritní výstup operátoru info, jelikož ten mi dává přehled nad tím, co vyhledávač reálně používá a co ne, s čímž mohu pracovat (zlepšit obsah, najít proč se k němu ještě nedostal,…).

Mě v tomto nejvíce pomáhá vytahat si přímo z Google Analytics API data o počtu vstupů na dané stránky z jednotlivých vyhledávačů a pak porovnávat, které z nich jsou kde zaindexované (a hledat rozdíly mezi vyhledávači), které zbytečně (a v nich hledat vzory k blokaci a ulehčení prostupu robota webem) a které nejsou (zjistit, jestli ji robot vyhledávače někdy navštívil a pokud ano, tak zapracovat na obsahu).

Odpovědět