Rand Fishkinovi se dostalo do rukou přes 2500 stránek dokumentace, která podle všeho pochází přímo z Google a zdá se podle různých insiderů být pravá. Ukazuje zajímavé informace o tom, co (možná) Google využívá při hodnocení stránek. Důležité je taky, co si z to nemáte odnést. Nejde určit, co má jakou váhou. Berte to tedy tak, že popisuje hodnotící systémy nebo funkce. Co jsme se tedy dozvěděli?
Doménová autorita?
V rámci komprimovaných signálů kvality, které se ukládají pro každý dokument zvlášť, má Google funkci, kterou vypočítává pod názvem “siteAuthority”.
Kliky jako hodnotící signál?
Víme už z dřívějška, že tohle je reálná věc. Svědectví Pandu Nayaka v antimonopolním procesu ministerstva spravedlnosti už dřív odhalilo existenci systémů Glue a NavBoost. NavBoost je systém, který využívá opatření řízená kliknutím ke zvýšení, snížení nebo jinému posílení pořadí ve webovém vyhledávání.
❗ Více dat z clickstreamů sloužilo jako hlavní motivace pro vytvoření prohlížeče Chrome (spuštěn v roce 2008). Jeden z modulů souvisejících s hodnocením kvality stránek obsahuje měření zobrazení na úrovni webu z prohlížeče Chrome. Další modul, který zřejmě souvisí s generováním odkazů na stránky, má také atribut související s prohlížečem Chrome.
Sandbox?
V modulu PerDocData je v dokumentaci uveden atribut hostAge, který se používá speciálně “pro sandbox čerstvého spamu v čase obsluhy”.
Sleduje Google, kdo je autor obsahu?
❗ Google explicitně ukládá informace o autorech spojených s dokumenty jako text. Sleduje také, zda entita na stránce je autorem téže stránky. Kombinace těchto údajů a podrobného mapování entit a vektorových embedů ukazuje na komplexní měření autorství.
Algoritmické “degradace”
V dokumentech je spousta zmínek o tom, jak může být určité chování negativně hodnoceno. Tak třeba Anchor Mismatch. Pokud odkaz neodpovídá cílovému webu, na který odkazuje, je odkaz ve výpočtech degradovaný.
Link Spam
❗ Díky funkci phraseAnchorSpamDays může Google efektivně skoky nárůstu spamových anchor textů v odkazech. Doufám, že ti, co mě sledujete déle, si vzpomenete na moje úvahy o tom, co a jak může sledovat SpamBrain poháněný AI. Anchor text je nejjednodušší signál.
Google používá data o kliknutí k určení váhy odkazů
❗ Google má tři úrovně pro klasifikaci svých indexů odkazů (nízká, střední, vysoká kvalita). Údaje o kliknutí se používají k určení, do které úrovně indexu odkazů dokument patří. Pokud tedy na stránku s odkazem vede málo nebo žádné kliky, může odkaz z ní spadnout do indexu nízké kvality a odkaz bude ignorovaný.
Na velikosti písma záleží?
Tohle zní velmi nečekaně, ale dává smysl. Google sleduje průměrnou váženou velikost písma výrazů v dokumentech. A to platí i pro texty odkazů. Nejspíš to souvisí s komfortem uživatele.
Data jsou velmi důležitá
Časové otisky spojené s publikací obsahu jsou důležité. Google sleduje bylineDate (uvedené přímo v obsahu), syntacticDate (z URL nebo title) a semanticDate (nalezeno někde v obsahu).
Informace o registraci domény
❗ V Google ukládají nejnovější registrační informace. Nejspíš se používá s propojení se sand boxem.
YMYL
❗ Google má klasifikátory, které generují skóre pro YMYL Health a YMYL News.
Nic z výše uvedeného naši práci nemění. Je ale důležité vědět, že některé z našich “cílů” jsou (nebo byly) reálná věc.
Zdroje:
- https://sparktoro.com/blog/an-anonymous-source-shared-thousands-of-leaked-google-search-api-documents-with-me-everyone-in-seo-should-see-them/ sem dokumenty doputovaly
- https://ipullrank.com/google-algo-leak s Mike Kingem je Rand Fishkin ze SparkToro sdílel