Jak začít se SEO? IV. díl
Jak fungují vyhledávače?
Čtvrté pokřačování našeho nikdy nekončícího SEO seriálu se zabývá zejména tím, jak fungují vyhledávače (Google) a v kostce popisuje to, co je v základních Google doporučeních a základní Google dokumentaci napsáno k SEO. Připojuji k tomu některé své poznatky z praxe a četných debat se SEO specialisty. Pojďme tedy na to, dnes toho je hodně.
Google odpovídá na dotazy
Google se snaží poskytovat co nejlepší odpověď všem uživatelům na každý dotaz. Nabízí výsledky pouze zdarma, nejde si zaplatit za první pozice v tzv. organickém zobrazení. Pokud se bavíme o PPC, ty jsou vždy označeny jako „reklama“ nebo "Sponsored" apod., toto označení ukládá zákon, aby se rozlišila placená reklama a neplacené výsledky vyhledávání.
Googlu nejde ani zaplatit za to, aby vaše stránky procházel častěji nebo přednostně, nebo naopak, aby je neprocházel či aby je zařadil nebo nezařadil na index. Toho lze částečně docílit jinak (značka „no index“ nebo zákaz v robots.txt nebo tím, že obsah budete vidět až po přihlášení). Google negarantuje, že váš web bude zobrazován ve výsledcích, ani to, že bude indexován, ani to, že ho vůbec projdou roboti. Nejde se nikam obrátit, zavolat či napsat. I tak existují způsoby, jak se do indexu dostat rychleji (Google Search Console, zpětné odkazy z jiných webů, sociálních sítí apod.).
Googlu nejde ani zaplatit za to, aby vaše stránky procházel častěji nebo přednostně, nebo naopak, aby je neprocházel či aby je zařadil nebo nezařadil na index. Toho lze částečně docílit jinak (značka „no index“ nebo zákaz v robots.txt nebo tím, že obsah budete vidět až po přihlášení). Google negarantuje, že váš web bude zobrazován ve výsledcích, ani to, že bude indexován, ani to, že ho vůbec projdou roboti. Nejde se nikam obrátit, zavolat či napsat. I tak existují způsoby, jak se do indexu dostat rychleji (Google Search Console, zpětné odkazy z jiných webů, sociálních sítí apod.).
Jak postupují vyhledávače?
Tři fáze - procházení, indexování a zobrazení
Postup vyhledávačů má tři fáze. Procházení stránky robotem (automatický proces), indexování (závisí na obsahu) a zobrazení (závisí na dotazu).
Crawling – procházení webu robotem – Google boti (roboti, crawleři) automaticky stáhnou texty, obrázky apod. obsah vašeho webu a projdou ho.
Indexování – Google analyzuje texty, obrázky a další obsah webu jako videa, výsledky dá do své databáze.
Zobrazení výsledků na Google – v závislosti na mnoha faktorech na webu a konkrétním dotazu uživatele nabídne Google výsledky. Stránka s výsledky se nazývá SERP (Search Engine Result Page).
Crawling – procházení webu robotem – Google boti (roboti, crawleři) automaticky stáhnou texty, obrázky apod. obsah vašeho webu a projdou ho.
Indexování – Google analyzuje texty, obrázky a další obsah webu jako videa, výsledky dá do své databáze.
Zobrazení výsledků na Google – v závislosti na mnoha faktorech na webu a konkrétním dotazu uživatele nabídne Google výsledky. Stránka s výsledky se nazývá SERP (Search Engine Result Page).
Crawlování webu
Neexistuje centrální databáze webů, natož jednotlivých podstránek. Je dost možné, že Google o vašem webu nebo některé konkrétní podstránce vašich stránek vůbec neví. Hledání a nalezení nového webu (nebo jednotlivých URL) se označuje pojmem „URL discovery“ (objevení nové URL).
Jakmile Google najde novou stránku a prochází ji, najde pochopitleně i odkazy na jednotlivé podstránky, které tato URL obsahuje. Např. navštíví vaši home page, kde máte odkaz na produktovou kategorii X, objeví tím podstránku produktová kategorie X. Pokud máte v sitemapě seznam všech stránek, Google ji časem najde a tyto stránky také pomalu projde. Urychlit se to dá tak, že sitemapu přidáte do Google Search Console. Tam můžete také manuálně podat žádost o indexaci jednotlivých stránek (max. 10 URL denně). Tohoto se využívá nejčastěji v momentě, kdy přidáte nový produkt nebo blogový článek, případně celý nový web.
Vyhledávací roboti využívají k procházení stránek různé algoritmy. Algoritmus pak rozhoduje o tom, jak často mají chodit na stránky, kolik času na nich můžou trávit apod.
Tady je dobré zmínit, že čas robotů pro prohledávání vašeho webu je limitovaný. Pro malý web (třeba 200 stránek) to v podstatě není větší problém. Pokud máte ale web o 20 000 stránkách, je dost možné, že jich většina není na indexu, protože algoritmus pro procházení webů vyčlenil pro váš web velice malý čas. Opět – jde si pomoct hlavně kvalitním obsahem, sitemapou, Google Search Consolí, backlinky a tím, že roboty neposíláte na stránky, které pro vás nemají praktický obsahový význam (stránka s GDPR, obchodními podmínkami apod.).
Vyhledávací roboti jsou naprogramovaní tak, aby nezahlcovali web a nezpůsobili tak jeho zpomalování (chyby na serveru 5xx).
Google mimo jiné prochází i veškerý JavaScriptový kód stránek a stránky vykreslí (rendruje). Údajně k tomu využívá vždy nejnovější verzi Chromu. Proto zrovna zobrazení v Chromu byste neměli rozhodně podceňovat. Obsah, ke kterému by se Google roboti nedostali, vinou špatného JavaScriptového kódu, se nemůže dostat na index. Zde je také dobré zmínit, že záleží i na hostingu. Některé hostingy mají výpadky, nebo časy, kdy jsou pomalejší. Jenže, roboti váš web navštěvují „kdykoliv“. Pomalý hosting (a špatná odpověď serveru) jsou pro Google špatným znamením. Web (a tím i server) má být rychlý.
Jakmile Google najde novou stránku a prochází ji, najde pochopitleně i odkazy na jednotlivé podstránky, které tato URL obsahuje. Např. navštíví vaši home page, kde máte odkaz na produktovou kategorii X, objeví tím podstránku produktová kategorie X. Pokud máte v sitemapě seznam všech stránek, Google ji časem najde a tyto stránky také pomalu projde. Urychlit se to dá tak, že sitemapu přidáte do Google Search Console. Tam můžete také manuálně podat žádost o indexaci jednotlivých stránek (max. 10 URL denně). Tohoto se využívá nejčastěji v momentě, kdy přidáte nový produkt nebo blogový článek, případně celý nový web.
Vyhledávací roboti využívají k procházení stránek různé algoritmy. Algoritmus pak rozhoduje o tom, jak často mají chodit na stránky, kolik času na nich můžou trávit apod.
Tady je dobré zmínit, že čas robotů pro prohledávání vašeho webu je limitovaný. Pro malý web (třeba 200 stránek) to v podstatě není větší problém. Pokud máte ale web o 20 000 stránkách, je dost možné, že jich většina není na indexu, protože algoritmus pro procházení webů vyčlenil pro váš web velice malý čas. Opět – jde si pomoct hlavně kvalitním obsahem, sitemapou, Google Search Consolí, backlinky a tím, že roboty neposíláte na stránky, které pro vás nemají praktický obsahový význam (stránka s GDPR, obchodními podmínkami apod.).
Vyhledávací roboti jsou naprogramovaní tak, aby nezahlcovali web a nezpůsobili tak jeho zpomalování (chyby na serveru 5xx).
Google mimo jiné prochází i veškerý JavaScriptový kód stránek a stránky vykreslí (rendruje). Údajně k tomu využívá vždy nejnovější verzi Chromu. Proto zrovna zobrazení v Chromu byste neměli rozhodně podceňovat. Obsah, ke kterému by se Google roboti nedostali, vinou špatného JavaScriptového kódu, se nemůže dostat na index. Zde je také dobré zmínit, že záleží i na hostingu. Některé hostingy mají výpadky, nebo časy, kdy jsou pomalejší. Jenže, roboti váš web navštěvují „kdykoliv“. Pomalý hosting (a špatná odpověď serveru) jsou pro Google špatným znamením. Web (a tím i server) má být rychlý.
Indexování webu
Jakmile stránku najdou a projdou roboti (robot), Google se snaží udělat si obrázek, o čem web je a pro koho (které vyhledávací dotazy apod.) je vlastně vhodný. V této fázi rozhodují o indexaci mnoho věcí (meta data, title, alt popisky obrázků, nadpisy, texty a mnoho mnoho dalšího).
A v této fázi také Google vidí, zda je obsah na webu duplicitní s jinými stránkami (ať již vašeho nebo jiného webu). Google chce podávat co nejrelevantnější výsledky původních zdrojů. Proto duplicity obecně nejsou dobré (i když jich je plný internet a Google do značné míry „chápe“, že produkt X má na většině webů duplicitní nebo velmi podobný popisek a obrázky). Pokud je obsah stejný v rámci jednoho webu, Google také porovnává, zda je obsah kanonický či nikoliv. Kanonizované stránky by ve výsledcích vyhledávání neměl ukazovat (i když i to se občas stane).
V případě duplicitního obsahu dává Google, podle svého vyjádření, obsah do tzv. klastrů, a následně rozhoduje, kterou verzi ukáže prioritně. Mimochodem, může se stát, že jinou stránku duplicitního obsahu vidíte v Brně a v Norsku, ale také třeba na mobilu nebo v počítači.
Znovu podotýkám, že Google rozhodně nedá do indexu každou stránku, kterou projde. Opět to závisí na dalších detailech, ale znímili jsme ty nejpodstatnější. Zkráceně – kvalitní a jedinečný obsah rozhoduje. Pokud nemáte indexovánu dlouho nějakou stránku a zkoušeli jste to i přes Google Search Console i přes odkazy z jiných zdrojů, pak jsou v zásadě tři nejčastější možnosti.
A v této fázi také Google vidí, zda je obsah na webu duplicitní s jinými stránkami (ať již vašeho nebo jiného webu). Google chce podávat co nejrelevantnější výsledky původních zdrojů. Proto duplicity obecně nejsou dobré (i když jich je plný internet a Google do značné míry „chápe“, že produkt X má na většině webů duplicitní nebo velmi podobný popisek a obrázky). Pokud je obsah stejný v rámci jednoho webu, Google také porovnává, zda je obsah kanonický či nikoliv. Kanonizované stránky by ve výsledcích vyhledávání neměl ukazovat (i když i to se občas stane).
V případě duplicitního obsahu dává Google, podle svého vyjádření, obsah do tzv. klastrů, a následně rozhoduje, kterou verzi ukáže prioritně. Mimochodem, může se stát, že jinou stránku duplicitního obsahu vidíte v Brně a v Norsku, ale také třeba na mobilu nebo v počítači.
Znovu podotýkám, že Google rozhodně nedá do indexu každou stránku, kterou projde. Opět to závisí na dalších detailech, ale znímili jsme ty nejpodstatnější. Zkráceně – kvalitní a jedinečný obsah rozhoduje. Pokud nemáte indexovánu dlouho nějakou stránku a zkoušeli jste to i přes Google Search Console i přes odkazy z jiných zdrojů, pak jsou v zásadě tři nejčastější možnosti.
- Stránka má zakázaný přístup robotů v robots.txt (to roboty sice reálně nemusí zastavit, ale může to být jeden z důvodů).
- Stránka má direktivu „no index“ (ani toto nemusí nutně roboty zastavit, ale stává se to výjimečně).
- Opravdu nemáte dobrý obsah (velmi časté).
- Obsah se špatně vykresluje a zobrazuje, nebo si to alespoň Google myslí. V některých případech to může dokonce tuto stránku dát mezi tzv. „falešné 404“.
- Časté problémy se serverem, nebo jiný typ nedůvěryhodnosti (scam weby, nebo si Google může myslet, že to je scam web).
- Přesměrování na přesměrování na přesměrování na přesměrování na přesměrování – ano – není opravdu dobré stránku A přesměrovávat na B a B na C a C na D a D na E. Pokud totiž robot přijde na stránku A, vidí čtyři přesměrování po sobě. A které weby toto dělají? Ano, ty scamové. A ty Google nechce ukazovat. Navíc v rámci přesměrování roboti často odchází.
- Skutečná penalizace za něco (o penalizacích asi jindy, to je opět velice obsáhlé téma).
- Design webu z nějakého důvodu neumožňuje lehký průchod robotům.
- Málo obsahu – vyhledávače málokdy indexují stránky, které mají např. 10 slov a žádné obrázky, chápete – zdá se jim, že nemají obsah.
- Z jakéhokoliv jiného důvodu Google nepovažuje stránku za důležitou. Je to neurčité? Ano. Je to časté? Možná.
Pořadí výsledků ve vyhledávání
Když napíšete do Googlu dotaz, zobrazí se výsledky. Opět podotknu, že se nebavíme o těch placených. Zda se váš web zobrazí nebo ne, záleží na obrovském množství faktorů. Je dobré zmínit, že vyhledávání je personalizované, proto měřením vyhledávaných výrazů v programech jako je Collabim nebo Marketing Miner zjistíte „teorii“, ale v Google Search Console vidíte „praxi“ (to, jak se váš web zobrazil reálně). Samozřejmě, že pokud se váš web nezobrazí, pak v GSC nevidíte nic, ale Collabim i MM vám pozici naměří, což je důležité pro přehled, jak pracujete se SEO.
Jaké personalizace Google používá? Je jich také mnoho. Určitě je to poloha (v Praze jiné výsledky než v Brně), zařízení (na mobilních zařízeních jsou trošku nebo hodně jiné výsledky než v desktopu) nebo třeba jazyk, který používáte.
Jaké personalizace Google používá? Je jich také mnoho. Určitě je to poloha (v Praze jiné výsledky než v Brně), zařízení (na mobilních zařízeních jsou trošku nebo hodně jiné výsledky než v desktopu) nebo třeba jazyk, který používáte.
Co si z toho vzít?
Váš web se nemusí zobrazovat na prvních pozicích, dokonce se nemusí zobrazovat vůbec. Závisí to na mnoha faktorech. Nejlepší pomocník do začátku pro indexování a zjištění dalších podrobností je Google Search Console (navíc je zadarmo).
Nejprve váš web musí navštívit robot, projít ho, porovná výsledky, zařadí jej do databáze a až následně ho může nabízet ve výsledcích.
Existuje mnoho faktorů, na kterých to záleží. Nezoufejte, buďte trpěliví a snažte se mít i plán B, nebo plán SEO. SEO je nikdy nekončící práce. Neexistuje nic jako „nastavit SEO“ (tedy – ano, můžeme nastavit Title, Meta description, nadpisy, alt popisky apod.). Pokud na SEO nebudete pracovat dlouhodobě, nejspíš to nepřinese kýžený efekt prvních pozic. A pokud nevíte co, obraťte se na SEO specialisty.
Nejprve váš web musí navštívit robot, projít ho, porovná výsledky, zařadí jej do databáze a až následně ho může nabízet ve výsledcích.
Existuje mnoho faktorů, na kterých to záleží. Nezoufejte, buďte trpěliví a snažte se mít i plán B, nebo plán SEO. SEO je nikdy nekončící práce. Neexistuje nic jako „nastavit SEO“ (tedy – ano, můžeme nastavit Title, Meta description, nadpisy, alt popisky apod.). Pokud na SEO nebudete pracovat dlouhodobě, nejspíš to nepřinese kýžený efekt prvních pozic. A pokud nevíte co, obraťte se na SEO specialisty.
Zkratky a pojmy
V článku je mnoho marketingových zkratek a SEO pojmů, nejedůležitější jsou níže.
Crawler = Robot = Bot = spider = vyhledávací roboti (Googlu, Seznamu, Bingu…).
Googlebot = crawlovací robot Googlu (prochází vaše stránky).
Crawling = návštěva stránek botem = procházení stránek robotem.
Backlink = zpětný odkaz = odkaz na (váš) web.
SEO = Search Engine Optimization = optimalizace webu pro vyhledávače.
PPC = Pay Per Click = Platba za proklik (není to SEO). Např. Google Ads nebo Sklik (ale také Facebooková reklama aj. online reklama).
Crawler = Robot = Bot = spider = vyhledávací roboti (Googlu, Seznamu, Bingu…).
Googlebot = crawlovací robot Googlu (prochází vaše stránky).
Crawling = návštěva stránek botem = procházení stránek robotem.
Backlink = zpětný odkaz = odkaz na (váš) web.
SEO = Search Engine Optimization = optimalizace webu pro vyhledávače.
PPC = Pay Per Click = Platba za proklik (není to SEO). Např. Google Ads nebo Sklik (ale také Facebooková reklama aj. online reklama).
Vytvořila společnost PS Works s. r. o.