Weblog Letem světem Dobrý sluha, ale zlý pán :: Weblog Letem světem

Archiv weblogu Letem světem z let 2002-2003


Dobrý sluha, ale zlý pán

Přesně tohle úsloví mi blesklo hlavou jako první při dnešním čtení Sovy v síti. V článku URL pro Google se totiž můžete dočíst, že dnes nejrozšířenější fulltextový vyhledávač Google má dost zvláštní pravidla na jména adresářů a souborů (a tedy předpokládám i domén). Zatímco pomlčku chápe jako oddělení dvou slov, podtržítko, znak zažitý jako náhrada mezery, zcela ignoruje. Takže výraz Lukáš-Oborský chápe jako dvě slova, kdežto Lukáš_Oborský jako jedno. Důsledek je samozřejmý - pokud pro svůj web zvolím druhou variantu a někdo bude hledat v Google příjmení Oborský, moje stránka mezi výsledky nebude.

Ačkoliv nejsem žádný SEO odborník, myslím si, že původně vyhledávače sloužily lidem jako způsob, jak co nejrychleji a nejefektivněji najít požadovanou stránku či informaci. Z toho důvodu by se vyhledávače měly snažit chápat stránku stejně jako člověk, aby zase člověku na jeho dotaz mohly poskytnout relevantní odpovědi. V poslední době se mi ale zdá, že Google silně zneužívá svého majoritního postavení. Chceš, aby náš vyhledávač tvou stránku správně zaindexoval? Podřiď se naším pravidlům! Jo ty používáš podtžítko na oddělování slov? To máš ale smůlu, milej zlatej, to musíš předělat, jinak si u nás ani neškrtneš. A tak všichni optimalizují stránky pro Google a 95% dotazů v české SEO konferenci je proto jen a jen o Google. Takový přístup se mi tedy nelíbí. A nejsem sám, kdo nesouhlasí s takovým přístupem k věci.

PS: Mimochodem za nesportovní chování Google považuji i integraci Bloggeru, který byl koupen právě tímto vyhledávačem, do oblíbeného Google Toolbaru.

29.6.2003 | 17:24 | přidal Lukin

Vaše názory

rony Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 29.6.2003 v 18:17

Google Toolbar pouzivat nemusim ;-) ale tie podtrzitka ma celkom dorazili.

-potapnik- Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 29.6.2003 v 19:21

O tech podtrZitkach se mluvilo i predtim, vischni se toho bali, nekteri si byli jisti, Ze to nemuZe byt pravda, ale nakonec vidime, jak nas vsechny ten Google dobehl. Fakt nechapu proc to tak je. Zatim jsem nenaraZil na jakykoli racionalni argument, proc to tak je. BTW: o te sile Googlu jsem chtel napsat take, ale Letem svetem mne predbehlo ;-(. Doufam, Ze se Overture s Altavistou, AllTheWebem a dalsimi kridly roZhodne pro poradnou ofenZivu, viZ skvely clanek Michala Ilicha na Lupe. (velke Z pisu protoZe ve Feedreaderu se po stisknuti maleho Z roZtahne okno na maximum :).

Pavel Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 29.6.2003 v 19:26

Nevim, nikdy jsem pro vyhledavace neoptimalizoval, ani jsem to nejak nezkoumal. A presto kdyz na google.com zadam slovo "manažer", tak moje stranka je na ctvrte pricce :-) I kdyz pod slovem "fotbal" me nenajde :-( ale vzhledem k tomu, ze na tu optimalizaci s***, tak je to uspech, ne? :-)

Marek Prokop Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 29.6.2003 v 20:32

Co se týče podtržítek, nedávno se o tom diskutovalo v seo@nawebu.cz a hodně lidí se shodlo, že je to tak OK. Já si to myslím také. mod_rewrite je prostě něco jiného než mod a rewrite. Navíc o tom asi Google ví ze své statistiky položených dotazů víc než my. Mimochodem, týká se to v podstatě jen URL, takže význam tohoto rozlišení možná trochu přeceňujete. Přeci nebudete spoléhat na to, že někdo najde (měl by najít) vaši stránku jen podle slova v URL.

S parametrem ID je to něco jiného. Bývaly doby, kdy vyhledavače URL s parametry neindexovaly vůbec. Jak je Web čím dál víc dynamický, musely s tím začít. Na druhou stranu musely nalézt nějakou ochranu proti obrovskému objemu duplicitního obsahu, který dynamická URL přinášejí -- session ID, různě tříděné a filtrované výpisy z databází, atd. Kdyby se Google tohle všechno snažil indexovat, tak se jednak zasekne na prvním větším e-shopu a indexuje ho do dnes (počet některých kombinací je téměř nekonečný) a jednak by uživatelům servíroval naprosté bláboly.

rony Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 29.6.2003 v 21:58

samozrejme su to rozumne protiargumenty. mna to zarazilo v momente, ked som si uvedomil, ze pouzivam podadresare webu vo forme produkty_a_sluzby a predstava, ze to Google chape ako produktyasluzby je pre mna dost ujeta. Samozrejme, ze mal by som pouzivat ine praktiky, ale predsa len by clovek cakal, ze URL je human-readable prvok a tak aj navrhnuty bol - kedze Google vyhadzuje vysledky hladania _aj_ podla URL, tak by som _skor_ cakal, ze sa prisposobi human-readable formatovaniu. Priklad mod_rewrite je predsa len skor definiciou "premennej" resp. nazvu kniznice a nema moc suvis s URL tak, ako mnou uvedeny priklad.

Vilém Málek Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 29.6.2003 v 22:23

Mně osobně jako největší podraz přijde automatické ztotožnění parametru "id" se session identifikátorem. Například nejrozšířenější skriptovací nástroj, který se sessions pracuje, používá pro tuto proměnnou název "PHPSESSID". Vezmu-li dále v úvahu, že každý programátor běžně používá parametr "id", pak mi chování Google připadá velmi nesmyslné. Nebo že by v tom byl zase nějaký antikonkurenčně monopolistický trik? ;-(

Marek Prokop Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 30.6.2003 v 11:40

Rony, Google neinterpretuje produkty_a_sluzby jako produktyasluzby, nýbrž jako produkty_a_sluzby. O mod_rewrite, stejně jako o plno dalších programátorských identifikátorech existuje spousta stránek, které pravděpodobně chce někdo najít.

Viléme, tvá věta o tom, že každý programátor běžně používá parametr id je jen příkladem typické odtrženosti programátorů od reality :-) Žádný programátor přeci nemůže mluvit do toho, co je viditelnou a významnou součástí dokumentu. Proč by měli uživatelé používat jako identifikaci běžného webového dokumentu kus programového kódu? Až nějaká sekretářka pojmenuje svůj dopis ve Wordu dopis?cli=158&id=672.doc, vezmu svá slova zpět :-)

Vilém Málek Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 30.6.2003 v 12:09

Marku, svou připomínkou jsem chtěl pouze upozornit na skutečnost, že "id" je programátorům vlastní (a nikoli systémům pro sessions identifikaci), tudíž přítomné všude možně po netu. Kromě toho se nedomnívám, že to má na uživatele nějaký extra vliv, uživatelé si adresy zásadně nepamatují. (A pokud by si pamatovali, nebylo by pro ně lepší, kdyby na všech webech byly obdobné adresy a ne pokaždé jiná vymyšlenost? ;-)

Marek Prokop Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 30.6.2003 v 13:55

Používat URL neznamená jenom to, že si ho někdo zapamatuje. URL se píší (opisují z papíru), posílají emailem, naznačují obsah, strukturu webu, atd. Z tohoto pohledu existují URL transparentní, srozumitelná, snadno použitelná, k uživatelům přátelská a URL, která tyto charakteristiky nemají. Navíc existují i URL inteligentní -- např. na Sexusu Aleše Studeného a Martina Kopty se URL chová podobně, jako synonymické vyhledávání. Souhlasím s tím, že id je v URL často a neindexovat ho je tedy hodně odvážné rozhodnutí, nicméně Google asi ví, co dělá. Zřejmě nebylo v jeho momentálních silách si s duplicitním dynamickým obsahem poradit jinak a zvolil menší zlo. Uživatelům totiž celkem logicky nevadí, když nějakou stránku nenajdou (najdou jich "jen" 250 tisíc místo 260 tisíc), ale hodně jim vadí, když mají pod sebou deset různých odkazů na v podstatě tentýž obsah.

Ondrej Ivanic Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 30.6.2003 v 16:27

Uplne suhlasim s Marekom. Je mi do smiechu ak v casopise najdem vetu typu: "clanok si mozete precitat na http://...?abc=33&xyz=12". O istych super webdizajnerskych spolocnostiach som si zacal tiez mysliet svoje, ked prvu vec co som dostal bolo session id a bolo uplne zbytocne... Ved ak by zo stranok vyhodili rozne hodinky a podobne veci generovane na servery a seession id z url mozno by Google mal len polovicu zo 4.000.000.000 stranok. :) Ved aj v Praku (zatial iba moj rozpracovany framework, ktory bude free) bude (uz je) mozne priradit kazdemu objektu vlastne staticke URL.

Vilém Málek Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 30.6.2003 v 17:38

Já jsem také pro transparentní URL, ačkoli si nemyslím, že jsou technicky lepší než parametrická. Jen se mi zdá hodně nefér "odstřelit" všechny, kteří své weby staví už mnoho let a proto používají starší metodu, která byla dříve jediná možná. Náramně mi to zavání monopolismem - vzbuzuje to ve mně jisté obavy z toho, co bude na řadě příště...

Lukin Napište autorovi komentáře Navštivte stránky autora komentáře

přidáno 1.7.2003 v 12:45

Také bych raději měl URL článků na tomto weblogu srozumitelnější, ale copak to můžu předělávat, když na současné permalinky odkazuje spoustu okolních webů?

Weblog byl vytvářen publikačním systémem b2. Veškeré texty z archivu mohou jsou volně použitelné.