Počítače Windows Internet

Najjednoduchší popis princípu fungovania vyhľadávacieho nástroja Yandex. Internetové vyhľadávače: Yandex, Google, Rambler, Yahoo. Zloženie, funkcie, princíp činnosti Matematické vyhľadávacie modely

Yandex je dnes najpopulárnejším vyhľadávacím nástrojom v Rusku. Štatistiky služieb Živý internet, ukazuje podiel Yandexu na mase celoruského publika - je to 53,4%, ak vezmeme do úvahy iba Moskvu a región, potom je to ešte vyššie - 67,9% (Moskva podľa požiadaviek zaberá viac ako 50 % celého Ruska).

Webová stránka www.yandex.ru bola vytvorená v roku 1997, stačil na ňu iba jeden server, ktorý stál pod pracovnou plochou jedného zo skupiny prvých vývojárov Yandexu, Dmitrija, ktorého priezvisko bolo Teibleum. Veľmi rýchlo po otvorení sme kúpili druhý server a čoskoro, keď bolo potrebné nainštalovať ďalší, bolo jasné, že pod stolom je dosť miesta buď pre tri servery Yandex, alebo […]

Vývojári vyhľadávačov sa snažia poskytnúť používateľom najlepšie odpovede na ich otázky. Niekedy môže byť takouto odpoveďou číslo (napríklad počasie v meste), obrázok (napríklad adresa na mape), preklad slova alebo štvorveršia. Keď máte po ruke vhodné množstvo informácií, odpoveď môže byť poskytnutá okamžite. Preto Yandex dopĺňa výsledky internetového vyhľadávania odpoveďami zo svojej […]

Približne každá desiata požiadavka na Yandex je „navigačná“, to znamená, že pozostáva z názvu organizácie alebo webovej stránky a používateľ chce prejsť na webovú stránku tejto organizácie. V tomto prípade sa namiesto panela s adresou prehliadača používa vyhľadávací panel Yandex a používateľ sa spravidla nezaujíma o zvyšných deväť výsledkov vyhľadávania. Bez toho, aby sme odvádzali pozornosť používateľa od hlavného cieľa, pridali sme po hlavnom […]

Hlavnou úlohou vyhľadávača je odpovedať na otázku používateľa. Keď používateľ zadá dotaz, vyhľadávač nevstúpi na každú stránku na internete, ale prehľadáva databázu stránok, ktoré pozná – index vyhľadávania. Tam nájde všetky strany so slovami z dopytu. Používateľ vidí odkazy na tieto stránky na stránkach s výsledkami vyhľadávania.

Ako vidíme, Yandex nestojí na mieste a som si istý, že vyhľadávacie technológie tohto systému sa budú naďalej rozvíjať s cieľom zlepšiť kvalitu vyhľadávania, ktorú možno len ťažko nazvať ideálnou.

Dňa 10. novembra 2009 spoločnosť Yandex oznámila novú verziu vyhľadávacieho algoritmu - Snezhinsk. Zásadné zmeny nastali v algoritme na výpočet relevancie - zástupcovia spoločnosti Yandex napísali toto: „Podarilo sa nám vytvoriť presnejší a oveľa zložitejší matematický model, čo viedlo k výraznému zvýšeniu kvality vyhľadávania. Vďaka redizajnu architektúry hodnotenia vyhľadávania bolo možné implementovať účtovníctvo niekoľkých tisíc [...]

Testovanie novej verzie algoritmu Yandex sa začalo 9. júla 2008. Podľa Yandexu „hlavné zmeny v programe súvisia s novým prístupom k strojovému učeniu a v dôsledku toho rozdiely v spôsobe, akým sa vo vzorci zohľadňujú faktory hodnotenia.“

14. apríla 2008 sa na adrese buki.yandex.ru začal testovať nový vyhľadávací algoritmus „Magadan“. Okrem zdvojnásobenia počtu hodnotiacich faktorov boli pridané aj tieto inovácie:

Predtým, ako sa pustíme do algoritmickej džungle, pripomeňme si, ako vyhľadávací nástroj vo všeobecnosti funguje. Logická štruktúra vyhľadávacieho systému môže byť reprezentovaná vo forme troch modulov (pozri obrázok) Robot (crawler) je špeciálny program, ktorý prehľadáva internetové stránky a sťahuje ich obsah. Robot má špeciálny harmonogram, podľa ktorého vykonáva svoje kolá. Webové stránky načítavané robotom, špeciálna [...]

66. Čo má väčší vplyv: odkaz z bezplatnej platformy (blogspot, LJ atď.) alebo z offline stránky/blogu? Bezplatné platformy prenášajú menšiu váhu ako samostatné stránky. Dopad by však mohol byť väčší. Je to spôsobené mnohými faktormi: aktuálny zoznam kotiev, stav porovnávaných lokalít atď. Na túto otázku nie je možné dať jednoznačnú odpoveď. 67. Najväčšia váha sa prenáša medzi […]

Vamana Tour - cestovanie, letenky a víza po celom svete a do Indie, Nepálu, Srí Lanky, Maldív, Maurícia a mnohých ďalších miest planéty. Rady pre cestovateľov a pútnikov. Ako zo svojho výletu vyťažiť maximum. Úžasné historické kroniky a príbehy skúsených cestovateľov.

Aký je účel zohľadnenia externých odkazov na stránku Ako môžete vidieť z predchádzajúcej časti, takmer všetky faktory ovplyvňujúce hodnotenie sú pod kontrolou autora stránky. Pre vyhľadávač sa tak stáva nemožné rozlíšiť skutočne kvalitný dokument od stránky vytvorenej špeciálne pre danú hľadanú frázu alebo dokonca od stránky vygenerovanej robotom, ktorá vôbec neobsahuje užitočné informácie. […]

Dobrý deň milí priatelia! V tomto článku sa budeme aj naďalej pozerať na vyhľadávací nástroj Yandex, a ako si pamätáte, v predchádzajúcich článkoch sme diskutovali o histórii vytvorenia tejto skvelej spoločnosti, ktorá je na prvom mieste medzi svojimi konkurentmi v Rusku a mimo neho.

To všetko je dobré, no začiatočníkov aj skúsených tvorcov stránok zaujíma najdôležitejšia otázka, samozrejme, súvisiaca s tým, ako dostať svoje projekty na prvé miesta v TOP výsledkoch vyhľadávania.

Preto sa pozrime na to, ako funguje vyhľadávací nástroj Yandex, aby sme pochopili, na aké chyby môžete vstúpiť a čo vo všeobecnosti očakávať od ruského vyhľadávača.

V minulom článku sme diskutovali. Téma sa ukázala byť celkom zaujímavá a užitočná. Preto som sa rozhodol ho takpovediac doplniť, prehĺbiť.

Takže som sa asi nechal trochu uniesť otázkou „Prečo vyhľadávací nástroj indexuje dokumenty“? Je to zbytočné. Zostáva len zistiť otázku „ako“.

Algoritmy hodnotenia webových stránok

Najprv sa zoznámime s niektorými algoritmami, ktoré sú základom každého vyhľadávacieho nástroja:

— Algoritmus priameho vyhľadávania.

Čo to je - pamätáte si, že ste v jednej z kníh čítali nádherný príbeh. A začnete hľadať jeden po druhom. Zobrali jednu knihu, prezreli ju, nenašli, zobrali ďalšiu... Princíp je jasný, ale táto metóda je extrémne dlhá. To je tiež pochopiteľné.

— Algoritmus spätného vyhľadávania.

Pre tento algoritmus sa z každej stránky vášho blogu vytvorí textový súbor. Tento súbor uvádza v abecednom poradí VŠETKY slová, ktoré ste použili. Dokonca je uvedená aj pozícia tohto slova v texte (súradnice v texte).

Ide o pomerne rýchlu metódu, no vyhľadávanie už prebieha s nejakou chybou.

Hlavná vec, ktorú treba pochopiť, je, že tento algoritmus nevyhľadáva na internete, nie vyhľadávaním na blogu. A to v samostatnom textovom súbore, ktorý vznikol už dávno. Keď k vám prišla robota. A tieto súbory (reverzné indexy) sú uložené na serveroch Yandex.

Takže toto boli základné vyhľadávacie algoritmy. Tie. ako Yandex jednoducho nájde potrebné dokumenty. Zdá sa, že s tým by nemali byť žiadne problémy.

Ale Yandex pozná viac ako jeden alebo dokonca 100 dokumentov, ale podľa najnovších údajov z mojich zdrojov Yandex pozná asi 11 miliárd dokumentov (10 727 736 489 strán).

A medzi všetkým týmto množstvom musíte vybrať dokumenty, ktoré zodpovedajú požiadavke. A čo je dôležitejšie, musíte ich nejako zoradiť. Tie. usporiadať podľa miery dôležitosti, respektíve podľa miery užitočnosti pre čitateľa.

Matematické modely vyhľadávania

Na vyriešenie tohto problému prichádzajú na záchranu matematické modely. Teraz budeme hovoriť o najjednoduchších modeloch.

Booleovský matematický model– Ak sa v dokumente objaví slovo, dokument sa považuje za nájdený. Len náhoda a nič zložité.

Ale sú tu problémy. Napríklad, ak ako používateľ zadáte nejaké populárne slovo alebo ešte lepšie predložku „v“, ktorá je najbežnejším slovom v ruštine a nachádza sa v KAŽDOM dokumente, dostanete toľko výsledkov že si také číslo ani neuvedomujete, Koľko dokladov ste našli? Preto sa objavil nasledujúci model rohože.

Vektorový matematický model– tento model určuje „hmotnosť“ dokumentu. Nielenže sa náhoda vyskytuje, ale slovo sa musí vyskytnúť niekoľkokrát. Navyše, čím viac sa slovo objavuje, tým vyššia je jeho relevantnosť (súlad).

Je to vektorový model, ktorý používajú VŠETKY vyhľadávače.

Pravdepodobný model- viac komplexné. Princíp je takýto: vyhľadávač si šablónu stránky našiel sám. Napríklad hľadáte informácie o histórii Yandex. Yandex ukladá nejaký štandard, povedzme, že toto bude môj predchádzajúci článok o Yandex.

A všetky ostatné dokumenty porovná s týmto článkom. A logika je tu takáto: čím viac je vaša blogová stránka podobná môjmu článku, tým PRAVDEPODOBNEJŠIE je skutočnosť, že vaša blogová stránka bude užitočná aj pre čitateľa a tiež rozpráva o histórii Yandexu.

Pre zníženie počtu dokumentov, ktoré je potrebné používateľovi ukázať, bol zavedený koncept relevantnosti, t.j. súlad.

Do akej miery je vaša blogová stránka relevantná pre danú tému? Toto je dôležitá téma, pokiaľ ide o kvalitu vyhľadávania.

Hodnotitelia – kto sú a za čo sú zodpovední?

Tento význam je potrebný aj na posúdenie kvality algoritmov.

Na tento účel existuje veliteľstvo špeciálnych síl - nazývajú sa posudzovatelia. Sú to špeciálni ľudia, ktorí si prezerajú výsledky vyhľadávania rukami.

Majú návod, ako kontrolovať stránky, ako hodnotiť atď. A manuálne určujú, či sú vaše stránky vhodné pre vyhľadávacie dopyty alebo nie.

A kvalita vyhľadávacích algoritmov závisí od názoru hodnotiteľov. Ak všetci hodnotitelia tvrdia, že výsledky vyhľadávania nezodpovedajú požiadavkám, znamená to, že algoritmus hodnotenia je nesprávny a na vine je len Yandex.

Ak hodnotitelia povedia, že len jedna lokalita nevyhovuje požiadavke, znamená to, že lokalita letí niekam ďaleko a je vo výsledkoch vyhľadávania znížená. Presnejšie, nie celý web, ale iba jeden článok, ale o to „nejde“.

Samozrejme, posudzovatelia nemôžu kontrolovať a hodnotiť VŠETKY články rukami a očami. To je pochopiteľné.

A na pomoc prichádzajú ďalšie parametre, podľa ktorých sú stránky zoradené.

Je ich veľa, napr.

  • hmotnosť stránky (vIC, PageRank, detské hrbolčeky Všetko vo všetkom);
  • autorita domény;
  • relevantnosť textu k žiadosti;
  • relevantnosť textov externých odkazov k dopytu;
  • ako aj mnoho ďalších faktorov hodnotenia.

Hodnotitelia komentujú a ľudia, ktorí sú zodpovední za nastavenie matematického hodnotiaceho modelu, zasa upravujú vzorec, vďaka čomu vyhľadávač funguje efektívnejšie.

Hlavné kritériá hodnotenia účinnosti vzorca:

1. Presnosť výsledkov vyhľadávača- percento dokumentov, ktoré zodpovedajú žiadosti (relevantné). Tie. Čím menej stránok nezodpovedá požiadavke, tým lepšie.

2. Úplnosť výsledkov vyhľadávača- ide o pomer relevantných webových stránok pre daný dopyt k celkovému počtu relevantných dokumentov v kolekcii (celkový počet stránok nájdených vo vyhľadávači).

Ak je napríklad v celej kolekcii viac relevantných stránok ako vo výsledkoch vyhľadávania, znamená to, že výsledky sú neúplné. Stalo sa to preto, že niektoré relevantné webové stránky boli filtrované.

3. Relevantnosť výsledkov vyhľadávača- ide o súlad webovej stránky s tým, čo je napísané v úryvku. Dokument môže byť napríklad veľmi odlišný alebo vôbec neexistuje, no stále sa môže nachádzať vo výsledkoch vyhľadávania.

Relevantnosť výsledkov vyhľadávania priamo závisí od toho, ako často vyhľadávací robot skenuje dokumenty zo svojej zbierky.

Zber kolekcie (indexovanie stránok lokality) vykonáva špeciálny program - vyhľadávací robot.

Vyhľadávací robot dostane zoznam adries na indexovanie, skopíruje ich a potom odošle obsah skopírovaných webových stránok na spracovanie do algoritmu, ktorý ich prevedie na reverzné indexy.

No, takpovediac „v skratke“, diskutovali sme o princípoch vyhľadávacieho nástroja.

Poďme si to zhrnúť:

  1. Na váš blog príde vyhľadávací robot.
  2. Vyhľadávací robot uloží reverzný index stránky pre následné vyhľadávanie.
  3. Pomocou matematického modelu sa dokument spracuje a zobrazí vo výsledkoch vyhľadávania pomocou vzorcov a s prihliadnutím na názor posudzovateľa.

Toto je veľmi, veľmi zjednodušené. Len pre základné pochopenie toho, ako funguje vyhľadávací nástroj Yandex.

Teraz som napísal toľko textu a možno toľko nie je jasné. Preto vám navrhujem vrátiť sa k tomuto článku o niečo neskôr a pozrieť si toto video.

Je to vynikajúci sprievodca, z ktorého som sa svojho času naučil aj ja.

Dúfam, že vám tieto informácie pomôžu lepšie pochopiť, prečo jedna z vašich stránok obsadzuje vhodné pozície vo vyhľadávaní, a urobíte všetko pre to, aby ste ich zlepšili.

Týmto sa s vami lúčim, ak máte nejaké otázky, vždy ich rád zodpoviem v komentároch. Alebo možno chcete pridať do článku?

V každom prípade vyjadrite svoj názor. !

Dnes sme sa vydali na ďalšiu dlhú cestu cestovania po zdobených cestách vývoja vyhľadávačov ( Yandex, Yandex). Myslím, že domáci gigant online vyhľadávania už dávno narástol na takú úroveň, že nie je lenivý prehrabávať sa vo všetkých jeho zákutiach, spomeňte si, ako sa vyvíjal vyhľadávač Yandex, a čo bolo zaujímavé za všetky tie roky jeho existencie.

Okrem toho dostáva veľa návštevníkov z vyhľadávacieho nástroja Yandex. Veľa z nich odchádza cez kontextovú reklamu, nedávno som prevzal blog, takže si myslím, že táto firma je viac než hodná toho, aby sa o nej napísala veľká publikácia.

Ak vezmeme do úvahy ruský internet, potom je Yandex nesporným lídrom. V Rusku je to prvý najdôležitejší vyhľadávací nástroj. Existujú regionálne vyhľadávače, akési pobočky v Bielorusku, na Ukrajine a v Kazachstane. Yandex je medzi obyvateľmi týchto krajín veľmi populárny. Môžem to posúdiť aspoň podľa štatistík, keď vidím, že veľa návštevníkov prichádza z iných regiónov.

V súčasnosti nie je Yandex len vyhľadávacím nástrojom, je to aj množstvo služieb, ku ktorým majú prístup úplne všetci používatelia tohto vyhľadávacieho nástroja. Tu môžete nájsť potrebné informácie a orientovať sa pri výbere voľnočasových aktivít, nájsť obrázky, produkty, porovnať ceny, zistiť počasie, komunikovať na sociálnej sieti, sledovať televíziu a cestovné poriadky. Existuje množstvo podnikových riešení. Môžete dokonca prejsť na Narod.ru. Yandex má pohodlný systém, ktorý poskytuje funkcie pre prácu s vašimi webovými stránkami. Medzi najnovšie dostupné inovácie služby patrí, ktorá zostala pomerne dlho platená, no v decembri 2011 sa táto služba stala dostupnou úplne pre každého.

O úžasných technológiách a užitočných službách Yandex by som mohol pokračovať veľmi, veľmi dlho. Preto pre jednoduchosť vnímania informácií rozdelím našu cestu na komponenty. Celú cestu vyhľadávača opíšem v chronologickom poradí podľa rokov – od vzniku až po dnešok.

História vývoja Yandex

80. – 90. roky 20. storočia

História vývoja Yandex má svoje korene v dnes už vzdialených 80. rokoch, v časoch ZSSR. Vtedy sa v Arcadii prvýkrát začal vývoj vyhľadávacieho softvéru. Práce sa vykonávali pod vedením Arkadyho Borkovského a Arkadyho Volozh. To je ten prvý vyhľadávacia technológia dostal názov "Yandex". A samotná webová stránka Yandex, ktorú môžeme vidieť dnes, sa objavila v roku 1996. Vývoj, ktorý sa v tom čase uskutočnil, bol uznaný ako sľubný, v dôsledku čoho sa vedenie spoločnosti CompTek (predaj počítačov a komponentov) a vývojári systému rozhodli o vhodnosti ďalšieho rozvoja technológie a jej predstavenia pre masy. . V tejto súvislosti bola pripravená koncepcia rozvoja projektu zameraná na široké publikum.

Yandex bol oficiálne oznámený až 23. septembra 1997. A v skutočnosti to bola najprv jedna z divízií CompTek International. To znamená, že tam nebola vôbec žiadna nezávislosť. A až v roku 2000 sa Yandex stal spoločnosťou, ktorú možno vidieť dnes. V tom zmysle, že spoločnosť sa už úplne osamostatnila. Nezávislý Yandex.

Mimochodom, dlho pred oznámením vyhľadávacieho nástroja Yandex spoločnosť prišla s názvom. Yandex – znamená „Jazykový index“. Ak sa preloží z angličtiny, ukáže sa to „Ešte ďalší indexer“. Je pravda, že s vývojom vyhľadávača sa začali objavovať ďalšie interpretácie. Napríklad, ak v anglickom indexe preložíte prvé písmeno (I – Z) z angličtiny do ruštiny, dostanete „Yandex“.

Názov „Yandex“ vymysleli Ilya Segalovich (súčasný riaditeľ technológie) a Arkady Volozh

Rok pred oficiálnym vydaním spoločnosti, 18. októbra 1996, sa konala výstava Netcom’96, na ktorej CompTek predstavil prvé produkty vyvíjajúceho sa vyhľadávača. Boli to stránky Yandex.Site a Yandex.Dict. Potom, o šesť mesiacov neskôr, sa objavil Yandex.CD - vyhľadávanie dokumentov na CD ROM a potom sa začal projekt Yandex.Lib. Išlo o knižnicu balíkov Yandex, ktorá bola určená na vkladanie do všetkých druhov aplikácií a databáz.

V čase, keď bol Yandex.ru oficiálne predstavený verejnosti, možno ako zaujímavé zdôrazniť nasledovné:

    Posúdenie relevantnosti dokumentov. V tom čase bol Yandex celkom dobrý v hľadaní kópií a ich vylúčení. Zároveň boli dokumenty prehľadávané v rôznych kódovaniach

    Vyhľadávajte podľa presného tvaru slova. Yashka vedela hľadať s prihliadnutím na morfológiu

    Vyhľadávanie na základe vzdialenosti. Yandex mohol vyhľadávať v rámci odseku pomocou presných fráz

    Jadro hodnotenia relevantnosti stránok fungovalo. Pre každú žiadosť boli vybrané dokumenty s prihliadnutím na súlad (relevanciu) žiadosti. Okrem toho sa pri výbere dokumentov do výsledkov vyhľadávania zohľadňovala frekvencia (hustota) kľúčového slova na stránke. Mimochodom, práve pre nedokonalosť (vtedy) tohto algoritmu sa stránky husto nabité kľúčovými slovami, prakticky nezmyselné, objavovali na popredných miestach vo výsledkoch vyhľadávania.

    Pri vyhľadávaní sa brala do úvahy aj vzdialenosť medzi slovami a to, ako sa slová nachádzajú v dokumente

Dizajn webovej stránky Yandex

Úplne prvý dizajn pre webovú stránku Yandex bol dosť primitívny a nedokonalý. Vyvinul ho známy Artemy Lebedev. Vyzeral takto

Mimochodom, v tom istom roku sa otvorilo fórum Yandex. Určené na komunikáciu medzi používateľmi systému a vývojármi. Nápad bol dobrý a fórum fungovalo normálne. Je pravda, že existoval až do roku 2008. Potom došlo k miernemu prehodnoteniu priorít. Pokiaľ viem, uprednostňovala sa socializácia. Yandex tiež začal aktívne rozvíjať svoju vlastnú sociálnu sieť, na základe ktorej sa objavil aktuálny blog, kde sú zverejňované všetky oznámenia Yandex a kde v skutočnosti používatelia komunikujú s vývojármi. Môžete sa sami presvedčiť o starej adrese URL fóra ( http://forum.yandex.ru/yandex/) dnes je presmerovanie známe každému http://webmaster.ya.ru/.

1998

Projekt, ktorý sa rozbehol, ukázal dobrý potenciál a naďalej na ňom pracovali. V roku 1998 bol vyhľadávací nástroj vylepšený a pre používateľov boli predstavené mnohé ďalšie funkcionality. Predovšetkým bolo možné prehľadávať to, čo sa našlo, hľadať podobné dokumenty a oveľa viac. Pracuje sa aj na dizajne domovskej stránky Yandex. Teraz sa trochu zmenila

Ako vidíte, navonok sa nič moc nezmenilo. Väčšina technických prác bola vykonaná

1999

V priebehu roka sa publikum ruského podielu na internete výrazne rozrástlo. Spolu s tým vzrástla kvalita a technológia Yandexu a vývojári zaviedli mnoho vylepšení. Vyhľadávací nástroj Yandex predstavil nového vyhľadávacieho robota, ktorý výrazne zvýšil rýchlosť prehľadávania dokumentov v sieti.

Inovácie, ktoré ovplyvnili používateľské časti funkčnosti, boli nasledovné:

    Teraz je možné vyhľadávať konkrétnejšie – podľa anotácií, titulkov, obrázkov, nadpisov

    Zaviedli sme obmedzenie vyhľadávania na skupine stránok

    Samostatne boli zvýraznené dokumenty v ruštine

Mimochodom, v roku 1999 bol prvýkrát predstavený dnes už dobre známy pojem (tematický citačný index). Pravda, vtedy sa to počítalo dosť primitívne. Autorita stránky (známa aj ako TIC) do značnej miery závisela od počtu stránok, ktoré odkazovali na doménu, ktorá nás zaujíma.

Zmenil sa mimochodom aj dizajn hlavnej stránky. Teraz sa stal niečím podobným tomu súčasnému

V roku 1999 došlo k ďalšej významnej udalosti. Vtedy sa objavil bezplatný nástroj na tvorbu webových stránok, ktorý je nám všetkým známy ako Narod.ru (bezplatná služba hostingu a zdieľania súborov). Mimochodom, tento projekt stále existuje. Mottom tohto projektu bolo: za 60 sekúnd.

rok 2000

Možno to bolo zavedenie nových služieb, ktoré umožnilo Yandexu dosiahnuť zásadne novú úroveň rozvoja. Postupom času si vyhľadávač pevne upevnil svoj status, čo umožnilo výrazne V skutočnosti to bol nový projekt, nie ten, ktorý začal pod záštitou CompTeku.

V roku 1999 sa Arkady Volozh, uvedomujúc si vyhliadky na rozvoj projektu, začal zameriavať iba na propagáciu Yandexu. Problémom však bolo, že bolo potrebné nájsť skúsených partnerov so zručnosťami v oblasti firemnej výstavby. Jediným problémom bolo, že bolo potrebné nájsť partnerov, ktorí by investovali do rozvoja projektu, ale nevyžadovali by si kompletný presun manažmentu pod ich vedenie.

A taký partner sa našiel. Bola to spoločnosť ru-Net Holdings. Na jar 2000 bola s touto spoločnosťou uzavretá investičná zmluva. Tu však došlo k niekoľkým obetiam. Napriek tomu som sa musel vzdať určitého podielu vo vyhľadávači. Podľa dohody dostala firma 1/3 vyhľadávača. To znamená, že od tohto momentu Yandex prestal byť štrukturálnou divíziou CompTeku, ale stal sa nezávislou spoločnosťou, ktorá mala svoje vlastné kancelárie, vlastný manažment, vlastný rozpočet atď. Generálnym riaditeľom spoločnosti sa stal Arkady Volozh.

Myslím si, že Yandex mal veľké šťastie so svojím prvým vodcom, pretože Volozh sa ukázal byť nielen špecialistom na hľadanie potenciálnych partnerov, ale aj dobrým inovátorom. Po začatí samostatného „plávania“ sa v spoločnosti začali obrovské zmeny. Personál bol výrazne doplnený a samotný zdroj dostal od svojich lídrov nový náboj.

Celkovo spoločnosť ru-Net Holdings investovala približne 5 miliónov dolárov. Čo môžem povedať, obchod sa ukázal ako veľmi ziskový, najmä vzhľadom na skutočnosť, že dnes bude prvý vyhľadávací nástroj v RuNet stáť najmenej niekoľko stoviek miliónov dolárov. Toto je najkonzervatívnejší odhad.

Rok 2000 bol významný aj z toho dôvodu, že práve v tomto roku sa začala jasnejšie objavovať multiportalita Yandexu, pretože sa začali objavovať mnohé služby, ktoré neboli priamo viazané na vyhľadávanie. Takýmito službami boli Yandex.News, Yandex.Mail, Postcards a vyhľadávací panel na ya.ru. Okrem toho existovalo mnoho služieb, ktoré sa následne zlúčili a stali sa tým, čo dnes poznáme ako Yandex.Market. Okrem toho ďalšou významnou novinkou bolo zavedenie špecializovaného softvéru na integráciu do používateľských prehliadačov – Yandex Bar.

rok 2001

Tento rok bol zlomový, pretože v roku 2001 sa Yandex stal lídrom Runetu z hľadiska návštevnosti. Okrem toho sa zvýšilo aj množstvo informácií uložených na serveroch spoločnosti. Jeho veľkosť bola 1 terabajt. Mimochodom, tento rok sa objavil aj Yandex.Images. Okrem toho sa objavil elektronický platobný systém Yandex.Money

Okrem toho sa výraznejšie zlepšil dizajn domovskej stránky Yandex. Tu sú odkazy na nové služby a novinky. Môžeme povedať, že vo všeobecnosti sa už objavili obrysy dnešného Yandexu

2002

Tento rok vývojári aktívne pracovali na zlepšení komunikačnej služby - Yandex.Mail. Na filtrovaní korešpondencie sa urobilo veľa práce. Rok 2002 bol rokom zlúčenia troch služieb - Products, Guru a Select do jednej - Yandex.Market. Mimochodom, sami vidíte, že táto služba je veľmi aktuálna aj dnes. Azda prvýkrát za všetky roky investovania sa v roku 2002 objavil cieľ – dosiahnuť sebestačnosť. Bolo potrebné vypracovať strategický systém monetizácie projektu. Navyše taký, ktorý by v budúcnosti prinášal stabilné a veľké zisky. Takýmto modelom sa stal a práve príjmy, ktoré spoločnosť začala získavať z tohto reklamného modelu, umožnili dosiahnuť sebestačnosť oveľa skôr, ako sa očakávalo. Preto môžeme povedať, že rok 2002 bol prelomový z hľadiska vstupu do biznisovo orientovaného modelu, ktorý navyše už začal prinášať svoje ovocie.

2003

V tomto roku pokračovala aktívna práca na službe Yandex.Mail. Tu boli zavedené ďalšie masívne zmeny, ktoré sa dotknú všetkých používateľov systému. Samozrejme, Ya.Mail sa stal funkčnejším a pohodlnejším. Pri pohľade do budúcnosti chcem povedať, že v budúcnosti sa služba tiež vyvíjala veľmi aktívne a jej používatelia videli veľa nových zaujímavých funkcií viac ako raz. Používatelia dostali najmä neobmedzenú veľkosť poštových schránok a nový spamový filter „Obrana proti spamu“. V roku 2003 bol dizajn Yandexu opäť aktualizovaný.

Mimochodom, každý dizajn zodpovedal konkrétnej verzii. Verzia dizajnu z roku 2003 bola ôsma v poradí a vyzerala takto

Každé vydanie novej dizajnovej verzie najprv prechádza obdobím beta testovania. A ak predtým prebiehali beta testy v uzavretom režime, tak tentoraz, počas dvoch týždňov skúšobného testovania nového rozhrania, mohol získať prístup k novému rozhraniu ktokoľvek. Je pravda, že o rok neskôr bola hlavná znova inovovaná, ale úspešnejšie. A v tejto podobe existoval až do roku 2007.

Už v tom čase bol Yandex pomerne renomovanou spoločnosťou, pretože už v roku 2003 bol vyhľadávací nástroj Yandex úspešne implementovaný do prezidentskej webovej stránky. Na jeseň roku 2003 vývojári spustili ďalšie aktualizácie produktu: Yandex.Publisher, Yandex.Server (Yandex.Server), ktoré sa stali dedičstvom Yandex.Site.

2004

Obchodný model, ktorý obsadil prvý vyhľadávací nástroj v RuNet, fungoval veľmi dobre, v dôsledku čoho zisk spoločnosti v roku 2004 už predstavoval desiatky miliónov dolárov. To dalo impulz vývoju nových služieb, napríklad vyhľadávacej služby na mape, blogov a fór. Rok 2004 je významný aj tým, že práve vtedy sa na ruskom trhu objavil vážny konkurent v osobe spoločnosti Google. Vyskytla sa naliehavá potreba vstúpiť do boja o vedenie, v dôsledku čoho sa vedenie spoločnosti Yandex rozhodlo desaťnásobne zvýšiť počet svojich zamestnancov. Spočiatku ich bolo 200, po aktualizácii personálu to bolo 2000 zamestnancov. Ale hlavné je, že po obnove kádra sa nič nezmenilo k horšiemu. Tradície zostali, technológie boli tiež aktuálne. A vo všeobecnosti môžeme povedať, že Yasha sa nezmenila na suchú spoločnosť.

Súboj technológií: Yandex vs Google

rok 2005

Tento rok sa niesol pod heslom geografickej expanzie zastúpenia spoločnosti. Pretože sa objavilo ukrajinské zastúpenie spoločnosti Yandex - Yandex.Ukraine. Mimochodom, riaditeľom tohto zastúpenia je Sergey Petrenko, zakladateľ známeho vyhľadávania a autor zaujímavého blogu BloGnot

Rok 2005 bol významný aj tým, že sa otvoril môj obľúbený. Toto je služba založená na princípe „kolotibablo webmaster“ av ruštine je to služba, ktorá umožňuje webmasterom umiestniť reklamu na svoje stránky.

V tom istom roku sa objavili slovníky Yandex. Zmeny nastali aj v službe Yandex.Money. Teraz majú všetci používatelia možnosť spravovať svoj účet prostredníctvom online peňaženky.

2006

Tento rok sa bude pamätať na vznik dnes už dobre známej služby blogs.yandex.ru. Toto je druh marketingového nástroja. Umožnil mi študovať verejnú mienku, recenzie na blogoch a fórach. Yandex.Maps predstavil nástroj na zobrazovanie dopravných zápch.

Od roku 2006 do roku 2010 sa Yandex nachádzal v starej kancelárii na ulici Samokatnaya v Moskve.





Ako vidíte, predtým boli trochu stiesnené. Toto nie je teraz, obrovská budova pre 2000 zamestnancov.

V roku 2006 došlo k ďalšej zaujímavej udalosti – v Petrohrade bola otvorená prvá kancelária pre vzdialený vývoj. Potom, samozrejme, mierka ešte nebola rovnaká. To nie je ako dnes Yandex má 11 kancelárií v Rusku, na Ukrajine, v Turecku a dokonca aj v Kalifornii. Kancelárie sa líšia podľa typu činnosti. Existujú kancelárie zaoberajúce sa vývojom, obchodné kancelárie, kancelárie, ktoré pracujú v oblasti lokalizácie produktov

2007

Tento rok sa konali akcie, ktoré sú viac zamerané na webmasterov. Objavila sa najmä služba Yandex.Photos. Ale pre mňa ako webmastera je zaujímavejšia udalosť vzhľad služby Yandex.Metrica. Pravda, v tom čase to bola úplne hrubá služba a nebola zameraná na správcov webu, ale na inzerentov Yandex.Direct. V tom istom roku bolo otvorené ukrajinské zastúpenie - Yandex.ua. Dnes podľa LiveInternet takmer 14 % návštevnosti v ruskom jazyku pochádza z yandex.ua

Aj v roku 2007 bol spustený projekt známy všetkým webmasterom, ktorý už asi leniví ľudia nevyužívajú

2008

Dá sa povedať, že tento rok sa sféra vplyvu Yandexu zvýšila natoľko, že bolo rozhodnuté otvoriť pobočku vyhľadávača v USA, Kalifornii. Zároveň boli vykonané významné doplnenia algoritmov. Začali sa podporovať najmä medzinárodné štandardy Sitemap, MediaRSS atď.. To znamená, ako vidíte, oblasti záujmu ďaleko presahujú rámec RuNetu. Vyhľadávacím nástrojom číslo jedna na RuNet sa teraz stali stránky v anglickom jazyku. Predtým bol problém, že domáci vyhľadávač nepodporoval medzinárodné štandardy, a preto sa vyskytol problém s indexovaním stránok z burzhunetu, ale po aktualizácii v roku 2008 sa tento problém vyriešil. A potom sa logo Yandex začalo písať úplne v ruštine.

rok 2009

Tento rok bol významný tým, že predtým neexistovalo rozdelenie vyhľadávania podľa krajov. To znamená, že pred zavedením tohto algoritmu bol postavený na princípoch uniformity. Napríklad zadáte dotaz „“ do vyhľadávacieho panela v Moskve a Novosibirsku a dostanete rovnaké výsledky. Teraz sa všetko zmenilo. A do výsledkov vyhľadávania sa primiešavajú výsledky založené na princípe geodependencie. Zjednodušene povedané, ak budete hľadať pomocou Yandex v Moskve a Novosibirsku, výsledky budú iné.

V roku 2009 pokračovali práce v predtým zvolenom západnom smere. Testovala sa najmä služba, ktorá slúžila na preklady zahraničných stránok. Potom sa táto služba vyvinula av roku 2011 sa stala známou ako Yandex.Translation.

Nemenej dôležitou udalosťou bolo predstavenie novej metódy strojového učenia – Matrixnet. Táto technológia používa na hodnotenie rôzne vzory a zohľadňuje rôzne faktory hodnotenia. Ale hlavné je, že technológia sa učí sama. Pri hodnotení posudzovateľov sa posudzujú len skutočné vzory a objavenie neexistujúcich je úplne vylúčené.

Revolučná povaha tejto technológie spočíva v tom, že Matrixnet používa neuveriteľne zložitý vzorec hodnotenia, ktorý zohľadňuje obrovské množstvo faktorov. To vám na jednej strane umožňuje dosiahnuť lepšie výsledky vyhľadávania, no na druhej strane to neumožní správcom webu pochopiť tento vzorec, a teda ho ovplyvňovať vo svojom vlastnom záujme.

Viac podrobností o technológii matrixnet:

2010

Stará kancelária na ulici Samokatnaya je minulosťou a celá spoločnosť sa presťahovala do nových kaštieľov. V skutočnosti sa to stalo hlavnou udalosťou roku 2010





Dobré popoludnie, milí čitatelia môjho SEO blogu. . Tento článok je o ako funguje vyhľadávací nástroj Yandex aké technológie a algoritmy používa na hodnotenie stránok a ako pripravuje odpoveď pre používateľov. Mnoho ľudí vie, že táto vlajková loď ruského vyhľadávania udáva tón v Runete, vlastní najväčšiu databázu v Eurázii, spracováva obsah viac ako miliardy stránok a pozná odpoveď na akúkoľvek otázku. Podľa údajov Liveinternetu za august 2012 je podiel Yandexu v Rusku 60,5 %. Mesačná návštevnosť portálu je 48,9 milióna ľudí. Pre nás blogerov je ale najdôležitejšie, ako vyhľadávač prijíma naše požiadavky, ako ich spracuje a aký je výsledok. Na jednej strane poznanie a pochopenie týchto informácií nám uľahčuje používanie všetkých zdrojov Yandex; na druhej strane je jednoduchšie propagovať naše blogy. Preto navrhujem, aby ste sa so mnou pozreli na najdôležitejšie technológie najlepšieho vyhľadávacieho nástroja Runet.

Keď sa používateľ internetu chce prvýkrát obrátiť na vyhľadávač, aby získal informácie, môže mať jednu otázku: „Ako funguje vyhľadávanie?“ Ale keď ho dostane, táto otázka sa často zmení na inú: „Prečo tak rýchlo? A naozaj, prečo hľadanie súboru v počítači trvá 20 sekúnd a výsledok požiadavky z celej siete počítačov po celom svete sa objaví za sekundu? Najzaujímavejšie je, že na prvé dve otázky (ako prebieha vyhľadávanie a prečo 1 sekunda) je možné odpovedať jednou odpoveďou - vyhľadávač sa vopred pripravil na požiadavku používateľa.

Aby sme pochopili princíp fungovania Yandexu, podobne ako iné vyhľadávacie nástroje, nakreslíme analógiu s telefónnym zoznamom. Na nájdenie akéhokoľvek telefónneho čísla potrebujete poznať priezvisko predplatiteľa a akékoľvek vyhľadávanie v tomto prípade trvá maximálne minútu, pretože všetky stránky adresára sú súvislým abecedným indexom. Predstavte si však, že by sa vyhľadávanie uskutočnilo pomocou inej možnosti, kde by boli telefónne čísla zoradené podľa samotných čísel. Po takýchto pátraniach, ktoré sa budú naťahovať dlhší čas, zostanú čísla pred očami hľadača ešte veľmi dlho. 🙂

Rovnako tak vyhľadávač zobrazuje všetky informácie z internetu vo forme, ktorá mu vyhovuje. A čo je najdôležitejšie, všetky tieto údaje sú umiestnené v jej adresári vopred, ešte predtým, ako príde návštevník so svojimi požiadavkami. To znamená, že keď položíme Yandexu otázku, už pozná našu odpoveď. A dá nám to za sekundu. Táto druhá časť však zahŕňa množstvo dôležitých procesov, ktoré teraz podrobne zvážime.

Internetové indexovanie

Yandex ru zhromažďuje všetky informácie, ku ktorým sa dostane na internete. Pomocou špeciálneho vybavenia sa kontroluje všetok obsah vrátane obrázkov na základe vizuálnych parametrov. Vyhľadávací nástroj sa zaoberá takýmto zberom a proces zberu a prípravy údajov sa nazýva indexovanie. Základom takéhoto stroja je počítačový systém, ktorý sa inak nazýva vyhľadávací robot. Pravidelne prehľadáva indexované stránky, kontroluje ich nový obsah a tiež prehľadáva internet, či neobsahuje odstránené stránky. Ak zistí, že takáto stránka už neexistuje alebo je zatvorená z indexovania, odstráni ju z vyhľadávania.

Ako vyhľadávací robot nájde nové stránky? Po prvé, vďaka odkazom z iných stránok. Pretože ak je odkaz umiestnený na nový webový zdroj z už indexovanej stránky, potom pri ďalšej návšteve druhej stránky robot navštívi prvú. Po druhé, existuje skvelá služba, ľudovo nazývaná „addurlka“ (z anglického výrazu -addurl - pridať adresu). V ňom môžete zadať adresu svojej novej stránky, ktorú po chvíli navštívi vyhľadávací robot. Po tretie, pomocou špeciálneho programu „Yandex.Bar“ sa sledujú návštevy používateľov, ktorí ho používajú. Preto, ak sa človek dostane na nový webový zdroj, čoskoro sa tam objaví robot.

Sú všetky stránky zahrnuté do vyhľadávania? Každý deň sa indexujú milióny stránok. Medzi nimi sú stránky rôznej kvality, ktoré môžu obsahovať rôzne informácie – od jedinečného obsahu až po úplný odpad. Navyše, ako hovoria štatistiky, na internete je oveľa viac odpadu. Vyhľadávací robot analyzuje každý dokument pomocou špeciálnych algoritmov. Zisťuje, či má nejaké užitočné informácie a či dokáže odpovedať na požiadavku používateľa. Ak nie, potom takéto stránky nie sú akceptované ako „kozmonauti“, ale ak áno, potom sú zahrnuté do vyhľadávania.

Keď robot navštívi stránku a určí jej užitočnosť, zobrazí sa v úložisku vyhľadávacieho nástroja. Tu analyzujeme akýkoľvek dokument až do úplných základov, ako hovoria majstri automatického centra - až po ozubené kolesá. Stránka je vyčistená od html značiek, čistý text prechádza úplnou inventarizáciou - vypočíta sa umiestnenie každého slova. V tejto rozloženej podobe sa stránka zmení na tabuľku s číslami a písmenami, ktorá sa inak nazýva index. Teraz, bez ohľadu na to, čo sa stane s webovým zdrojom, ktorý obsahuje túto stránku, jeho najnovšia kópia je vždy dostupná vo vyhľadávaní. Aj keď stránka už neexistuje, kópie jej dokumentov sú nejaký čas uložené na internete.

Každý index spolu s údajmi o typoch dokumentov, kódovaní, jazyku spolu s kópiami tvorí vyhľadávanie v databáze . Je pravidelne aktualizovaný, takže sa nachádza na špeciálnych serveroch, pomocou ktorých sa spracúvajú požiadavky používateľov vyhľadávačov.

Ako často prebieha proces indexovania? V prvom rade to závisí od typu stránok. Prvý typ webového zdroja mení obsah svojich stránok veľmi často. To znamená, že keď na tieto stránky zakaždým príde vyhľadávací robot, zakaždým obsahujú iný obsah. Nabudúce pomocou nich nebudete môcť nič nájsť, takže takéto stránky nie sú zahrnuté v indexe. Druhým typom stránok je dátový sklad, na ktorého stránkach sa pravidelne pridávajú odkazy na dokumenty na stiahnutie. Obsah takejto stránky sa zvyčajne nemení, takže ju robot navštevuje veľmi zriedka. Ostatné stránky závisia od frekvencie aktualizácie materiálu. To znamená nasledovné: čím rýchlejšie sa nový obsah objaví na stránke, tým častejšie prichádza vyhľadávací robot. A prioritu majú ako prvé najdôležitejšie webové zdroje (napríklad spravodajská stránka je rádovo dôležitejšia ako akýkoľvek blog).

Indexovanie vám umožňuje vykonávať prvú funkciu vyhľadávacieho nástroja - zhromažďovanie informácií o nových stránkach na internete. Yandex má však aj druhú funkciu - vyhľadávanie odpovede na požiadavku používateľa v už pripravenej vyhľadávacej databáze.

Yandex pripravuje odpoveď

Proces spracovania žiadosti a vydávanie relevantných odpovedí zabezpečuje počítačový systém "Metasearch" . Pre svoju prácu najskôr zhromažďuje všetky vstupné informácie: z ktorého regiónu bola požiadavka podaná, do akej triedy patrí, či sú v požiadavke chyby atď. Po takomto spracovaní metasearch skontroluje, či sú v databáze úplne rovnaké dopyty s rovnakými parametrami. Ak je odpoveď áno, systém zobrazí používateľovi predtým uložené výsledky. Ak takáto otázka v databáze neexistuje, metasearch osloví vyhľadávaciu databázu, ktorá obsahuje údaje indexu.

A práve tu sa dejú úžasné veci. Predstavte si, že existuje jeden super výkonný počítač, v ktorom je uložený celý internet spracovaný vyhľadávacími robotmi. Používateľ nastaví dotaz a v pamäťových bunkách sa začne hľadať všetky dokumenty zahrnuté v dotaze. Odpoveď sa našla a všetci sú spokojní. Ale zoberme si iný prípad, keď je v ich tele veľa žiadostí obsahujúcich rovnaké slová. Systém musí zakaždým prejsť rovnakými pamäťovými bunkami, čo môže výrazne predĺžiť čas potrebný na spracovanie údajov. V súlade s tým sa čas zvyšuje, čo môže viesť k strate používateľa - obráti sa na iný vyhľadávač o pomoc.

Aby sa predišlo takýmto oneskoreniam, všetky kópie v indexe lokality sú distribuované na rôznych počítačoch. Po odoslaní požiadavky metasearch prikáže takýmto serverom, aby vyhľadali ich časť textu. Potom sa všetky údaje z týchto strojov vrátia do centrálneho počítača, skombinuje všetky získané výsledky a poskytne používateľovi desať najlepších odpovedí. Pomocou tejto technológie sú zabité dva vtáky naraz: čas vyhľadávania sa niekoľkokrát skráti (odpoveď sa získa v zlomku sekundy) a vďaka nárastu platforiem sa informácie duplikujú (údaje sa nestratia v dôsledku náhlych porúch) . Samotné počítače s duplicitnými informáciami tvoria dátové centrum - to je miestnosť so servermi.

Keď používateľ vyhľadávača zadá dotaz, 20-krát zo 100, ciele v otázke sú nejednoznačné. Napríklad, ak do vyhľadávacieho panela napíše slovo „Napoleon“, potom ešte nie je známe, akú odpoveď očakáva - recept na koláč alebo biografiu veľkého veliteľa. Alebo fráza „Bratia Grimmovci“ - rozprávky, filmy, hudobná skupina. Na zúženie takéhoto možného rozsahu cieľov na konkrétne odpovede má Yandex špeciálnu technológiu Rozsah. Zohľadňuje potreby používateľov pomocou štatistík vyhľadávacích dopytov. Zo všetkých otázok, ktoré návštevníci položili v Yandex, Spectrum v nich identifikuje rôzne objekty (mená ľudí, názvy kníh, modely áut atď.) Tieto objekty sú rozdelené do určitých kategórií. V súčasnosti existuje viac ako 60 takýchto kategórií. S ich pomocou má vyhľadávač vo svojej databáze rôzne významy slov v dopytoch používateľov. Je zaujímavé, že tieto kategórie sa pravidelne kontrolujú (analýza sa vykonáva niekoľkokrát týždenne), čo umožňuje spoločnosti Yandex presnejšie poskytovať odpovede na položené otázky.

Na základe technológie Spectrum usporiadal Yandex dialógové výzvy. Zobrazujú sa pod vyhľadávacím panelom, do ktorého používateľ zadáva svoj nejednoznačný dopyt. Tento riadok odráža kategórie, do ktorých môže patriť predmet otázky. Ďalšie výsledky vyhľadávania závisia od výberu tejto kategórie používateľom.

Od 15 do 30% všetkých používateľov vyhľadávacieho nástroja Yandex chce dostávať iba miestne informácie (údaje z regiónu, v ktorom žijú). Napríklad o nových filmoch v kinách vo vašom meste. Preto by odpoveď na takúto žiadosť mala byť pre každý región iná. V tomto ohľade Yandex využíva svoju technológiu vyhľadávanie podľa regiónov . Toto sú napríklad odpovede, ktoré môžu dostať obyvatelia, ktorí hľadajú repertoár filmov vo svojom kine Oktyabr:

Toto je však výsledok, ktorý obyvatelia mesta Stavropol dostanú za rovnakú žiadosť:

Región používateľa je určený predovšetkým jeho IP adresou. Niekedy tieto údaje nie sú presné, pretože viacero poskytovateľov môže pôsobiť vo viacerých regiónoch naraz, a teda meniť IP adresy svojich používateľov. V princípe, ak sa vám to stane, svoj región si jednoducho zmeníte v nastaveniach vo vyhľadávači. Je uvedený v pravom hornom rohu stránky s výsledkami. Môžete to zmeniť.

Vyhľadávač Yandex ru - výsledky odpovedí

Keď Metasearch pripraví odpoveď, vyhľadávací nástroj Yandex by ju mal zobraziť na stránke s výsledkami. Je to zoznam odkazov na nájdené dokumenty s malými informáciami o každom z nich. Úlohou technológie na vydávanie výsledkov je poskytnúť používateľovi čo najrelevantnejšie odpovede tým najinformatívnejším spôsobom. Šablóna pre jeden takýto odkaz vyzerá takto:

Pozrime sa na túto formu výsledku podrobnejšie. Pre názov výsledku vyhľadávania Yandex často používa názov názvu stránky (to, čo optimalizátori píšu do značky názvu). Ak tam nie je, tak sa tu objavia slová z nadpisu článku alebo príspevku. Ak je text nadpisu veľký, vyhľadávací nástroj umiestni do tohto poľa fragment, ktorý je pre daný dopyt najrelevantnejší.

Veľmi zriedka, ale stáva sa, že názov nezodpovedá obsahu požiadavky. V tomto prípade Yandex vytvorí názov výsledku vyhľadávania pomocou textu v článku alebo príspevku. Určite bude mať dopytovacie slová.

Pre úryvok vyhľadávač použije celý text na stránke. Vyberie všetky fragmenty, v ktorých sa nachádza odpoveď na dotaz, a potom vyberie ten najrelevantnejší a do poľa formulára vloží odkazy na dokument. Vďaka tomuto prístupu ho môže kompetentný optimalizátor po zhliadnutí úryvku prerobiť, čím zvýši atraktivitu odkazu.

Pre lepšie vnímanie výsledku požiadavky používateľa sú nadpisy v texte formátované ako odkazy (zvýraznené modrou farbou s podčiarknutím). Aby bol webový zdroj atraktívny a rozpoznateľný, pridáva sa favicon – malá firemná ikona stránky. Zobrazuje sa naľavo od textu v prvom riadku pred nadpisom. Všetky slová, ktoré boli zahrnuté v žiadosti v odpovedi, sú tiež zvýraznené tučným písmom, aby sa uľahčilo vnímanie.

Vyhľadávací nástroj Yandex v poslednej dobe pridáva do úryvku rôzne informácie, ktoré používateľovi pomôžu nájsť svoju odpoveď ešte rýchlejšie a presnejšie. Napríklad, ak používateľ vo svojej žiadosti napíše názov organizácie, Yandex pridá do úryvku jej adresu, kontaktné čísla a odkaz na miesto v geografických mapách. Ak je vyhľadávač oboznámený so štruktúrou stránky, ktorá obsahuje dokument s odpoveďou pre používateľa, určite ju zobrazí. Okrem toho môže Yandex okamžite pridať najnavštevovanejšie stránky takéhoto webového zdroja do úryvku, takže v prípade potreby môže návštevník okamžite prejsť do sekcie, ktorú potrebuje, čím ušetrí čas.

Existujú úryvky, ktoré obsahujú cenu produktu pre internetový obchod, hodnotenie hotela alebo reštaurácie vo forme hviezdičiek a ďalšie zaujímavé informácie s rôznymi číslami o objektoch vo vyhľadávacích dokumentoch. Účelom takýchto informácií je poskytnúť úplný zoznam údajov o tých položkách alebo objektoch, ktoré sú pre používateľa zaujímavé.

Vo všeobecnosti s rôznymi príkladmi bude stránka s odpoveďami vyzerať takto:

Poradie a posudzovatelia

Úloha Yandexu zahŕňa nielen vyhľadávanie všetkých možných možností odpovedí, ale aj výber tých najlepších (relevantných). Používateľ sa predsa nebude prehrabávať všetkými odkazmi, ktoré mu Yandex poskytne ako výsledok vyhľadávania. Proces organizácie výsledkov vyhľadávania je tzv poradie . To znamená, že je to poradie, ktoré určuje kvalitu navrhovaných odpovedí.

Existujú pravidlá, podľa ktorých Yandex určuje relevantné stránky:

  • Stránky, ktoré zhoršujú kvalitu vyhľadávania, budú v pozíciách na stránke s výsledkami znížené. Zvyčajne ide o webové zdroje, ktorých majitelia sa snažia oklamať vyhľadávač. Ide napríklad o stránky so stránkami obsahujúcimi nezmyselný alebo neviditeľný text. Samozrejme, je to viditeľné a zrozumiteľné pre vyhľadávacieho robota, ale nie pre návštevníka, ktorý číta tento dokument. Alebo stránky, ktoré po kliknutí na odkaz v oblasti výsledkov vyhľadávania okamžite prevedú používateľa na úplne inú stránku.
  • Stránky s erotickým obsahom nie sú zahrnuté vo výsledkoch alebo sú výrazne znížené v hodnotení. Je to spôsobené tým, že takéto webové zdroje často používajú agresívne metódy propagácie.
  • Stránky infikované vírusmi sa neznižujú vo výsledkoch vyhľadávania a nie sú vylúčené z výsledkov vyhľadávania - v tomto prípade je používateľ o nebezpečenstve informovaný pomocou špeciálnej ikony. Dôvodom je skutočnosť, že Yandex predpokladá, že takéto webové zdroje môžu obsahovať dôležité dokumenty na žiadosť návštevníka vyhľadávacieho nástroja.

Takto napríklad Yandex zoradí stránky pre dopyt „jablko“:

Okrem faktorov hodnotenia používa Yandex špeciálne vzorky s otázkami a odpoveďami, ktoré používatelia vyhľadávačov považujú za najvhodnejšie. Takéto vzorky v súčasnosti nedokáže vyrobiť žiadny stroj – to je výsada človeka. V Yandex sa takíto špecialisti nazývajú posudzovateľov. Ich úlohou je plne analyzovať všetky vyhľadávané dokumenty a vyhodnocovať odpovede na zadané otázky. Vyberú najlepšie odpovede a vytvoria špeciálny tréningový set. Vyhľadávač v ňom vidí vzťah medzi relevantnými stránkami a ich vlastnosťami. Na základe takýchto informácií môže Yandex vybrať optimálny vzorec hodnotenia pre každú požiadavku. Metóda na zostavenie takéhoto vzorca sa nazýva Matrixnet. Výhodou tohto systému je odolnosť voči prepasovaniu, čo umožňuje brať do úvahy veľké množstvo faktorov hodnotenia bez zvyšovania počtu zbytočných hodnotení a vzorov.

Na konci môjho príspevku vám chcem ukázať zaujímavé štatistiky zhromaždené vyhľadávacím nástrojom Yandex v procese svojej práce.

1. Popularita osobných mien v Rusku a ruských mestách (údaje prevzaté z účtov blogerov a používateľov sociálnych sietí v marci 2012).

Veľký vidca

V roku 1863 napísal veľký spisovateľ Jules Verne svoju ďalšiu knihu „Paríž v 20. storočí“. Podrobne v nej opísal metro, auto, elektrické kreslo, počítač a dokonca aj internet. Vydavateľ však knihu odmietol vytlačiť a ležala tam viac ako 120 rokov, kým ju v roku 1989 nenašiel pravnuk Julesa Verna. Kniha vyšla v roku 1994.

1. Pojmy a definície V tejto zmluve o spracovaní osobných údajov (ďalej len Zmluva) majú nižšie uvedené pojmy nasledujúce definície: Prevádzkovateľ - Fyzická osoba podnikateľ Oleg Aleksandrovich Dneprovsky. Prijatie Zmluvy - úplné a bezvýhradné prijatie všetkých podmienok Zmluvy odoslaním a spracovaním osobných údajov. Osobné údaje – informácie zadané Používateľom (subjekt osobných údajov) na stránku a priamo alebo nepriamo súvisiace s týmto Používateľom. Používateľ - každá fyzická alebo právnická osoba, ktorá úspešne dokončila postup vyplnenia vstupných polí na stránke. Vyplnenie vstupných polí je postup, ktorým Používateľ odošle svoje meno, priezvisko, telefónne číslo, osobnú e-mailovú adresu (ďalej len Osobné údaje) do databázy registrovaných používateľov stránky, vykonávaný za účelom identifikácie používateľ. V dôsledku vyplnenia vstupných polí sú osobné údaje odoslané do databázy Prevádzkovateľa. Vyplnenie vstupných polí je dobrovoľné. webová stránka - webová stránka umiestnená na internete a pozostávajúca z jednej stránky. 2. Všeobecné ustanovenia 2.1. Táto dohoda je vypracovaná na základe požiadaviek federálneho zákona z 27. júla 2006 č. 152-FZ „O osobných údajoch“ a ustanovení článku 13.11 o „Porušovaní právnych predpisov Ruskej federácie v oblasti osobné údaje“ Kódexu správnych deliktov Ruskej federácie a platí pre všetky osobné údaje, ktoré môže Prevádzkovateľ o Používateľovi získať pri používaní Stránky. 2.2. Vyplnenie vstupných polí Používateľom na Stránke znamená bezpodmienečný súhlas Používateľa so všetkými podmienkami tejto Zmluvy (Prijatie Zmluvy). V prípade nesúhlasu s týmito podmienkami Užívateľ nevypĺňa vstupné polia na Stránke. 2.3. Súhlas Používateľa s poskytnutím osobných údajov Prevádzkovateľovi a ich spracovaním Prevádzkovateľom platí do ukončenia činnosti Prevádzkovateľa alebo do odvolania súhlasu Používateľom. Prijatím tejto Zmluvy a vykonaním Registračného postupu, ako aj následným vstupom na Stránku Používateľ potvrdzuje, že konajúc z vlastnej vôle a vo vlastnom záujme odovzdáva svoje osobné údaje na spracovanie Prevádzkovateľovi a súhlasí s tým, ich spracovanie. Používateľ je upozornený, že spracovanie jeho osobných údajov bude Prevádzkovateľ vykonávať na základe federálneho zákona z 27. júla 2006 č. 152-FZ „O osobných údajoch“. 3. Zoznam osobných údajov a iných informácií o používateľovi, ktoré majú byť prenesené Prevádzkovateľovi 3. 1. Používateľ pri používaní Webovej stránky Prevádzkovateľa poskytuje nasledovné osobné údaje: 3.1.1. Spoľahlivé osobné údaje, ktoré používateľ o sebe poskytne nezávisle pri vypĺňaní vstupných polí a/alebo v procese používania služieb stránky, vrátane priezviska, mena, priezviska, telefónneho čísla (domáceho alebo mobilného), osobnej e-mailovej adresy. 3.1.2. Údaje, ktoré sa automaticky prenášajú do služieb Stránky počas ich používania pomocou softvéru nainštalovaného na zariadení Používateľa, vrátane IP adresy, informácií zo súborov cookie, informácií o prehliadači Používateľa (alebo inom programe, prostredníctvom ktorého sa k službám pristupuje). 3.2. Prevádzkovateľ neoveruje správnosť osobných údajov poskytnutých Používateľom. Prevádzkovateľ v tomto prípade predpokladá, že Používateľ poskytuje spoľahlivé a dostatočné osobné informácie o otázkach navrhnutých vo Vstupných poliach. 4. Účely, pravidlá zhromažďovania a používania osobných údajov 4.1. Prevádzkovateľ spracúva osobné údaje, ktoré sú nevyhnutné na poskytovanie služieb a poskytovanie služieb Užívateľovi. 4.2. Osobné údaje Užívateľa využíva Prevádzkovateľ na tieto účely: 4.2.1. Identifikácia užívateľa; 4.2.2. Poskytovanie personalizovaných služieb Používateľovi (ako aj informovanie o nových akciách a službách spoločnosti zasielaním listov); 4.2.3. Udržiavanie kontaktu s Používateľom v prípade potreby vrátane zasielania upozornení, žiadostí a informácií súvisiacich s využívaním služieb, poskytovaním služieb, ako aj vybavovaním žiadostí a žiadostí Používateľa; 4.3. Pri spracúvaní osobných údajov sa budú vykonávať tieto úkony: zhromažďovanie, zaznamenávanie, systematizácia, zhromažďovanie, uchovávanie, objasňovanie (aktualizácia, zmena), extrakcia, použitie, blokovanie, vymazanie, zničenie. 4.4. Používateľ nenamieta, že ním uvedené informácie v určitých prípadoch môžu byť poskytnuté oprávneným štátnym orgánom Ruskej federácie v súlade s platnou legislatívou Ruskej federácie. 4.5. Osobné údaje Užívateľa sú uchovávané a spracovávané Prevádzkovateľom spôsobom uvedeným v tejto Zmluve po celú dobu činnosti Prevádzkovateľa. 4.6. Spracúvanie osobných údajov vykonáva Prevádzkovateľ vedením databáz, automatizovanými, mechanickými a manuálnymi metódami. 4.7. Stránka používa súbory cookie a ďalšie technológie na sledovanie používania služieb lokality. Tieto údaje sú potrebné na optimalizáciu technickej prevádzky Stránky a zlepšenie kvality poskytovania služieb. Stránka automaticky zaznamenáva informácie (vrátane URL, IP adresy, typu prehliadača, jazyka, dátumu a času požiadavky) o každom návštevníkovi Stránky. Používateľ má právo odmietnuť poskytnutie osobných údajov pri návšteve Stránky alebo zakázať Cookies, avšak v tomto prípade nemusia všetky funkcie Stránky fungovať správne. 4.8. Podmienky mlčanlivosti uvedené v tejto zmluve sa vzťahujú na všetky informácie, ktoré môže Prevádzkovateľ získať o Používateľovi počas jeho pobytu na Stránke a používania Stránky. 4.9. Informácie, ktoré sa zverejnia počas vykonávania tejto zmluvy, ako aj informácie, ktoré môžu zmluvné strany alebo tretie strany získať zo zdrojov, ku ktorým má ľubovoľná osoba voľný prístup, nie sú dôverné. 4.10. Prevádzkovateľ prijíma všetky potrebné opatrenia na ochranu dôvernosti osobných údajov Používateľa pred neoprávneným prístupom, úpravou, zverejnením alebo zničením, vrátane: zabezpečenia neustáleho interného overovania procesov zhromažďovania, uchovávania a spracovania údajov a zaistenia bezpečnosti; zabezpečuje fyzickú bezpečnosť údajov, bráni neoprávnenému prístupu k technickým systémom, ktoré zabezpečujú prevádzku Stránky, v ktorej Prevádzkovateľ uchováva osobné údaje; poskytuje prístup k osobným údajom len tým zamestnancom Prevádzkovateľa alebo oprávneným osobám, ktoré tieto informácie potrebujú na plnenie povinností priamo súvisiacich s poskytovaním služieb Užívateľovi, ako aj s prevádzkou, vývojom a zlepšovaním Stránky. 4.11. Osobné údaje Používateľa zostávajú dôverné, okrem prípadov, keď Používateľ dobrovoľne poskytne informácie o sebe pre všeobecný prístup neobmedzenému počtu osôb. 4.12. Prenos osobných údajov Používateľa zo strany Prevádzkovateľa je zákonný počas reorganizácie Prevádzkovateľa a prechodu práv na právneho nástupcu Prevádzkovateľa, pričom všetky povinnosti dodržiavať podmienky tejto Zmluvy vo vzťahu k ním prijatým osobným údajom sú zákonné. prejde na právneho nástupcu. 4.13. Toto vyhlásenie sa vzťahuje len na webovú stránku Prevádzkovateľa. Spoločnosť nekontroluje a nezodpovedá za stránky (služby) tretích strán, ku ktorým má používateľ prístup prostredníctvom odkazov dostupných na Webovej stránke Prevádzkovateľa, a to aj vo výsledkoch vyhľadávania. Na takýchto stránkach (službách) sa môžu zhromažďovať alebo požadovať od používateľa ďalšie osobné údaje a môžu sa vykonávať iné akcie 5. Práva užívateľa ako subjektu osobných údajov, zmena a vymazanie osobných údajov užívateľom 5.1. Užívateľ má právo: 5.1.2. Vyžadovať od Prevádzkovateľa, aby objasnil jeho osobné údaje, zablokoval ich alebo zlikvidoval, ak sú osobné údaje neúplné, neaktuálne, nepresné, získané nezákonne alebo nie sú potrebné na uvedený účel spracúvania, a tiež prijal zákonom stanovené opatrenia na ochranu jeho práv. 5.1.3. Dostávať informácie o spracúvaní jeho osobných údajov vrátane informácií obsahujúcich: 5.1.3.1. potvrdenie skutočnosti o spracúvaní osobných údajov Prevádzkovateľom; 5.1.3.2. účely a spôsoby spracúvania osobných údajov, ktoré prevádzkovateľ používa; 5.1.3.3. meno a sídlo Prevádzkovateľa; 5.1.3.4. spracúvané osobné údaje súvisiace s príslušným subjektom osobných údajov, zdroj ich získania, pokiaľ federálny zákon neustanovuje iný postup na predkladanie takýchto údajov; 5.1.3.5. podmienky spracovania osobných údajov vrátane doby ich uchovávania; 5.1.3.6. ďalšie informácie stanovené v platnej legislatíve Ruskej federácie. 5.2. Odvolanie súhlasu so spracovaním osobných údajov môže Používateľ uskutočniť zaslaním príslušného písomného (vytlačeného na hmotnom nosiči a podpísaného Používateľom) Prevádzkovateľovi. 6. Zodpovednosti Prevádzkovateľa. Prístup k osobným údajom 6.1. Prevádzkovateľ sa zaväzuje zabezpečiť zamedzenie neoprávneného a necieleného prístupu k osobným údajom Používateľov webových stránok Prevádzkovateľa. V tomto prípade sa za oprávnený a cielený prístup k osobným údajom Používateľov Stránky bude považovať prístup všetkých zainteresovaných strán realizovaný v rámci cieľov a predmetu Stránky Prevádzkovateľa. Prevádzkovateľ zároveň nezodpovedá za prípadné zneužitie osobných údajov Používateľov, ku ktorému dôjde v dôsledku: technických problémov v softvéri a v hardvéri a sieťach mimo kontroly Prevádzkovateľa; v súvislosti s úmyselným alebo neúmyselným používaním webových stránok prevádzkovateľa na iný ako zamýšľaný účel tretími osobami; 6.2 Prevádzkovateľ prijíma nevyhnutné a dostatočné organizačné a technické opatrenia na ochranu osobných údajov užívateľa pred neoprávneným alebo náhodným prístupom, zničením, úpravou, blokovaním, kopírovaním, šírením, ako aj pred iným protiprávnym konaním tretích osôb s ním. 7. Zmeny Zásad ochrany osobných údajov. Platné právne predpisy 7.1. Prevádzkovateľ má právo vykonávať zmeny týchto Pravidiel bez osobitného upozornenia Používateľov. Po vykonaní zmien v aktuálnom vydaní sa zobrazí dátum poslednej aktualizácie. Nové vydanie Predpisov nadobúda účinnosť okamihom jeho zverejnenia, pokiaľ nie je v novom vydaní Poriadku stanovené inak. 7.2. Na toto nariadenie a vzťah medzi Používateľom a Prevádzkovateľom vznikajúci v súvislosti s aplikáciou Nariadenia sa vzťahuje právo Ruskej federácie. Prijímam Neprijímam