Najprostszy opis zasady działania wyszukiwarki Yandex. Wyszukiwarki internetowe: Yandex, Google, Rambler, Yahoo. Skład, funkcje, zasada działania Matematyczne modele poszukiwań

Yandex jest dziś najpopularniejszą wyszukiwarką w Rosji. Statystyki serwisu Internet na żywo, pokazuje udział Yandexu w masie ogólnorosyjskiej publiczności - wynosi 53,4%, jeśli weźmiemy pod uwagę tylko Moskwę i region, to jest jeszcze wyższy - 67,9% (Moskwa, według żądań, zajmuje ponad 50% całej Rosji).

Strona www.yandex.ru powstała w 1997 roku, wystarczył jej tylko jeden serwer, który stał pod pulpitem jednego z pierwszych programistów Yandex, Dmitry'ego, który nazywał się Teiblyum. Bardzo szybko po otwarciu kupiliśmy drugi serwer, a wkrótce, gdy trzeba było zainstalować kolejny, stało się jasne, że pod stołem jest wystarczająco dużo miejsca na trzy serwery Yandex lub […]

Twórcy wyszukiwarek starają się zapewnić użytkownikom najlepsze odpowiedzi na ich zapytania. Czasami taką odpowiedzią może być liczba (np. pogoda w mieście), obrazek (np. adres na mapie), tłumaczenie słowa lub czterowiersz. Gdy dysponuje się odpowiednim zestawem informacji, odpowiedź można udzielić natychmiast. Dlatego Yandex uzupełnia wyniki wyszukiwania w Internecie odpowiedziami ze swojego […]

Mniej więcej co dziesiąte żądanie skierowane do Yandex ma charakter „nawigacyjny”, to znaczy składa się z nazwy organizacji lub strony internetowej, a użytkownik chce wejść na stronę tej organizacji. W tym przypadku zamiast paska adresu przeglądarki używany jest pasek wyszukiwania Yandex, a użytkownik z reguły nie jest zainteresowany pozostałymi dziewięcioma wynikami wyszukiwania. Nie odrywając użytkownika od głównego celu, po głównym celu dodaliśmy […]

Głównym zadaniem wyszukiwarki jest udzielenie odpowiedzi na pytanie użytkownika. Kiedy użytkownik zadaje zapytanie, wyszukiwarka nie dociera do każdej witryny w Internecie, lecz przeszukuje bazę znanych jej stron – indeks wyszukiwania. Tam znajduje wszystkie strony ze słowami z zapytania. Użytkownik widzi linki do tych stron na stronach wyników wyszukiwania.

Jak widzimy, Yandex nie stoi w miejscu i jestem pewien, że technologie wyszukiwania tego systemu będą nadal się rozwijać w celu poprawy jakości wyszukiwania, którą trudno jeszcze nazwać idealną.

10 listopada 2009 r. Yandex ogłosił nową wersję algorytmu wyszukiwania - Snezhinsk. Zasadnicze zmiany nastąpiły w algorytmie obliczania trafności – przedstawiciele Yandex napisali, co następuje: „Udało nam się stworzyć dokładniejszy i znacznie bardziej złożony model matematyczny, co doprowadziło do znacznego wzrostu jakości wyszukiwania. Dzięki przeprojektowaniu architektury rankingów wyszukiwania możliwe było wdrożenie rozliczania kilku tysięcy [...]

Testowanie nowej wersji algorytmu Yandex rozpoczęło się 9 lipca 2008 roku. Zdaniem Yandex „główne zmiany w programie wiążą się z nowym podejściem do uczenia maszynowego i co za tym idzie, różnicami w sposobie uwzględniania czynników rankingowych w formule”.

14 kwietnia 2008 r. Rozpoczęto testowanie nowego algorytmu wyszukiwania „Magadan” na buki.yandex.ru. Oprócz podwojenia liczby czynników rankingowych dodano także następujące innowacje:

Zanim wyruszymy w algorytmiczną dżunglę, przypomnijmy sobie, jak ogólnie działa wyszukiwarka. Logiczną strukturę systemu wyszukiwania można przedstawić w postaci trzech modułów (patrz diagram). Robot (crawler) to specjalny program, który przeszukuje strony internetowe i pobiera ich zawartość. Robot ma specjalny harmonogram, według którego wykonuje swoje obchody. Strony internetowe ładowane przez robota, specjalny [...]

66. Co ma większy wpływ: link z bezpłatnej platformy (blogspot, LJ itp.) czy z witryny/bloga offline? Bezpłatne platformy przenoszą mniejszą wagę niż samodzielne witryny. Jednak wpływ może być większy. Składa się na to wiele czynników: aktualna lista zakotwiczeń, stan porównywanych witryn itp. Nie da się udzielić jednoznacznej odpowiedzi na to pytanie. 67. Największy ciężar przenosi się pomiędzy […]

Vamana Tour - podróże, bilety lotnicze i wizy dookoła świata oraz do Indii, Nepalu, Sri Lanki, Malediwów, Mauritiusa i wielu innych miejsc na świecie. Rady dla podróżników i pielgrzymów. Jak najlepiej wykorzystać podróż. Niesamowite kroniki historyczne i historie doświadczonych podróżników.

W jakim celu bierze się pod uwagę linki zewnętrzne do witryny Jak widać z poprzedniej sekcji, prawie wszystkie czynniki wpływające na ranking są pod kontrolą autora strony. Tym samym wyszukiwarka nie jest w stanie odróżnić dokumentu naprawdę wysokiej jakości od strony stworzonej specjalnie pod dane wyszukiwane hasło lub nawet strony wygenerowanej przez robota i która nie zawiera w ogóle przydatnych informacji. […]

Cześć drodzy przyjaciele! W tym artykule będziemy nadal przyglądać się wyszukiwarce Yandex, a jak pamiętacie, w poprzednich artykułach omawialiśmy historię powstania tej wspaniałej firmy, która zajmuje pierwsze miejsce wśród swoich konkurentów w Rosji i poza nią.

Wszystko to dobrze, ale początkujących i doświadczonych twórców witryn interesuje oczywiście najważniejsze pytanie, związane z tym, jak wynieść swoje projekty na pierwsze miejsca w TOP wynikach wyszukiwania.

Dlatego przyjrzyjmy się, jak działa wyszukiwarka Yandex, aby zrozumieć, na jakie błędy możesz nadepnąć i czego ogólnie można się spodziewać po rosyjskiej wyszukiwarce.

W ostatnim artykule omówiliśmy. Temat okazał się całkiem ciekawy i przydatny. Dlatego też postanowiłam go uzupełnić, że tak powiem, pogłębić.

Więc prawdopodobnie trochę mnie poniosło pytaniem „Dlaczego wyszukiwarka indeksuje dokumenty”? Pozostaje tylko odpowiedzieć na pytanie „jak”.

Algorytmy rankingu stron internetowych

Najpierw zapoznajmy się z niektórymi algorytmami, które są podstawą każdej wyszukiwarki:

— Algorytm wyszukiwania bezpośredniego.

Co to jest - pamiętasz, jak czytałeś cudowną historię w jednej z książek. I zaczynasz szukać jeden po drugim. Wzięli jedną książkę, przejrzeli ją, nie znaleźli, wzięli inną... Zasada jest jasna, ale ta metoda jest niezwykle długa. Jest to również zrozumiałe.

— Algorytm wyszukiwania wstecznego.

W przypadku tego algorytmu z każdej strony Twojego bloga tworzony jest plik tekstowy. Ten plik zawiera listę w kolejności alfabetycznej WSZYSTKICH użytych słów. Wskazane jest nawet położenie tego słowa w tekście (współrzędne w tekście).

Jest to dość szybka metoda, ale wyszukiwanie już następuje z pewnym błędem.

Najważniejszą rzeczą do zrozumienia jest to, że ten algorytm nie wyszukuje w Internecie, a nie na blogu. Oraz w osobnym pliku tekstowym, który powstał dawno temu. Kiedy robot przyszedł do ciebie. A te pliki (indeksy odwrotne) są przechowywane na serwerach Yandex.

Takie były więc podstawowe algorytmy wyszukiwania. Te. jak Yandex po prostu znajduje niezbędne dokumenty. Wydaje się, że nie powinno być z tym żadnych problemów.

Ale Yandex zna więcej niż jeden, a nawet 100 dokumentów, ale według najnowszych danych z moich źródeł Yandex zna około 11 miliardów dokumentów (10 727 736 489 stron).

A spośród całej tej ilości musisz wybrać dokumenty pasujące do żądania. A co ważniejsze, trzeba je jakoś uszeregować. Te. uporządkować według stopnia ważności, a raczej stopnia użyteczności dla czytelnika.

Matematyczne modele poszukiwań

Aby rozwiązać ten problem, na ratunek przychodzą modele matematyczne. Teraz porozmawiamy o najprostszych modelach.

Boolowski model matematyczny– Jeśli w dokumencie pojawia się słowo, dokument uważa się za znaleziony. Po prostu zbieg okoliczności i nic skomplikowanego.

Ale tutaj są problemy. Na przykład, jeśli jako użytkownik wpiszesz jakieś popularne słowo lub jeszcze lepiej przyimek „v”, który jest najczęstszym słowem w języku rosyjskim i występuje w KAŻDYM dokumencie, otrzymasz wiele wyników że nawet nie zdajesz sobie sprawy z takiej liczby, ile dokumentów znalazłeś? W związku z tym pojawił się następujący model maty.

Wektorowy model matematyczny– model ten określa „wagę” dokumentu. Nie tylko występuje zbieg okoliczności, ale słowo musi wystąpić kilka razy. Co więcej, im częściej pojawia się słowo, tym większa jest jego trafność (zgodność).

Jest to model wektorowy używany przez WSZYSTKIE wyszukiwarki.

Model probabilistyczny- bardziej złożony. Zasada jest taka: wyszukiwarka sama znalazła szablon strony. Na przykład szukasz informacji o historii Yandex. Yandex przechowuje jakiś standard, powiedzmy, że będzie to mój poprzedni artykuł o Yandex.

I porówna wszystkie inne dokumenty z tym artykułem. Logika jest następująca: im bardziej Twoja strona bloga jest podobna do mojego artykułu, tym BARDZIEJ PRAWDZIWE jest to, że Twoja strona bloga będzie również użyteczna dla czytelnika i opowie także o historii Yandex.

Aby zmniejszyć liczbę dokumentów, które należy pokazać użytkownikowi, wprowadzono pojęcie istotności, tj. zgodność.

Jak powiązana jest strona Twojego bloga z tematem? Jest to ważny temat, jeśli chodzi o jakość wyszukiwania.

Asesorzy – kim są i za co odpowiadają?

Znaczenie to jest również potrzebne do oceny jakości algorytmów.

W tym celu funkcjonuje sztab sił specjalnych – nazywa się ich Asesorami. To wyjątkowi ludzie, którzy przeglądają wyniki wyszukiwania rękami.

Zawierają instrukcje dotyczące sprawdzania witryn, oceniania itp. I ręcznie określają, czy Twoje strony nadają się do wyszukiwanych haseł, czy nie.

A jakość algorytmów wyszukiwania zależy od opinii asesorów. Jeśli wszyscy asesorzy stwierdzą, że wyniki wyszukiwania nie odpowiadają żądaniom, oznacza to, że algorytm rankingu jest nieprawidłowy i jedynym winnym jest Yandex.

Jeśli asesorzy stwierdzą, że tylko jedna witryna nie spełnia wymagań, oznacza to, że witryna odlatuje gdzieś daleko i spada w wynikach wyszukiwania. Dokładniej, nie całą witrynę, ale tylko jeden artykuł, ale „nie o to chodzi”.

Oczywiście asesorzy nie mogą przeglądać i oceniać WSZYSTKICH artykułów własnymi rękami i oczami. To jest zrozumiałe.

Na ratunek przychodzą inne parametry, według których strony są klasyfikowane.

Jest ich mnóstwo, np.:

waga strony (vIC, PageRank, dziecięce guzki W sumie);
władza domeny;
związek tekstu z wnioskiem;
adekwatność tekstów linków zewnętrznych do zapytania;
a także wiele innych czynników rankingowych.

Oceniający zgłaszają uwagi, a osoby odpowiedzialne za ustawienie matematycznego modelu rankingowego edytują formułę, dzięki czemu wyszukiwarka działa wydajniej.

Główne kryteria oceny działania formuły:

1. Dokładność wyników wyszukiwania- procent dokumentów zgodnych z żądaniem (istotne). Te. Im mniej stron nie pasujących do żądania, tym lepiej.

2. Kompletność wyników wyszukiwania- jest to stosunek odpowiednich stron internetowych dla danego zapytania do całkowitej liczby odpowiednich dokumentów w zbiorze (ogółem stron znalezionych w wyszukiwarce).

Na przykład, jeśli w całym zbiorze jest więcej trafnych stron niż w wynikach wyszukiwania, oznacza to, że wyniki są niekompletne. Stało się tak, ponieważ niektóre odpowiednie strony internetowe zostały odfiltrowane.

3. Trafność wyników wyszukiwania- jest to zgodność strony internetowej z tym, co jest napisane we fragmencie. Na przykład dokument może bardzo się różnić lub w ogóle nie istnieć, ale nadal być obecny w wynikach wyszukiwania.

Trafność wyników wyszukiwania zależy bezpośrednio od tego, jak często robot wyszukujący skanuje dokumenty ze swojej kolekcji.

Zbieranie kolekcji (indeksowanie stron serwisu) odbywa się za pomocą specjalnego programu – robota wyszukującego.

Robot wyszukujący otrzymuje listę adresów do zaindeksowania, kopiuje je, a następnie wysyła zawartość skopiowanych stron internetowych do przetworzenia do algorytmu, który konwertuje je na indeksy odwrotne.

Cóż, „w dużym skrócie”, że tak powiem, omówiliśmy zasady działania wyszukiwarki.

Podsumujmy:

Na Twojego bloga przychodzi robot wyszukiwania.
Robot wyszukiwania przechowuje odwrotny indeks strony na potrzeby kolejnych wyszukiwań.
Za pomocą modelu matematycznego dokument jest przetwarzany i wyświetlany w wynikach wyszukiwania za pomocą formuł i z uwzględnieniem opinii asesora.

To jest bardzo, bardzo uproszczone. Aby uzyskać podstawowe zrozumienie działania wyszukiwarki Yandex.

Napisałem już tak dużo tekstu i być może tak wiele jest niejasnych. Dlatego sugeruję powrót do tego artykułu nieco później i obejrzenie tego filmu.

To doskonały poradnik, z którego też kiedyś się uczyłem.

Mam nadzieję, że te informacje pomogą Ci lepiej zrozumieć, dlaczego jedna z Twoich witryn zajmuje odpowiednie pozycje w wynikach wyszukiwania i zrobić wszystko, aby je ulepszyć.

Tym się żegnam, jeśli macie jakieś pytania, zawsze chętnie odpowiem na nie w komentarzach. A może chcesz dodać coś do artykułu?

W każdym razie wyraź swoją opinię. !

Dziś wyruszyliśmy w kolejną długą podróż po ozdobnych ścieżkach rozwoju wyszukiwarek ( Yandex, Yandex). Myślę, że krajowy gigant wyszukiwarek internetowych już dawno urósł do takiego poziomu, że nie jest zbyt leniwy, aby zagłębić się we wszystkie jego zakamarki, przypomnieć sobie, jak rozwijała się wyszukiwarka Yandex i co było interesujące przez wszystkie lata jej istnienia istnienie.

Co więcej, otrzymuje wielu odwiedzających z wyszukiwarki Yandex. Wiele z nich odchodzi przez reklamę kontekstową, niedawno przejąłem bloga, więc myślę, że ta firma jest więcej niż godna, aby napisać o niej dużą publikację.

Jeśli weźmiemy pod uwagę rosyjski Internet, to Yandex jest niekwestionowanym liderem. W Rosji jest to pierwsza najważniejsza wyszukiwarka. Istnieją regionalne wyszukiwarki, swego rodzaju oddziały na Białorusi, Ukrainie i w Kazachstanie. Yandex jest bardzo popularny wśród mieszkańców tych krajów. Mogę to ocenić przynajmniej na podstawie statystyk, ponieważ wielu odwiedzających pochodzi z innych regionów.

Obecnie Yandex to nie tylko wyszukiwarka, to także liczne usługi, do których mają dostęp absolutnie wszyscy użytkownicy tej wyszukiwarki. Tutaj możesz znaleźć potrzebne informacje i nawigować po wyborze zajęć rekreacyjnych, znaleźć zdjęcia, produkty, porównać ceny, sprawdzić pogodę, komunikować się w sieci społecznościowej, oglądać telewizję i rozkłady jazdy. Istnieje wiele rozwiązań dla przedsiębiorstw. Możesz nawet wejść na stronę Narod.ru. Yandex ma wygodny system zapewniający funkcjonalność pracy z Twoimi stronami internetowymi. Wśród najnowszych dostępnych innowacji usługi jest ta, która przez dość długi czas pozostawała płatna, ale w grudniu 2011 roku usługa ta stała się dostępna dla absolutnie każdego.

Mógłbym długo opowiadać o wspaniałych technologiach i przydatnych usługach Yandex. Dlatego dla ułatwienia postrzegania informacji podzielę naszą podróż na elementy. Całą ścieżkę wyszukiwarki opiszę chronologicznie według roku – od powstania do dnia dzisiejszego.

Historia rozwoju Yandex

Lata 80-te - 90-te

Historia rozwoju Yandex sięga korzeniami do odległych już lat 80., czasów ZSRR. To właśnie wtedy w Arcadii rozpoczął się rozwój oprogramowania wyszukującego. Prace prowadzono pod przewodnictwem Arkadego Borkowskiego i Arkadego Wołoża. To pierwsze technologia wyszukiwania otrzymał nazwę „Yandex”. A sama witryna Yandex, ta, którą możemy oglądać dzisiaj, pojawiła się w 1996 roku. Rozwój, jaki miał miejsce w tym czasie, uznano za obiecujący, w wyniku czego kierownictwo CompTek (sprzedaż komputerów i komponentów) oraz twórcy systemu zdecydowali o celowości dalszego rozwoju technologii i jej wprowadzenia do mas . W tym zakresie przygotowano koncepcję rozwoju projektu, skierowaną do szerokiego grona odbiorców.

Yandex został oficjalnie ogłoszony dopiero 23 września 1997 r. I faktycznie, początkowo był to jeden z oddziałów CompTek International. Oznacza to, że w ogóle nie było tam niepodległości. I dopiero w 2000 roku Yandex stał się firmą, którą można dziś zobaczyć. W tym sensie, że firma stała się już całkowicie niezależna. Niezależny Yandex.

Nawiasem mówiąc, na długo przed ogłoszeniem wyszukiwarki Yandex firma wymyśliła nazwę. Yandex – oznacza „Indeks językowy”. W tłumaczeniu z języka angielskiego okazuje się, że jest to „Jeszcze inny indeksator”. To prawda, że w miarę rozwoju wyszukiwarki zaczęły pojawiać się inne interpretacje. Na przykład, jeśli w indeksie angielskim przetłumaczysz pierwszą literę (I – Z) z angielskiego na rosyjski, otrzymasz „Yandex”.

Nazwę „Yandex” wymyślili Ilya Segalovich (obecny dyrektor ds. Technologii) i Arkady Volozh

Na rok przed oficjalną premierą firmy, 18 października 1996 roku, odbyła się wystawa Netcom’96, na której CompTek zaprezentował pierwsze produkty rozwijającej się wyszukiwarki. Były to Yandex.Site i Yandex.Dict. Następnie, sześć miesięcy później, pojawił się Yandex.CD - wyszukiwanie dokumentów na CD-ROM-ie i wtedy ruszył projekt Yandex.Lib. Była to biblioteka pakietów Yandex, która przeznaczona była do osadzania we wszelkiego rodzaju aplikacjach i bazach danych.

W momencie oficjalnego zaprezentowania Yandex.ru opinii publicznej jako interesujące można wyróżnić:

Ocena przydatności dokumentów. W tamtym czasie Yandex był całkiem dobry w znajdowaniu kopii i ich wykluczaniu. Jednocześnie przeszukiwano dokumenty w różnych kodowaniach

Szukaj według dokładnej formy słowa. Yashka umiała wyszukiwać pod kątem morfologii

Szukaj na podstawie odległości. Yandex mógł wyszukiwać w obrębie akapitu, używając dokładnych fraz

Funkcjonował rdzeń oceny trafności stron. Dla każdego wniosku dokumenty zostały wybrane pod kątem zgodności (istotności) z żądaniem. Dodatkowo przy wyborze dokumentów do wyników wyszukiwania brano pod uwagę częstotliwość (zagęszczenie) słowa kluczowego na stronie. Swoją drogą, właśnie z powodu niedoskonałości (wówczas) tego algorytmu, w najwyższych wynikach wyszukiwania pojawiały się strony gęsto wypełnione słowami kluczowymi, praktycznie bez znaczenia.

Podczas wyszukiwania brano także pod uwagę odległość między słowami oraz sposób rozmieszczenia słów w dokumencie

Projekt strony internetowej Yandex

Już pierwszy projekt strony internetowej Yandex był dość prymitywny i niedoskonały. Został opracowany przez znanego Artemy'ego Lebiediewa. Wyglądał tak

Nawiasem mówiąc, forum Yandex zostało otwarte w tym samym roku. Przeznaczony do komunikacji pomiędzy użytkownikami systemu a programistami. Pomysł był dobry, a forum funkcjonowało normalnie. To prawda, że istniał do 2008 roku. Potem nastąpiło lekkie przetasowanie priorytetów. O ile wiem, preferowano socjalizację. Yandex zaczął także aktywnie rozwijać własną sieć społecznościową, na podstawie której pojawił się obecny blog, na którym publikowane są wszystkie ogłoszenia Yandex i gdzie w rzeczywistości użytkownicy komunikują się z programistami. Możesz sam zobaczyć, stary adres URL forum ( http://forum.yandex.ru/yandex/) dziś przekierowanie jest znane każdemu http://webmaster.ya.ru/.

1998

Projekt, który został uruchomiony, wykazał duży potencjał i kontynuowano nad nim pracę. W 1998 roku udoskonalono wyszukiwarkę i wprowadzono wiele innych funkcjonalności dla użytkowników. W szczególności stało się możliwe przeszukiwanie znalezionych dokumentów, wyszukiwanie podobnych dokumentów i wiele więcej. Trwają także prace nad projektem strony głównej Yandex. Teraz trochę się zmieniła

Jak widać, na zewnątrz niewiele się zmieniło. Większość prac technicznych została wykonana

1999

W ciągu roku liczba odbiorców rosyjskiego Internetu znacznie wzrosła. Wraz z nim wzrosła jakość i technologia Yandex, a programiści wprowadzili wiele ulepszeń. Wyszukiwarka Yandex wprowadziła nowego bota wyszukiwania, który znacznie zwiększył prędkość indeksowania dokumentów w sieci.

Innowacje, które wpłynęły na części funkcjonalności użytkownika, były następujące:

Możliwe jest teraz dokładniejsze wyszukiwanie - według adnotacji, podpisów, zdjęć, tytułów

Wprowadziliśmy ograniczenie wyszukiwania w grupie witryn

Osobno wyróżniono dokumenty w języku rosyjskim

Nawiasem mówiąc, w 1999 roku po raz pierwszy wprowadzono dobrze znaną koncepcję (tematyczny indeks cytowań). To prawda, że wtedy obliczono to dość prymitywnie. Autorytet strony (czyli TIC) w dużej mierze zależał od liczby stron, które linkowały do interesującej nas domeny.

Nawiasem mówiąc, zmienił się także wygląd strony głównej. Teraz stało się czymś bardziej podobnym do obecnego

W 1999 roku miało miejsce kolejne ważne wydarzenie. Wtedy pojawił się darmowy kreator stron internetowych, lepiej znany nam wszystkim jako Narod.ru (bezpłatna usługa hostingu i udostępniania plików). Nawiasem mówiąc, ten projekt nadal istnieje. Motto tego projektu brzmiało: w 60 sekund.

rok 2000

Być może to wprowadzenie nowych usług pozwoliło Yandexowi osiągnąć zasadniczo nowy poziom rozwoju. Z biegiem czasu wyszukiwarka mocno ugruntowała swój status, co umożliwiło znaczne Tak naprawdę był to nowy projekt, a nie ten, który rozpoczął się pod auspicjami CompTek.

W 1999 roku Arkady Volozh, zdając sobie sprawę z perspektyw rozwoju projektu, zaczął skupiać się wyłącznie na promocji Yandexu. Trudność polegała jednak na tym, że konieczne było znalezienie doświadczonych partnerów z korporacyjnymi umiejętnościami budowlanymi. Jedyną trudnością było to, że konieczne było znalezienie partnerów, którzy inwestowaliby w rozwój projektu, ale nie wymagaliby całkowitego przeniesienia zarządzania pod ich kierownictwem.

I taki partner się znalazł. To była firma Ru-Net Holdings. Wiosną 2000 roku została zawarta z tą spółką umowa inwestycyjna. Tutaj jednak doszło do kilku ofiar. Mimo to musiałem zrezygnować z pewnej części wyszukiwarki. Zgodnie z umową firma otrzymała 1/3 wyszukiwarki. Oznacza to, że od tego momentu Yandex przestał być strukturalnym oddziałem CompTek, ale stał się niezależną firmą, która miała własne biura, własne kierownictwo, własny budżet itp. Arkady Volozh został dyrektorem generalnym firmy.

Myślę, że Yandex miał dużo szczęścia ze swoim pierwszym liderem, ponieważ Wołoż okazał się nie tylko specjalistą w wyszukiwaniu potencjalnych partnerów, ale także dobrym innowatorem. Po rozpoczęciu samodzielnego „pływania” w firmie rozpoczęły się ogromne zmiany. Personel został znacznie uzupełniony, a sam zasób otrzymał nowy kop od swoich liderów.

W sumie ru-Net Holdings zainwestował około 5 milionów dolarów.Co mogę powiedzieć, transakcja okazała się bardzo opłacalna, zwłaszcza biorąc pod uwagę fakt, że dziś wyszukiwarka numer jeden w RuNet będzie kosztować co najmniej kilkaset milionów dolarów. To najbardziej ostrożne szacunki.

Rok 2000 był również znaczący z tego powodu, że to właśnie w tym roku multiportalność Yandexa zaczęła się wyraźniej ujawniać, ponieważ zaczęło pojawiać się wiele usług niezwiązanych bezpośrednio z wyszukiwaniem. Takimi usługami były Yandex.News, Yandex.Mail, Postcards i pasek wyszukiwania na ya.ru. Ponadto wiele usług później się połączyło, stając się tym, co znamy dzisiaj jako Yandex.Market. Ponadto kolejną istotną innowacją było wprowadzenie specjalistycznego oprogramowania umożliwiającego integrację z przeglądarkami użytkowników – Yandex Bar.

rok 2001

Ten rok był punktem zwrotnym, ponieważ w 2001 roku Yandex został liderem Runetu pod względem ruchu. Ponadto wzrosła także ilość informacji przechowywanych na serwerach firmy. Jego rozmiar wynosił 1 terabajt. Nawiasem mówiąc, w tym roku pojawił się także Yandex.Images. Ponadto pojawił się elektroniczny system płatności Yandex.Money

Ponadto projekt strony głównej Yandex został znacznie ulepszony. Tutaj znajdują się linki do nowych usług i aktualności. Można powiedzieć, że ogólnie zarysy dzisiejszego Yandexa już się pojawiły

2002

W tym roku programiści aktywnie pracowali nad udoskonaleniem usługi komunikacyjnej - Yandex.Mail. Wiele pracy włożono w filtrowanie korespondencji. Rok 2002 był rokiem połączenia trzech serwisów – Products, Guru i Select w jeden – Yandex.Market. Nawiasem mówiąc, możesz sam przekonać się, że ta usługa jest bardzo aktualna nawet dzisiaj. Być może po raz pierwszy w ciągu wszystkich lat inwestowania w 2002 roku pojawił się cel – osiągnięcie samowystarczalności. Konieczne było opracowanie strategicznego systemu monetyzacji projektu. Co więcej, takiego, który w przyszłości przyniesie stabilne i duże zyski. Stał się takim modelem i to właśnie dochody, które firma zaczęła uzyskiwać z tego modelu reklamowego, pozwoliły osiągnąć samowystarczalność znacznie wcześniej, niż oczekiwano. Można zatem powiedzieć, że rok 2002 był punktem zwrotnym w zakresie wejścia w model biznesowy, który zresztą zaczął już przynosić efekty.

2003

W tym roku kontynuowano aktywne prace nad usługą Yandex.Mail. Tutaj wprowadzono kolejne ogromne zmiany, dotykające wszystkich użytkowników systemu. Oczywiście Ya.Mail stał się bardziej funkcjonalny i wygodny. Patrząc w przyszłość, chcę powiedzieć, że w przyszłości usługa również rozwijała się bardzo aktywnie, a jej użytkownicy wielokrotnie widzieli wiele nowych interesujących funkcji. W szczególności użytkownicy otrzymali nieograniczony rozmiar skrzynki pocztowej i nowy filtr spamu „Spam Defense”. W 2003 roku projekt Yandex został ponownie zaktualizowany.

Nawiasem mówiąc, każdy projekt odpowiadał określonej wersji. Wersja projektu z 2003 roku była ósmą z rzędu i wyglądała tak

Każde wydanie nowej wersji projektu początkowo przechodzi okres testów beta. I jeśli wcześniej beta testy odbywały się w trybie zamkniętym, to tym razem podczas dwutygodniowych próbnych testów nowego interfejsu każdy mógł uzyskać dostęp do nowego interfejsu. To prawda, że rok później główny został ponownie zmodernizowany, ale z większym sukcesem. I w tej formie istniał do 2007 roku.

Już wtedy Yandex był już dość renomowaną firmą, ponieważ już w 2003 roku wyszukiwarka Yandex została pomyślnie wdrożona na stronie prezydenta. Jesienią 2003 roku programiści wprowadzili kolejne aktualizacje produktów: Yandex.Publisher, Yandex.Server (Yandex.Server), które stały się dziedzictwem Yandex.Site.

2004

Model biznesowy zajmowany przez wyszukiwarkę numer jeden w RuNet sprawdził się bardzo dobrze, w efekcie czego zysk osiągnięty przez firmę w 2004 roku wyniósł już kilkadziesiąt milionów dolarów. Dało to impuls do rozwoju nowych usług, np. wyszukiwarki na mapie, blogów i forów. Rok 2004 jest także znamienny tym, że to właśnie wtedy na rynku rosyjskim pojawił się poważny konkurent w osobie Google. Pojawiła się pilna potrzeba rozpoczęcia walki o przywództwo, w wyniku czego kierownictwo Yandex zdecydowało się dziesięciokrotnie zwiększyć swój personel. Początkowo było ich 200, po aktualizacji personelu było ich 2000. Ale najważniejsze, że po odnowieniu personelu nic się nie zmieniło na gorsze. Tradycje pozostały, technologie też były aktualne. Ogólnie rzecz biorąc, możemy powiedzieć, że Yasha nie zamieniła się w suchą korporację.

Bitwa technologii: Yandex kontra Google

Rok 2005

Ten rok upłynął pod hasłem ekspansji geograficznej przedstawicielstwa firmy. Ponieważ pojawiło się ukraińskie przedstawicielstwo Yandex - Yandex.Ukraine. Nawiasem mówiąc, dyrektorem tego przedstawicielstwa jest Sergey Petrenko, założyciel znanej wyszukiwarki i autor ciekawego bloga BloGnot

Rok 2005 był także znaczący, bo otworzył się mój ulubiony. Jest to usługa oparta na zasadzie „webmastera kolotibablo”, w języku rosyjskim jest to usługa umożliwiająca webmasterom umieszczanie reklam na swoich stronach.

W tym samym roku pojawił się Yandex.Dictionaries. Zmiany zaszły także w serwisie Yandex.Money. Teraz wszyscy użytkownicy mają możliwość zarządzania swoim kontem poprzez portfel internetowy.

2006

Ten rok zostanie zapamiętany dzięki pojawieniu się obecnie dobrze znanego serwisu blogs.yandex.ru. Jest to swego rodzaju narzędzie marketingowe. Pozwoliło mi poznać opinię publiczną, recenzje na blogach i forach. Yandex.Maps wprowadził narzędzie do wyświetlania korków.

W latach 2006–2010 Yandex mieścił się w starym biurze przy ulicy Samokatnej w Moskwie

Jak widać wcześniej było w nich trochę ciasno. To nie jest teraz, ogromny budynek dla 2000 pracowników.

W 2006 roku miało miejsce kolejne ciekawe wydarzenie – w Petersburgu otwarto pierwsze zdalne biuro programistyczne. Wtedy oczywiście skala nie była jeszcze taka sama. To nie jest tak, że dzisiaj Yandex ma 11 biur w Rosji, na Ukrainie, w Turcji, a nawet w Kalifornii. Biura różnią się w zależności od rodzaju działalności. Są biura zajmujące się rozwojem, biura sprzedaży, biura zajmujące się lokalizacją produktów

2007

W tym roku odbyły się wydarzenia skierowane bardziej do webmasterów. W szczególności pojawiła się usługa Yandex.Photos. Jednak dla mnie, jako webmastera, ciekawszym wydarzeniem jest pojawienie się serwisu Yandex.Metrica. To prawda, że w tamtym czasie była to całkowicie prymitywna usługa i nie była skierowana do webmasterów, ale do reklamodawców Yandex.Direct. W tym samym roku otwarto przedstawicielstwo na Ukrainie - Yandex.ua. Dziś, według LiveInternet, prawie 14% ruchu rosyjskojęzycznego pochodzi z yandex.ua

Również w 2007 roku ruszył projekt znany wszystkim webmasterom, z którego chyba już tylko leniwi ludzie nie korzystają

2008

Można powiedzieć, że w tym roku strefa wpływów Yandexu wzrosła tak bardzo, że zdecydowano się otworzyć oddział wyszukiwarki w USA, w Kalifornii. Jednocześnie wprowadzono istotne uzupełnienia do algorytmów. W szczególności zaczęto obsługiwać międzynarodowe standardy Sitemap, MediaRSS itp. Oznacza to, że, jak widać, obszary zainteresowań wykraczają daleko poza RuNet. Wyszukiwarką numer jeden w RuNet stały się obecnie witryny anglojęzyczne. Wcześniej problem polegał na tym, że wyszukiwarka krajowa nie obsługiwała standardów międzynarodowych, dlatego występował problem z indeksowaniem witryn z burzhunetu, ale po aktualizacji w 2008 r. problem ten został rozwiązany. Potem logo Yandex zaczęło być pisane w całości po rosyjsku.

rok 2009

Ten rok był znaczący, bo wcześniej nie było podziału poszukiwań na regiony. Oznacza to, że przed wprowadzeniem tego algorytmu był on zbudowany na zasadach jednolitości. Na przykład wpiszesz zapytanie „” w pasku wyszukiwania w Moskwie i Nowosybirsku i otrzymasz takie same wyniki. Teraz wszystko się zmieniło. Wyniki oparte na zasadzie zależności geograficznej są dodawane do wyników wyszukiwania. Krótko mówiąc, jeśli będziesz szukać za pomocą Yandex w Moskwie i Nowosybirsku, wyniki będą inne.

W 2009 roku kontynuowano prace w wybranym wcześniej kierunku zachodnim. W szczególności przetestowano usługę służącą do tłumaczenia zagranicznych stron internetowych. Następnie usługa ta ewoluowała i w 2011 roku stała się znana jako Yandex.Translation.

Równie ważnym wydarzeniem było wprowadzenie nowej metody uczenia maszynowego – Matrixnet. Technologia ta wykorzystuje różne wzorce do oceny i uwzględnia różne czynniki rankingowe. Ale najważniejsze jest to, że technologia sama się uczy. Przy ocenie asesorów oceniane są jedynie rzeczywiste wzorce, a odkrycie nieistniejących wzorców jest całkowicie wykluczone.

Rewolucyjny charakter tej technologii polega na tym, że Matrixnet wykorzystuje niezwykle złożoną formułę rankingową, która uwzględnia ogromną liczbę czynników. To z jednej strony pozwala na osiąganie lepszych wyników wyszukiwania, ale z drugiej strony nie pozwoli webmasterom zrozumieć tego schematu, a tym samym wpłynąć na niego we własnym interesie.

Więcej szczegółów na temat technologii matrixnet:

2010

Stare biuro przy ulicy Samokatnej należy już do przeszłości, a cała firma przeniosła się do nowych rezydencji. W rzeczywistości stało się to głównym wydarzeniem 2010 roku

Dzień dobry, drodzy czytelnicy mojego bloga SEO. . Ten artykuł jest o jak działa wyszukiwarka Yandex jakich technologii i algorytmów używa do rankingu witryn i co robi, aby przygotować odpowiedź dla użytkowników. Wiele osób wie, że ten flagowy produkt rosyjskiej wyszukiwarki nadaje ton Runetowi, jest właścicielem największej bazy danych w Eurazji, obsługuje zawartość ponad miliarda stron i zna odpowiedź na każde pytanie. Według danych Liveinternet za sierpień 2012 r. Udział Yandexu w Rosji wynosi 60,5%. Miesięczna publiczność portalu to 48,9 mln osób. Jednak dla nas, blogerów, najważniejsze jest to, w jaki sposób wyszukiwarka otrzymuje nasze żądania, jak je przetwarza i jaki jest w rezultacie wynik. Z jednej strony znajomość i zrozumienie tych informacji ułatwia nam korzystanie ze wszystkich zasobów Yandex, z drugiej strony łatwiej jest promować nasze blogi. Dlatego proponuję przyjrzeć się ze mną najważniejszym technologiom najlepszej wyszukiwarki Runet.

Kiedy internauta po raz pierwszy chce zwrócić się do wyszukiwarki po informacje, może pojawić się jedno pytanie: „Jak działa wyszukiwarka?” Ale kiedy je otrzymuje, to pytanie często zmienia się w inne: „Dlaczego tak szybko?” I tak naprawdę, dlaczego wyszukiwanie pliku na komputerze zajmuje 20 sekund, a wynik żądania z całej sieci komputerów na całym świecie pojawia się w ciągu sekundy? Najciekawsze jest to, że na dwa pierwsze pytania (jak następuje wyszukiwanie i dlaczego 1 sekunda) można odpowiedzieć w jednej odpowiedzi - wyszukiwarka przygotowała się wcześniej na żądanie użytkownika.

Aby zrozumieć zasadę działania Yandexa, podobnie jak innych wyszukiwarek, przeprowadźmy analogię z książką telefoniczną. Aby znaleźć dowolny numer telefonu, trzeba znać nazwisko abonenta, a każde wyszukiwanie w tym przypadku zajmuje maksymalnie minutę, ponieważ wszystkie strony książki telefonicznej stanowią ciągły indeks alfabetyczny. Wyobraźmy sobie jednak, że wyszukiwanie przeprowadzono przy użyciu innej opcji, w której numery telefonów byłyby sortowane według samych numerów. Po takich poszukiwaniach, które będą się przeciągać przez dłuższy czas, liczby pozostaną przed oczami poszukującego przez bardzo długi czas. 🙂

Podobnie wyszukiwarka wyświetla wszystkie informacje z Internetu w dogodnej dla niej formie. A co najważniejsze, wszystkie te dane są umieszczane w jej katalogu z wyprzedzeniem, zanim odwiedzający przybędzie ze swoimi prośbami. Oznacza to, że kiedy zadajemy pytanie Yandexowi, on już zna naszą odpowiedź. I daje nam to w sekundę. Ale ta druga obejmuje szereg ważnych procesów, które teraz rozważymy szczegółowo.

Indeksowanie Internetu

Yandex ru gromadzi wszystkie informacje, jakie może zdobyć w Internecie. Za pomocą specjalnego sprzętu sprawdzane są wszystkie treści, w tym obrazy, na podstawie parametrów wizualnych. Takim gromadzeniem zajmuje się wyszukiwarka, a proces zbierania i przygotowywania danych nazywa się indeksowaniem. Podstawą takiej maszyny jest system komputerowy, zwany inaczej robotem wyszukującym. Regularnie przeszukuje zaindeksowane witryny, sprawdza je pod kątem nowej zawartości, a także skanuje Internet w poszukiwaniu usuniętych stron. Jeśli odkryje, że taka strona już nie istnieje lub została zamknięta z indeksowania, usuwa ją z wyszukiwania.

W jaki sposób robot wyszukiwania znajduje nowe witryny? Po pierwsze, dzięki linkom z innych stron. Bo jeśli link zostanie umieszczony w nowym zasobie sieciowym z witryny już zaindeksowanej, to przy kolejnej wizycie na drugiej stronie robot odwiedzi pierwszą. Po drugie, istnieje wspaniała usługa, popularnie zwana „addurlka” (od angielskiego wyrażenia -addurl - dodaj adres). Możesz w nim wpisać adres swojej nowej witryny, którą po chwili odwiedzi robot wyszukiwania. Po trzecie, za pomocą specjalnego programu „Yandex.Bar” śledzone są wizyty użytkowników, którzy z niego korzystają. W związku z tym, jeśli osoba trafi na nowy zasób sieciowy, wkrótce pojawi się tam robot.

Czy wszystkie strony są uwzględnione w wyszukiwaniu? Każdego dnia indeksowane są miliony stron. Są wśród nich strony o różnej jakości, które mogą zawierać różne informacje – od unikalnych treści po kompletne śmieci. Co więcej, jak mówią statystyki, w Internecie jest znacznie więcej śmieci. Robot wyszukiwania analizuje każdy dokument za pomocą specjalnych algorytmów. Określa, czy zawiera przydatne informacje i czy może odpowiedzieć na żądanie użytkownika. Jeśli nie, to takie strony nie są akceptowane jako „kosmonauci”, ale jeśli tak, to są uwzględniane w wyszukiwaniu.

Gdy robot odwiedzi stronę i określi jej przydatność, pojawia się ona w pamięci wyszukiwarki. Tutaj analizujemy każdy dokument aż do podstaw, jak mówią mistrzowie centrum samochodowego – aż do trybów. Strona zostaje oczyszczona ze znaczników HTML, czysty tekst przechodzi pełną inwentaryzację – obliczana jest lokalizacja każdego słowa. W tej zdemontowanej formie strona zamienia się w tabelę z cyframi i literami, zwaną inaczej indeksem. Teraz, niezależnie od tego, co stanie się z zasobem internetowym zawierającym tę stronę, w wyszukiwaniu zawsze będzie dostępna jego najnowsza kopia. Nawet jeśli strona już nie istnieje, kopie jej dokumentów są przez pewien czas przechowywane w Internecie.

Każdy indeks wraz z danymi o rodzajach dokumentów, kodowaniu, języku oraz kopiach stanowi przeszukaj bazę danych . Jest ona okresowo aktualizowana, dlatego znajduje się na specjalnych serwerach, za pomocą których przetwarzane są żądania użytkowników wyszukiwarek.

Jak często odbywa się proces indeksowania? Przede wszystkim zależy to od rodzaju witryn. Pierwszy typ zasobu sieciowego bardzo często zmienia zawartość swoich stron. Oznacza to, że gdy robot wyszukiwania za każdym razem odwiedza te strony, za każdym razem zawierają one inną treść. Następnym razem nie będziesz w stanie niczego znaleźć za ich pomocą, dlatego takie witryny nie są uwzględniane w indeksie. Drugi rodzaj serwisu to hurtownia danych, na której stronach okresowo dodawane są linki do dokumentów do pobrania. Zawartość takiej witryny zwykle się nie zmienia, dlatego robot odwiedza ją niezwykle rzadko. Inne strony zależą od częstotliwości aktualizacji materiału. Oznacza to, że im szybciej nowa treść pojawia się na stronie, tym częściej pojawia się robot wyszukiwania. Pierwszeństwo mają najważniejsze zasoby sieciowe (na przykład witryna z wiadomościami jest o rząd wielkości ważniejsza niż jakikolwiek blog).

Indeksowanie pozwala na realizację pierwszej funkcji wyszukiwarki – zbierania informacji o nowych stronach w Internecie. Ale Yandex ma też drugą funkcję – szukanie odpowiedzi na zapytanie użytkownika w przygotowanej już bazie wyszukiwania.

Yandex przygotowuje odpowiedź

Procesem rozpatrywania wniosku i udzielania stosownych odpowiedzi zajmuje się system komputerowy „Metasearch” . Do swojej pracy najpierw zbiera wszystkie informacje wejściowe: z jakiego regionu wysłano żądanie, do jakiej klasy należy, czy w żądaniu występują błędy itp. Po takim przetworzeniu metawyszukiwarka sprawdza, czy w bazie danych znajdują się dokładnie te same zapytania o tych samych parametrach. Jeżeli odpowiedź brzmi tak, to system pokaże użytkownikowi zapisane wcześniej wyniki. Jeśli takiego pytania nie ma w bazie danych, metawyszukiwarka adresuje bazę wyszukiwania zawierającą dane indeksowe.

I tu dzieją się niesamowite rzeczy. Wyobraź sobie, że istnieje jeden superpotężny komputer, w którym przechowywany jest cały Internet przetworzony przez roboty wyszukujące. Użytkownik ustawia zapytanie i rozpoczyna się wyszukiwanie w komórkach pamięci wszystkich dokumentów objętych zapytaniem. Odpowiedź została znaleziona i wszyscy są szczęśliwi. Ale weźmy inny przypadek, gdy istnieje wiele żądań zawierających te same słowa w treści. System musi za każdym razem przechodzić przez te same komórki pamięci, co może znacznie wydłużyć czas przetwarzania danych. W związku z tym czas wzrasta, co może prowadzić do utraty użytkownika - zwróci się on o pomoc do innej wyszukiwarki.

Aby uniknąć takich opóźnień, wszystkie kopie w indeksie witryny są rozproszone na różnych komputerach. Po przesłaniu żądania metawyszukiwarka instruuje takie serwery, aby wyszukały ich fragment tekstu. Następnie wszystkie dane z tych maszyn są zwracane do komputera centralnego, który łączy wszystkie uzyskane wyniki i podaje użytkownikowi pierwszą dziesiątkę najlepszych odpowiedzi. Dzięki tej technologii od razu giną dwie pieczenie: czas poszukiwań ulega kilkukrotnemu skróceniu (odpowiedź uzyskiwana jest w ułamku sekundy), a dzięki zwiększeniu liczby platform informacje są powielane (dane nie są tracone w wyniku nagłych awarii) . Same komputery ze zduplikowanymi informacjami tworzą centrum danych - jest to pomieszczenie z serwerami.

Kiedy użytkownik wyszukiwarki zadaje pytanie, 20 razy na 100, cele zawarte w pytaniu są niejednoznaczne. Na przykład, jeśli w pasku wyszukiwania napisze słowo „Napoleon”, nie wiadomo jeszcze, jakiej odpowiedzi oczekuje - przepisu na ciasto czy biografii wielkiego dowódcy. Lub wyrażenie „Bracia Grimm” - bajki, filmy, grupa muzyczna. Aby zawęzić taki możliwy zakres celów do konkretnych odpowiedzi, Yandex dysponuje specjalną technologią Zakres. Uwzględnia potrzeby użytkowników wykorzystując statystyki wyszukiwanych haseł. Ze wszystkich pytań zadawanych przez odwiedzających w Yandexie Spectrum identyfikuje w nich różne obiekty (imiona osób, tytuły książek, modele samochodów itp.). Obiekty te są podzielone na określone kategorie. Obecnie istnieje ponad 60 takich kategorii. Za ich pomocą wyszukiwarka ma w swojej bazie różne znaczenia słów w zapytaniach użytkowników. Co ciekawe, kategorie te są okresowo sprawdzane (analiza odbywa się kilka razy w tygodniu), co pozwala Yandexowi na dokładniejsze udzielanie odpowiedzi na zadawane pytania.

W oparciu o technologię Spectrum firma Yandex zorganizowała monity dialogowe. Pojawiają się poniżej paska wyszukiwania, w którym użytkownik wpisuje swoje niejednoznaczne zapytanie. Ta linia odzwierciedla kategorie, do których może należeć temat pytania. Dalsze wyniki wyszukiwania zależą od wyboru danej kategorii przez użytkownika.

Od 15 do 30% wszystkich użytkowników wyszukiwarki Yandex chce otrzymywać wyłącznie informacje lokalne (dane z regionu, w którym mieszkają). Na przykład o nowych filmach w kinach w Twoim mieście. Dlatego odpowiedź na taki wniosek powinna być inna dla każdego regionu. W związku z tym Yandex wykorzystuje swoją technologię wyszukiwanie według regionów . Oto przykładowe odpowiedzi, jakie mogą otrzymać mieszkańcy poszukujący repertuaru filmowego w swoim kinie Oktyabr:

Ale taki jest wynik, który mieszkańcy miasta Stawropol otrzymają za tę samą prośbę:

Region użytkownika jest określany przede wszystkim na podstawie jego adresu IP. Czasami dane te nie są dokładne, ponieważ wielu dostawców może działać w kilku regionach jednocześnie i w związku z tym zmieniać adresy IP swoich użytkowników. W zasadzie, jeśli przydarzy Ci się taka sytuacja, możesz łatwo zmienić swój region w ustawieniach wyszukiwarki. Jest on wymieniony w prawym górnym rogu strony wyników. Możesz to zmienić.

Wyszukiwarka Yandex ru - wyniki odpowiedzi

Gdy Metasearch przygotuje odpowiedź, wyszukiwarka Yandex powinna wyświetlić ją na stronie wyników. Jest to lista linków do znalezionych dokumentów z krótkimi informacjami na temat każdego z nich. Zadaniem technologii wydawania wyników jest dostarczenie użytkownikowi najbardziej trafnych odpowiedzi w jak najbardziej informacyjny sposób. Szablon jednego takiego łącza wygląda następująco:

Przyjrzyjmy się tej formie wyniku bardziej szczegółowo. Dla tytuł wyniku wyszukiwania Yandex często używa nazwy tytułu strony (co optymalizatorzy piszą w tagu tytułowym). Jeśli go tam nie ma, pojawiają się tutaj słowa z tytułu artykułu lub wpisu. Jeżeli tekst tytułu jest duży, wyszukiwarka umieszcza w tym polu fragment najbardziej odpowiedni dla danego zapytania.

Bardzo rzadko, ale zdarza się, że tytuł nie jest zgodny z treścią zapytania. W takim przypadku Yandex tworzy tytuł wyniku wyszukiwania na podstawie tekstu artykułu lub postu. Z pewnością będzie zawierał słowa zapytania.

Dla skrawek wyszukiwarka wykorzystuje cały tekst na stronie. Zaznacza wszystkie fragmenty, w których znajduje się odpowiedź na zapytanie, a następnie wybiera ten najbardziej odpowiedni i wstawia odnośniki do dokumentu w polu formularza. Dzięki takiemu podejściu kompetentny optymalizator może po zobaczeniu fragmentu przerobić go, poprawiając tym samym atrakcyjność linku.

Aby lepiej zrozumieć wynik żądania użytkownika, nagłówki są sformatowane jako linki w tekście (podświetlone na niebiesko z podkreśleniem). Aby zasób sieciowy był atrakcyjny i rozpoznawalny, dodano faviconę - małą ikonę korporacyjną witryny. Pojawia się po lewej stronie tekstu w pierwszym wierszu przed nagłówkiem. Wszystkie słowa zawarte w żądaniu w odpowiedzi zostały również wyróżnione pogrubioną czcionką, aby ułatwić ich postrzeganie.

Ostatnio wyszukiwarka Yandex dodała do fragmentu różne informacje, które pomogą użytkownikowi znaleźć odpowiedź jeszcze szybciej i dokładniej. Na przykład, jeśli użytkownik w swoim żądaniu wpisze nazwę organizacji, Yandex doda we fragmencie jej adres, numery kontaktowe i link do lokalizacji na mapach geograficznych. Jeśli wyszukiwarka zna strukturę witryny, która zawiera dokument z odpowiedzią dla użytkownika, na pewno to pokaże. Ponadto Yandex może natychmiast dodać do fragmentu najczęściej odwiedzane strony takiego zasobu internetowego, aby w razie potrzeby odwiedzający mógł natychmiast przejść do potrzebnej sekcji, oszczędzając swój czas.

Istnieją wycinki, które zawierają cenę produktu dla sklepu internetowego, ocenę hotelu lub restauracji w postaci gwiazdek i inne ciekawe informacje z różną liczbą o obiektach w dokumentach wyszukiwania. Celem takich informacji jest dostarczenie pełnej listy danych o tych przedmiotach lub przedmiotach, które są interesujące dla użytkownika.

Ogólnie rzecz biorąc, z różnymi przykładami, strona z odpowiedziami będzie wyglądać następująco:

Rankingi i asesorzy

Zadaniem Yandexa jest nie tylko wyszukanie wszystkich możliwych opcji odpowiedzi, ale także wybranie najlepszych (trafnych). Przecież użytkownik nie będzie przeszukiwał wszystkich linków, które Yandex poda mu jako wynik wyszukiwania. Proces porządkowania wyników wyszukiwania nazywa się zaszeregowanie . Oznacza to, że to ranking decyduje o jakości proponowanych odpowiedzi.

Istnieją zasady, według których Yandex określa odpowiednie strony:

Pozycje witryn pogarszających jakość wyszukiwania zostaną obniżone na stronie wyników. Zwykle są to zasoby internetowe, których właściciele próbują oszukać wyszukiwarkę. Są to na przykład witryny zawierające strony zawierające bezsensowny lub niewidoczny tekst. Oczywiście jest to widoczne i zrozumiałe dla robota wyszukującego, ale nie dla gościa czytającego ten dokument. Lub witryny, które po kliknięciu linku w obszarze wyników wyszukiwania natychmiast przenoszą użytkownika do zupełnie innej witryny.
Witryny zawierające treści erotyczne nie są uwzględniane w wynikach lub mają znacznie obniżoną pozycję w rankingu. Wynika to z faktu, że tego typu zasoby internetowe często wykorzystują agresywne metody promocji.
Strony zainfekowane wirusami nie są obniżane w wynikach wyszukiwania i nie są z nich wykluczane - w takim przypadku użytkownik jest informowany o niebezpieczeństwie za pomocą specjalnej ikony. Wynika to z faktu, że Yandex zakłada, że takie zasoby sieciowe mogą zawierać ważne dokumenty na żądanie osoby odwiedzającej wyszukiwarkę.

Na przykład tak Yandex będzie oceniać witryny pod kątem zapytania „jabłko”:

Oprócz czynników rankingowych Yandex wykorzystuje specjalne próbki z zapytaniami i odpowiedziami, które użytkownicy wyszukiwarek uważają za najbardziej odpowiednie. Żadna maszyna nie jest obecnie w stanie wykonać takich próbek - jest to przywilej człowieka. W Yandex nazywa się takich specjalistów asesorzy. Ich zadaniem jest pełna analiza wszystkich dokumentów wyszukiwania i ocena odpowiedzi na określone zapytania. Wybierają najlepsze odpowiedzi i tworzą specjalny zestaw treningowy. W nim wyszukiwarka widzi powiązania pomiędzy odpowiednimi stronami i ich właściwościami. Mając takie informacje, Yandex może wybrać optymalną formułę rankingu dla każdego żądania. Metoda konstruowania takiej formuły nazywa się Matrixnet. Zaletą tego systemu jest to, że jest odporny na nadmierne dopasowanie, co pozwala na uwzględnienie dużej liczby czynników rankingowych bez zwiększania liczby zbędnych ocen i wzorców.

Na koniec mojego wpisu chcę pokazać Państwu ciekawe statystyki zbierane przez wyszukiwarkę Yandex w trakcie jej pracy.

1. Popularność imion osobistych w Rosji i rosyjskich miastach (dane pobrane z kont blogerów i użytkowników portali społecznościowych w marcu 2012 r.).

Wielki Widzący

W 1863 roku wielki pisarz Juliusz Verne stworzył swoją kolejną książkę „Paryż w XX wieku”. Opisał w nim szczegółowo metro, samochód, krzesło elektryczne, komputer, a nawet Internet. Wydawca jednak odmówił druku książki i leżała tam przez ponad 120 lat, aż w 1989 roku odnalazł ją prawnuk Juliusza Verne’a. Książka ukazała się w 1994 roku.

1. Terminy i definicje W niniejszej umowie o przetwarzanie danych osobowych (zwanej dalej Umową) poniższe terminy mają następujące definicje: Operator - Przedsiębiorca indywidualny Oleg Aleksandrowicz Dneprowski. Akceptacja Umowy – pełna i bezwarunkowa akceptacja wszystkich warunków Umowy poprzez przesłanie i przetwarzanie danych osobowych. Dane osobowe – informacje wprowadzone przez Użytkownika (przedmiot danych osobowych) w serwisie i bezpośrednio lub pośrednio związane z tym Użytkownikiem. Użytkownik - każda osoba fizyczna lub prawna, która pomyślnie przeszła procedurę wypełniania pól wejściowych w serwisie. Wypełnienie pól wejściowych to procedura polegająca na przesłaniu przez Użytkownika swojego imienia, nazwiska, numeru telefonu, osobistego adresu e-mail (dalej jako Dane Osobowe) do bazy zarejestrowanych użytkowników serwisu, przeprowadzana w celu identyfikacji użytkownik. W wyniku wypełnienia pól wejściowych dane osobowe zostają przesłane do bazy Operatora. Wypełnienie pól wejściowych jest dobrowolne. serwis internetowy – serwis internetowy znajdujący się w sieci Internet i składający się z jednej strony. 2. Postanowienia ogólne 2.1. Niniejsza Umowa została sporządzona w oparciu o wymogi ustawy federalnej z dnia 27 lipca 2006 r. nr 152-FZ „O danych osobowych” oraz postanowienia art. 13.11 dotyczące „Naruszenia ustawodawstwa Federacji Rosyjskiej w zakresie dane osobowe” Kodeksu wykroczeń administracyjnych Federacji Rosyjskiej i obowiązuje dla wszystkich danych osobowych, które Operator może uzyskać na temat Użytkownika podczas korzystania z Witryny. 2.2. Wypełnienie przez Użytkownika pól wejściowych w Serwisie oznacza bezwarunkową zgodę Użytkownika na wszystkie warunki niniejszej Umowy (Akceptacja Umowy). W przypadku braku zgody na niniejsze warunki Użytkownik nie wypełnia pól wejściowych w Serwisie. 2.3. Zgoda Użytkownika na udostępnienie Operatorowi danych osobowych i ich przetwarzanie przez Operatora obowiązuje do czasu zakończenia działalności Operatora lub do czasu wycofania zgody przez Użytkownika. Akceptując niniejszą Umowę i przechodząc procedurę Rejestracji, a także wchodząc później na Stronę, Użytkownik potwierdza, że działając z własnej woli i we własnym interesie przekazuje swoje dane osobowe do przetwarzania Operatorowi oraz wyraża zgodę na ich przetwarzanie. Użytkownik zostaje poinformowany, że przetwarzanie jego danych osobowych będzie realizowane przez Operatora na podstawie ustawy federalnej z dnia 27 lipca 2006 r. nr 152-FZ „O danych osobowych”. 3. Lista danych osobowych i innych informacji o użytkowniku, które należy przekazać Operatorowi 3. 1. Korzystając z Serwisu Operatora Użytkownik podaje następujące dane osobowe: 3.1.1. Wiarygodne dane osobowe, które Użytkownik podaje o sobie niezależnie podczas wypełniania pól wejściowych i/lub w trakcie korzystania z usług Strony, w tym nazwisko, imię, patronimika, numer telefonu (domowy lub komórkowy), osobisty adres e-mail. 3.1.2. Dane przekazywane automatycznie do usług Serwisu w trakcie korzystania z nich za pomocą oprogramowania zainstalowanego na urządzeniu Użytkownika, w tym adres IP, informacje zawarte w plikach Cookies, informacje o przeglądarce Użytkownika (lub innym programie, za pośrednictwem którego uzyskuje się dostęp do usług). 3.2. Operator nie weryfikuje prawidłowości podanych przez Użytkownika danych osobowych. W takim przypadku Operator zakłada, że Użytkownik podał rzetelne i wystarczające dane osobowe na pytania zaproponowane w Polach wprowadzania danych. 4. Cele, zasady gromadzenia i wykorzystywania danych osobowych 4.1. Operator przetwarza dane osobowe, które są niezbędne do świadczenia usług i świadczenia usług na rzecz Użytkownika. 4.2. Dane osobowe Użytkownika wykorzystywane są przez Operatora w następujących celach: 4.2.1. Identyfikacja użytkownika; 4.2.2. Zapewnienie Użytkownikowi spersonalizowanych usług (a także informowanie o nowych promocjach i usługach firmy poprzez wysyłanie listów); 4.2.3. Utrzymywanie kontaktu z Użytkownikiem w razie potrzeby, w tym przesyłanie powiadomień, żądań i informacji związanych z korzystaniem z usług, świadczeniem usług, a także przetwarzanie żądań i wniosków od Użytkownika; 4.3. Podczas przetwarzania danych osobowych dokonywane będą następujące czynności: zbieranie, utrwalanie, systematyzacja, gromadzenie, przechowywanie, wyjaśnianie (aktualizacja, zmiana), wydobywanie, wykorzystywanie, blokowanie, usuwanie, niszczenie. 4.4. Użytkownik nie sprzeciwia się temu, aby określone przez niego informacje w niektórych przypadkach mogły zostać przekazane uprawnionym organom państwowym Federacji Rosyjskiej zgodnie z obowiązującym ustawodawstwem Federacji Rosyjskiej. 4,5. Dane osobowe Użytkownika są przechowywane i przetwarzane przez Operatora w sposób przewidziany w niniejszej Umowie przez cały okres działalności Operatora. 4.6. Przetwarzanie danych osobowych odbywa się przez Operatora poprzez prowadzenie baz danych, metodami zautomatyzowanymi, mechanicznymi i ręcznymi. 4.7. Witryna korzysta z plików cookie i innych technologii w celu śledzenia korzystania z usług Witryny. Dane te są niezbędne do optymalizacji technicznego działania Serwisu i poprawy jakości świadczenia usług. Witryna automatycznie rejestruje informacje (w tym adres URL, adres IP, typ przeglądarki, język, datę i godzinę żądania) o każdym odwiedzającym Witrynę. Użytkownik ma prawo odmówić podania danych osobowych podczas odwiedzania Serwisu lub wyłączyć obsługę plików Cookies, jednak w takim przypadku nie wszystkie funkcje Serwisu mogą działać poprawnie. 4.8. Warunki poufności przewidziane w niniejszej Umowie mają zastosowanie do wszystkich informacji, jakie Operator może uzyskać na temat Użytkownika w trakcie jego pobytu w Serwisie i korzystania z Serwisu. 4.9. Informacje ujawnione publicznie w trakcie wykonywania niniejszej Umowy, a także informacje, które strony lub osoby trzecie mogą uzyskać ze źródeł, do których każda osoba ma swobodny dostęp, nie są poufne. 4.10. Operator podejmuje wszelkie niezbędne działania mające na celu ochronę poufności danych osobowych Użytkownika przed nieuprawnionym dostępem, modyfikacją, ujawnieniem lub zniszczeniem, w tym: zapewnia stałą wewnętrzną weryfikację procesów gromadzenia, przechowywania i przetwarzania danych oraz zapewnienie bezpieczeństwa; zapewnia fizyczne bezpieczeństwo danych, uniemożliwiając nieuprawniony dostęp do systemów technicznych zapewniających działanie Serwisu, w którym Operator przechowuje dane osobowe; zapewnia dostęp do danych osobowych jedynie tym pracownikom Operatora lub osobom upoważnionym, które potrzebują tych informacji do wykonywania obowiązków bezpośrednio związanych ze świadczeniem usług na rzecz Użytkownika, a także obsługą, rozwojem i ulepszaniem Serwisu. 4.11. Dane osobowe Użytkownika pozostają poufne, za wyjątkiem przypadków, gdy Użytkownik dobrowolnie udostępni informacje o sobie w celu ogólnego dostępu nieograniczonej liczbie osób. 4.12. Przekazanie przez Operatora danych osobowych Użytkownika jest zgodne z prawem w okresie reorganizacji Operatora i przeniesienia praw na następcę prawnego Operatora, natomiast wszelkie obowiązki dopełnienia warunków niniejszej Umowy w stosunku do otrzymanych przez niego danych osobowych mają charakter przeniesiony na następcę prawnego. 4.13. Niniejsze Oświadczenie dotyczy wyłącznie Strony Internetowej Operatora. Spółka nie kontroluje i nie ponosi odpowiedzialności za strony (usługi) podmiotów zewnętrznych, do których użytkownik może uzyskać dostęp za pośrednictwem linków dostępnych na Stronie Operatora, w tym w wynikach wyszukiwania. W takich Witrynach (usługach) mogą być zbierane lub żądane od użytkownika inne dane osobowe oraz mogą być wykonywane inne czynności 5. Prawa użytkownika jako podmiotu danych osobowych, zmiana i usunięcie danych osobowych przez użytkownika 5.1. Użytkownik ma prawo: 5.1.2. Żądania od Operatora doprecyzowania jego danych osobowych, ich zablokowania lub zniszczenia, jeżeli dane osobowe są niekompletne, nieaktualne, niedokładne, uzyskane nielegalnie lub nie są niezbędne do wskazanego celu przetwarzania, a także podjęcia przewidzianych prawem środków w celu ochrony jego praw. 5.1.3. Otrzymuj informacje dotyczące przetwarzania jego danych osobowych, w tym informacje zawierające: 5.1.3.1. potwierdzenie faktu przetwarzania danych osobowych przez Operatora; 5.1.3.2. cele i sposoby przetwarzania danych osobowych stosowane przez operatora; 5.1.3.3. nazwa i lokalizacja Operatora; 5.1.3.4. przetwarzane dane osobowe związane z przedmiotem danych osobowych, źródłem ich otrzymania, chyba że prawo federalne przewiduje inną procedurę przedstawiania takich danych; 5.1.3.5. warunki przetwarzania danych osobowych, w tym okresy ich przechowywania; 5.1.3.6. inne informacje przewidziane w obowiązującym ustawodawstwie Federacji Rosyjskiej. 5.2. Wycofanie zgody na przetwarzanie danych osobowych może zostać dokonane przez Użytkownika poprzez przesłanie Operatorowi stosownego pisemnego oświadczenia (wydrukowanego na nośniku materialnym i podpisanego przez Użytkownika). 6. Obowiązki Operatora. Dostęp do danych osobowych 6.1. Operator zobowiązuje się do zapewnienia zapobiegania nieuprawnionemu i niezamierzonemu dostępowi do danych osobowych Użytkowników Serwisu Operatora. W takim przypadku autoryzowany i ukierunkowany dostęp do danych osobowych Użytkowników Serwisu będzie uważany za dostęp do nich wszystkich zainteresowanych stron, realizowany w ramach celów i tematyki Serwisu Operatora. Jednocześnie Operator nie ponosi odpowiedzialności za ewentualne niewłaściwe wykorzystanie danych osobowych Użytkowników, które nastąpi na skutek: problemów technicznych w oprogramowaniu oraz sprzęcie i sieciach niezależnych od Operatora; w związku z zamierzonym lub niezamierzonym korzystaniem ze Stron Operatora w sposób inny niż zgodny z ich przeznaczeniem przez osoby trzecie; 6.2 Operator podejmuje niezbędne i wystarczające środki organizacyjne i techniczne w celu ochrony danych osobowych użytkownika przed nieuprawnionym lub przypadkowym dostępem, zniszczeniem, modyfikacją, zablokowaniem, kopiowaniem, rozpowszechnianiem, a także przed innymi niezgodnymi z prawem działaniami osób trzecich z nimi związanych. 7. Zmiany w Polityce Prywatności. Obowiązujące ustawodawstwo 7.1. Operator ma prawo dokonać zmian w niniejszym Regulaminie bez specjalnego powiadamiania Użytkowników. W przypadku wprowadzenia zmian w bieżącym wydaniu wskazywana jest data ostatniej aktualizacji. Nowe wydanie Regulaminu wchodzi w życie z chwilą jego opublikowania, chyba że nowe wydanie Regulaminu stanowi inaczej. 7.2. Do niniejszego Regulaminu oraz relacji pomiędzy Użytkownikiem a Operatorem powstałych w związku ze stosowaniem Regulaminu stosuje się prawo Federacji Rosyjskiej. Akceptuję, nie akceptuję