Jak działa wyszukiwarka

Te procesy to podstawa – w ten sposób zbieramy i porządkujemy informacje z internetu, dzięki czemu możemy wyświetlać najbardziej przydatne wyniki. Nasz indeks ma sporo ponad sto milionów gigabajtów, a na jego tworzenie poświęciliśmy ponad milion godzin obliczeń. Więcej informacji znajdziesz w tym krótkim filmie.

 

Pobieranie – znajdowanie informacji

Do odkrywania publicznie dostępnych stron internetowych używamy programów nazywanych „robotami”. Najbardziej znany to „Googlebot”. Roboty wchodzą na strony i korzystają ze znajdujących się tam linków, podobnie jak Ty, gdy przeglądasz sieć. Wędrują od linku do linku i przesyłają dane o stronach internetowych na serwery Google.

Proces pobierania zaczyna się od listy adresów internetowych utworzonej podczas poprzednich indeksowań i map witryn dostarczonych przez ich właścicieli. Nasze roboty wchodzą na strony i szukają linków do kolejnych stron. Zwracają przy tym szczególną uwagę na nowe witryny, zmiany wprowadzone w istniejących witrynach oraz niedziałające linki.

Programy komputerowe wybierają witryny do pobierania oraz określają, ile stron pobierać z każdej z nich i jak często to robić. Google nie oferuje płatnej usługi częstszego pobierania stron w celu zaktualizowania wyników wyszukiwania. Bardziej zależy nam na tym, by wyniki były jak najtrafniejsze – na dłuższą metę właśnie to przynosi największe korzyści użytkownikom, a tym samym naszej firmie.

Wybór dla właścicieli witryn

W przypadku większości witryn nie trzeba ustawiać ograniczeń pobierania, indeksowania ani wyświetlania stron. Webmaster nie musi nic robić – strony po prostu pojawiają się w wynikach wyszukiwania. Właściciele witryn mogą jednak użyć Narzędzi dla webmasterów i pliku robots.txt, by dokładnie określić, jak Google ma pobierać i indeksować ich strony. W pliku robots.txt można zablokować dostęp Googlebotowi lub podać konkretne instrukcje przetwarzania stron witryny.

Właściciele witryn mogą na przykład zrezygnować z pokazywania krótkich opisów podsumowujących stronę (widocznych pod każdym wynikiem wyszukiwania) lub kopii strony w pamięci podręcznej (zapisanej na serwerach Google na wypadek, gdyby właściwa strona była niedostępna). Webmasterzy mogą też umieścić swoją wersję wyszukiwarki Google w witrynie.

Indeksowanie – porządkowanie informacji

Internet jest jak stale powiększająca się biblioteka publiczna z miliardami zasobów bez centralnego systemu danych. Google po prostu gromadzi strony, po czym tworzy indeks, który pozwala na łatwe znajdowanie danych. Podobnie jak skorowidz na końcu książki, indeks Google zawiera informacje o słowach i ich lokalizacji. Gdy czegoś szukasz, na najbardziej podstawowym poziomie nasze algorytmy wyszukują Twoje zapytanie w indeksie, by znaleźć odpowiednie strony.

Od tej chwili proces wyszukiwania staje się znacznie bardziej złożony. Gdy szukasz hasła „psy”, nie chcesz po prostu znaleźć strony, na której to słowo występuje setki razy. Prawdopodobnie oczekujesz zdjęć, filmów lub listy ras. Systemy indeksowania Google zapamiętują wiele różnych aspektów stron, np. datę publikacji, zamieszczone zdjęcia lub filmy itp. Tworząc Graf wiedzy, wykraczamy poza zwykłe dopasowywanie słów kluczowych, by lepiej zrozumieć ludzi, miejsca i rzeczy, które mają dla Ciebie znaczenie.

 

Narzędzia dla webmasterów

Informacje o narzędziach i zasobach dostępnych dla właścicieli witryn znajdziesz w Centrum dla webmasterów.

Jak działa wyszukiwarka

Zobacz grafikę, która ilustruje różne etapy procesu wyszukiwania – od przygotowań, przez tworzenie rankingu, aż po wyświetlanie wyników.