Як працює пошук

Ці процеси закладають основу. Саме так ми збираємо й організовуємо інформацію в Інтернеті, щоб показувати вам найкорисніші результати. Наш індекс становить понад 100 000 000 гігабайтів, і ми витратили на його створення понад мільйон годин обчислень. Докладніше про основи в цьому короткому відео.

 

Пошук інформації за допомогою сканування

Для пошуку загальнодоступних веб-сторінок ми використовуємо програмне забезпечення, відоме як "веб-сканери". Найвідоміший сканер називається "Googlebot". Сканери переглядають веб-сторінки та переходять за посиланнями на цих сторінках, як це робите ви під час перегляду вмісту в Інтернеті. Вони переходять від посилання до посилання та завантажують дані про ці веб-сторінки на сервери Google.

Процес сканування починається зі списку веб-адрес із попередніх сканувань і файлів sitemap, наданих власниками веб-сайтів. Коли наші сканери відвідують ці веб-сайти, вони шукають посилання на інші сторінки. Програмне забезпечення звертає особливу увагу на нові сайти, зміни в існуючих сайтах і неактивні посилання.

Комп’ютерні програми визначають, які сайти потрібно сканувати, як часто та скільки сторінок завантажувати з кожного сайту. Google не бере плату за частіше сканування сайтів для наших результатів веб-пошуку. Ми більше дбаємо про отримання найкорисніших результатів. Зрештою саме цього прагнуть користувачі, а отже й наша компанія.

Вибір для власників веб-сайтів

Для більшості веб-сайтів не потрібно встановлювати обмеження щодо сканування, індексування чи відображення, тому їх сторінки можуть з’являтися в результатах пошуку без додаткової обробки. Однак Інструменти для веб-майстрів і файл під назвою "robots.txt" дозволяють власникам сайтів вибрати, як Google скануватиме й індексуватиме їхні сайти. За допомогою файлу robots.txt власники сайтів можуть відмовитись від сканування роботом Googlebot або надати конкретні вказівки щодо обробки сторінок на своїх сайтах.

Власники сайтів мають багато варіантів вибору і можуть вирішити, як індексуватиметься вміст для кожної окремої сторінки. Наприклад, вони можуть відображати свої сторінки без фрагмента (підсумку сторінки, який відображається під назвою в результатах пошуку) або кешованої версії (альтернативної версії, яка зберігається на серверах Google на випадок, якщо опублікована сторінка недоступна). Веб-майстри можуть також інтегрувати пошук у власні сторінки за допомогою Користувацького пошуку.

Організація інформації за допомогою індексування

Інтернет схожий на постійно зростаючу громадську бібліотеку з мільярдами книг і без центральної файлової системи. Пошукова система Google, по суті, збирає сторінки під час процесу сканування та створює індекс, тому ми точно знаємо, як здійснювати пошук. Подібно до індексу в кінці книги, індекс Google містить інформацію про слова та їх місцезнаходження. Коли ви здійснюєте пошук, на найпростішому рівні наші алгоритми шукають ваші пошукові терміни в індексі та знаходять відповідні сторінки.

З цього моменту процес пошуку стає значно складнішим. Коли ви вводите запит "собаки", ви не хочете побачити сторінку, на якій сотні разів зустрічається слово "собаки". Вам, напевно, потрібні зображення, відео та список порід. Системи індексування Google помічають багато різних аспектів сторінок, як-от дату публікації, наявність зображень і відео тощо. Користуючись Графіком знань, ми виходимо за рамки пошуку збігів за ключовими словами, щоб краще розуміти людей, місця та речі, які вам не байдужі.

 

Інструменти для веб-майстрів

Щоб дізнатися про інструменти та ресурси, доступні власникам сайтів, відвідайте Центр для веб-майстрів.

Матеріал про принципи роботи пошуку

Перегляньте зображення, яке ілюструє різні фази процесу пошуку, – від підготовки до позиціювання та відображення результатів.