Bài viết hoặc đoạn nàycần đượcwiki hóa để đáp ứng tiêu chuẩnquy cách định dạng và văn phong của Wikipedia. Xin hãy giúpsửa bài viết này bằng cáchthêm bớt liên kết hoặc cải thiệnbố cục và cách trình bày bài. |
Googlebot làtrình thu thập web đượcGoogle sử dụng để thu thậptài liệu từweb để xây dựng một chỉ mục có thể tìm kiếm chocông cụ tìm kiếm Google. Googlebot là tên gọi chung cho hai loại trình thu thập dữ liệu khác nhau: Trình thu thập dữ liệu trênmáy tính (Googlebot Desktop) – mô phỏng người dùng trên máy tính, và trình thu thập trênthiết bị di động (Googlebot Smartphone) – mô phỏng người dùng trên thiết bị di động.[1][2]
Googlebot sử dụng cácthuật toán và vào cácwebsite, thực hiện quá trình thu thập và tiếp nhậndữ liệuweb. Nhờ vậy mà người dùng tìm kiếm được thông tin từ hàng tỷ website trên thế giới.
Googlebot bắt đầu với danh sáchURL của web tạo ra từ quá trình thu thập trước đó và bổ sung sitemap dữ liệu được cung cấp bởi quản trị web.
Khi Googlebot ghé thăm mỗi người trong số các trang web này và phát hiện liên kết (SRC và HREF) trên mỗi trang và thêm chúng vào danh sách của các trang để thu thập dữ liệu. Các trang web mới, sự thay đổi của các trang web đang hoạt động, các liên kết chết được ghi nhận và được sử dụng để cập nhật chỉ mục trên Google.
Googlebot thu thập dữ liệu quaHTTP/1.1. Tuy nhiên, bắt đầu từ tháng 11 năm 2020, nếu cho rằng một trang web có thể thu được nhiều lợi ích từ việc thu thập dữ liệu quaHTTP/2 thì Google sẽ có thể thu thập dữ liệu trang đó qua HTTP/2 nếu trang hỗ trợ giao thức này. Việc này có thể giúp tiết kiệm tài nguyênđiện toán (ví dụ nhưCPU,RAM) cho trang web và Googlebot, nhưng không ảnh hưởng đến việc lập chỉ mục hoặc xếp hạng trang web trên Google.[1]
Bài viết này vẫn cònsơ khai. Bạn có thể giúp Wikipediamở rộng nội dung để bài được hoàn chỉnh hơn. |