Xử lý tình trạng quá tải trang web do các robot của Cốc Cốc

Cập nhật lần cuối: 15/07/2022

Nếu bạn muốn làm giảm tốc độ các robot của Cốc Cốc ghé thăm trang web của bạn, bạn có thể sử dụng lệnh Crawl-delay (độ trễ thu thập thông tin) trong tệp robots.txt của mình.

Ví dụ, để thiết lập độ trễ thu thập thông tin cho robot web chính của Cốc Cốc là 5 giây, hãy thêm các lệnh sau đây vào tệp robots.txt của bạn:

User-agent: coccocbot-web
Crawl-delay: 5

img

Copied

warning

Xin lưu ý rằng các robot của chúng tôi không hỗ trợ thu thập thông tin trễ hơn 10 giây. Do đó, độ trễ thu thập thông tin 100 giây sẽ được coi là độ trễ thu thập thông tin 10 giây.

Việc tăng độ chậm trễ thu thập thông tin có thể làm chậm lại việc cập nhật trang web của bạn trong chỉ mục của chúng tôi. Nếu quy mô trang web của bạn nhỏ, điều này có thể không thành vấn đề. Trong trường hợp này, ngay cả với một giá trị độ trễ lớn, các robot của chúng tôi vẫn có thể yêu cầu truy cập các trang con trên trang web của bạn với tần suất đủ lớn.

Tuy nhiên, nếu bạn có hàng triệu trang nội dung, một giá trị độ trễ lớn có thể ảnh hưởng đến tốc độ cập nhật. Khi đó, trước tiên hãy đảm bảo rằng tất cả những trang có thể được lập chỉ mục của bạn đều hữu ích cho người dùng. Ví dụ, một trang web có thể sử dụng kiểu tìm kiếm thuộc tính (faceted search). Tìm kiếm theo khía cạnh là một cách phổ biến để tìm một đối tượng trong cơ sở dữ liệu lớn (big database) bằng cách sử dụng các bộ lọc. Mọi bộ lọc được đại diện bởi một tham số (parameter) trong các địa chỉ URL. Số tổ hợp các giá trị khác nhau của các tham số có thể sẽ rất lớn, mặc dù chỉ có một số lượng nhỏ thực sự tạo ra các đối tượng trong cơ sở dữ liệu.

Thông tin này có hữu ích không?

Gửi phản hồi