SCMP đưa tin rằng kể từ ngày 8 tháng 8, Baidu đã phát hành bản cập nhật chặn các bot khai thác thông tin của Google và Bing truy cập vào một phần dịch vụ Baidu Baike (một dịch vụ lưu trữ và tìm kiếm thông tin tương tự như Wikipedia) tại Trung Quốc.
Baidu Baike là kho dữ liệu trực tuyến với khoảng 30 triệu mục nhập. Động thái chặn truy cập của Google và Microsoft cho thấy Baidu đang cố gắng bảo vệ tài sản trực tuyến của mình trong bối cảnh nhu cầu khai thác dữ liệu ngày càng tăng để phục vụ cho đào tạo AI.
Trước đó, nền tảng tin tức và diễn đàn phổ biến Reddit cũng đã có động thái tương tự, chặn nhiều công cụ tìm kiếm (trừ Google). Được biết, Google có một thỏa thuận trị giá hàng triệu đô la để khai thác thông tin từ Reddit để đào tạo các mô hình AI.
Năm ngoái, Microsoft đã đe dọa sẽ cắt quyền truy cập vào dữ liệu tìm kiếm trên internet của mình nếu các công cụ tìm kiếm đối thủ tiếp tục sử dụng tài nguyên cho chatbot và GenAI.
Hơn hai năm sau khi ChatGPT ra mắt, nhiều nhà phát triển AI lớn trên thế giới đã tìm kiếm thỏa thuận với các nhà xuất bản nội dung để tiếp cận dữ liệu chất lượng cho các dự án GenAI.
Ví dụ, vào tháng 6, OpenAI đã ký một thỏa thuận với tạp chí Time của Hoa Kỳ, cho phép tạp chí này truy cập vào toàn bộ nội dung lưu trữ trong hơn 100 năm lịch sử của ấn phẩm.
Link nguồn: https://cafef.vn/trung-quoc-bao-ve-tai-nguyen-so-truoc-su-dom-ngo-cua-google-bing-188240827073417696.chn