Skip to content
legiang.it.com

Website kéo nội dung test độ chịu tải của code

  • Trang chủ
  • Thị trường
  • Tài chính
  • Ngân hàng
  • Doanh nghiệp
  • Bất động sản
  • Đời sống
  • Khỏe Và Đẹp
legiang.it.com
Chủ đề nổi bật
  • Apple ra mắt iOS 18 Beta 3 với nhiều tính năng hấp dẫn
  • Bất ngờ iPhone 16 xách tay rớt giá hàng chục triệu đồng
  • Bị tai biến sau hút mỡ bụng tại Bệnh viện Răng hàm mặt thẩm mỹ Paris
  • Blogger ẩm thực ‘mách’ 5 món đặc sản Hà Nội khiến thực khách mê mệt
  • Cảnh giác với gói du lịch, phòng khách sạn giá rẻ bất thường dịp lễ 2/9
Categories Tài chính

Một công ty vừa dụ AI vào bẫy — để nó tự huấn luyện bằng ‘rác’ do chính nó tạo ra

By legiang 27/03/2025 0 12 Views

AI đang đánh cắp nội dung của bạn và các công ty AI đã xây dựng nên đế chế kinh doanh bằng cách thu thập dữ liệu web. Cloudflare, một dịch vụ mạng toàn cầu, đã nghĩ ra một kế hoạch mới để đối phó với vấn nạn này: “mê cung AI”.

AI đang đánh cắp nội dung của bạn. Chúng ta đều biết các công ty AI đã xây dựng nên những doanh nghiệp trị giá hàng tỷ USD như thế nào – bằng cách cào dữ liệu web và sử dụng dữ liệu của bạn để huấn luyện chatbot. Việc cào dữ liệu web không phải là điều mới mẻ. Trước đây, các trang web có thể dựa vào các giao thức đơn giản như robots.txt để xác định những gì có thể và không thể được sử dụng bởi các trình thu thập thông tin web. Các hướng dẫn đó đã được các công ty thực hiện việc cào dữ liệu, chẳng hạn như xây dựng kết quả cho các công cụ tìm kiếm, tôn trọng. Tuy nhiên, các công ty AI lại không tuân thủ giao kèo xã hội này và phớt lờ các hướng dẫn đó.

Một công ty vừa dụ AI vào bẫy — để nó tự huấn luyện bằng 'rác' do chính nó tạo ra- Ảnh 1.

Chú thích ảnh

Cloudflare, một dịch vụ mạng toàn cầu giúp một số trang web lớn nhất thế giới phân phối nội dung đến người dùng, đã nghĩ ra một kế hoạch mới để đối phó với các trình cào dữ liệu web của các công ty AI. Ý tưởng này vừa xảo quyệt lại vừa khéo léo. Trong một bài đăng blog mới, Cloudflare đã chia sẻ cách họ đang “bẫy các bot cư xử sai trái trong một mê cung AI”. Về cơ bản, các bot không tuân theo các quy tắc được đặt ra cho chúng thông qua các giao thức như robots.txt, một tệp văn bản đơn giản quy định những gì trình thu thập thông tin web được phép làm trên một trang web, sẽ bị can thiệp để làm lãng phí thời gian và tài nguyên của công ty phụ trách bot.

Cloudflare cho biết: “Nội dung do AI tạo ra đã bùng nổ… đồng thời, chúng tôi cũng chứng kiến sự bùng nổ của các trình thu thập thông tin mới được các công ty AI sử dụng để cào dữ liệu cho việc huấn luyện mô hình. Các trình thu thập thông tin AI tạo ra hơn 50 tỷ yêu cầu đến mạng Cloudflare mỗi ngày, tương đương gần 1% tổng số yêu cầu web mà chúng tôi thấy.” Cloudflare cho biết trước đây họ chỉ chặn các trình thu thập thông tin và cào dữ liệu web AI. Tuy nhiên, việc làm như vậy đã cảnh báo những người đứng sau các bot rằng quyền truy cập của họ đã bị từ chối, và kết quả là họ sẽ thay đổi chiến lược để tiếp tục các chiến dịch cào dữ liệu của mình.

Vì vậy, Cloudflare đã nảy ra ý tưởng xây dựng một “honeypot”: một loạt các trang web giả được tạo bằng nội dung do AI tạo ra. Việc Cloudflare sử dụng nội dung do AI tạo ra để chống lại các trình cào dữ liệu web AI không chỉ đơn thuần là để hả hê. Khi AI huấn luyện trên nội dung do AI tạo ra, nó thực sự làm suy giảm chính mô hình AI. Ngành công nghiệp này thậm chí còn có một thuật ngữ cho nó: “model collapse” (sụp đổ mô hình). Cloudflare về cơ bản đang đảm bảo rằng các bot vi phạm quy tắc sẽ bị trừng phạt vì đã làm như vậy.

Bài đăng của Cloudflare đi sâu vào các chi tiết kỹ thuật của việc xây dựng mê cung AI. Nhưng, ý chính của nó là Cloudflare đã nghĩ ra mọi thứ theo cách mà khách truy cập là con người sẽ không bao giờ nhìn thấy các trang honeypot do AI tạo ra này. Ngoài ra, con người sẽ nhận thấy “những điều vô nghĩa do AI tạo ra” trên các trang này. Tuy nhiên, các bot sẽ rơi xuống hang thỏ, lãng phí tài nguyên tính toán khi chúng đi sâu hơn và sâu hơn qua nhiều trang nội dung do AI tạo ra. Khách hàng của Cloudflare có thể lựa chọn sử dụng mê cung AI ngay bây giờ để bảo vệ nội dung của họ khỏi các trình cào dữ liệu web.

Theo Ánh Viên

Đời sống pháp luật

5/5 - (8 bình chọn)
Tags : Tags AI   trí tuệ nhân tạo
Share
facebookShare on FacebooktwitterShare on TwitterpinterestShare on Pinterest
linkedinShare on LinkedinvkShare on VkredditShare on ReddittumblrShare on TumblrviadeoShare on ViadeobufferShare on BufferpocketShare on PocketwhatsappShare on WhatsappviberShare on ViberemailShare on EmailskypeShare on SkypediggShare on DiggmyspaceShare on MyspacebloggerShare on Blogger YahooMailShare on Yahoo mailtelegramShare on TelegramMessengerShare on Facebook Messenger gmailShare on GmailamazonShare on AmazonSMSShare on SMS
Post navigation
Previous post

Công ty sản xuất nước mắm Chin-su, mì Omachi của tỷ phú Nguyễn Đăng Quang đặt mục tiêu doanh thu từ 33.500 – 35.500 tỷ trước thềm niêm yết HOSE

Next post

Trước thềm khởi công, siêu dự án 85.000 tỷ đồng của Vinhomes tại Cam Ranh liên tục có động thái mới: Từ huy động vốn đến đẩy nhanh công tác giải phóng mặt bằng

Đọc Thêm

Một công ty vừa dụ AI vào bẫy — để nó tự huấn luyện bằng ‘rác’ do chính nó tạo ra

Chuyên gia giải thích cho cú bán tháo thứ 2 của chứng khoán Mỹ: “Nhà đầu tư không muốn chờ kết quả cuộc đấu, họ bán trước, đặt câu hỏi sau”

Một công ty vừa dụ AI vào bẫy — để nó tự huấn luyện bằng ‘rác’ do chính nó tạo ra

Báo cáo việc làm Mỹ tháng 3 bất ngờ tăng vượt kỳ vọng, mặc nỗi lo cuộc chiến thương mại gây suy thoái kinh tế

Một công ty vừa dụ AI vào bẫy — để nó tự huấn luyện bằng ‘rác’ do chính nó tạo ra

Chứng khoán Mỹ điều chỉnh mạnh, Dow Jones mất hơn 1.100 điểm, nhóm cổ phiếu công nghệ chìm trong sắc đỏ

Leave a Comment Hủy

BNIX NVME HOSTING
  • Trang chủ
  • Thị trường
  • Tài chính
  • Ngân hàng
  • Doanh nghiệp
  • Bất động sản
  • Đời sống
  • Khỏe Và Đẹp

LEGIANG.IT.COM

Cơ quan chủ quản: Cá nhân
Chịu trách nhiệm nội dung: Đinh Lê Giang
Website kéo nội dung, test độ chịu tải của code và VPS

Logo
Copyright © 2025 legiang.it.com
Menu
  • Trang chủ
  • Thị trường
  • Tài chính
  • Ngân hàng
  • Doanh nghiệp
  • Bất động sản
  • Đời sống
  • Khỏe Và Đẹp
Tài Khoản

  • Lost your password ?