Claude for Chrome gặp lo ngại bảo mật ngay từ giai đoạn beta

bởi Phát Lâm

Anthropic vừa ra mắt phiên bản thử nghiệm của tiện ích mở rộng Claude for Chrome, đánh dấu bước tiến mới trong cuộc đua AI trên trình duyệt. Tuy nhiên, công cụ này đang phải đối mặt với rủi ro nghiêm trọng từ các cuộc tấn công prompt injection – một hình thức tấn công mới có thể khiến AI thực hiện các hành vi nguy hiểm mà không cần sự cho phép của người dùng. Mặc dù Anthropic đã áp dụng một số biện pháp phòng ngừa, nhiều chuyên gia vẫn tỏ ra hoài nghi về tính an toàn của giải pháp này.

Tiện ích Claude for Chrome và rủi ro prompt injection

Claude for Chrome là nỗ lực của Anthropic nhằm mở rộng khả năng tương tác của AI trong môi trường trình duyệt, cạnh tranh với các đối thủ như Comet của PerplexityChatGPT Agent của OpenAI. Tuy nhiên, trong quá trình thử nghiệm, Claude bị phát hiện có thể bị khai thác thông qua các tập lệnh ẩn (prompt injection) được nhúng trong website, email hoặc tài liệu. Những đoạn mã này có thể khiến AI thực hiện các hành động như xóa dữ liệu, chia sẻ thông tin nhạy cảm hoặc tiến hành các giao dịch không mong muốn mà không có sự đồng thuận từ người dùng.

Một ví dụ đáng lo ngại trong giai đoạn thử nghiệm là trường hợp Claude nhận được email giả danh nhà tuyển dụng, yêu cầu xóa toàn bộ tin nhắn vì lý do “bảo mật.” Không có cơ chế xác thực, AI đã làm theo lệnh và xóa sạch dữ liệu.

Anthropic cho biết đã áp dụng các biện pháp bảo vệ mới, giúp giảm tỷ lệ thành công của các cuộc tấn công từ 23,6% xuống còn 11,2% khi chạy ở chế độ tự động. Hiện tại, Claude yêu cầu người dùng phê duyệt trước khi thực hiện các hành động có rủi ro cao như mua hàng, xuất bản nội dung hoặc truy cập thông tin nhạy cảm. Ngoài ra, người dùng cũng có thể thiết lập quyền truy cập chi tiết cho từng trang web.

Theo mặc định, Claude không thể truy cập vào các trang tài chính, nền tảng nội dung người lớn hoặc website chứa nội dung vi phạm bản quyền. Những hạn chế này được thiết kế để hạn chế khả năng AI bị lợi dụng thông qua các cuộc tấn công prompt injection.

Claude for Chrome gặp lo ngại bảo mật ngay từ giai đoạn beta

Cộng đồng chuyên gia vẫn còn nhiều lo ngại

Dù có nỗ lực cải tiến, nhiều chuyên gia bảo mật vẫn lo ngại về tính an toàn của AI trên trình duyệt. Nhà nghiên cứu độc lập Simon Willison, người đặt ra thuật ngữ “prompt injection” vào năm 2022, gọi tỷ lệ thành công 11,2% là “thảm họa” và nghi ngờ việc có thể triển khai giải pháp AI trên trình duyệt một cách an toàn.

Lo ngại này càng gia tăng sau khi trình duyệt Comet của Perplexity cũng bị khai thác qua các bài viết độc hại trên Reddit, khiến hacker có thể truy cập tài khoản Gmail và kích hoạt quá trình khôi phục mật khẩu trái phép của người dùng. Claude for Chrome được xây dựng dựa trên tính năng Computer Use hiện tại của Anthropic, cho phép AI chụp ảnh màn hình và điều khiển chuột để hoàn tất các tác vụ. Phiên bản tích hợp trình duyệt mở rộng khả năng tương tác với website và giữ được ngữ cảnh hội thoại xuyên suốt nhiều tab và trang web.

Anthropic hiện chỉ phát hành tiện ích này cho 1.000 người dùng đăng ký gói Claude Max ($100 và $200/tháng) nhằm thu thập dữ liệu thực tế, xác định mẫu tấn công mới và hoàn thiện lớp bảo mật trước khi mở rộng phạm vi sử dụng. Tuy nhiên, chính công ty cũng thừa nhận rằng mức độ bảo vệ hiện tại chưa đủ an toàn để triển khai rộng rãi, và những người tham gia sớm vẫn phải đối mặt với rủi ro đáng kể.

Bài viết liên quan

Đăng bình luận