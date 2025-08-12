Các nhà khoa học Australia vừa mới phát triển một kỹ thuật mới, có khả năng ngăn chặn các hệ thống Trí tuệ Nhân tạo (AI) học hỏi trái phép từ hình ảnh, tác phẩm nghệ thuật và các nội dung trực tuyến khác.

Theo Cơ quan Khoa học Quốc gia Australia (CSIRO), kỹ thuật này thay đổi một cách tinh vi nội dung của hình ảnh để khiến các mô hình AI không thể đọc được, trong khi vẫn không thay đổi đối với mắt người. Đây là dự án được phát triển bởi CSIRO, cùng với sự hợp tác của Trung tâm Nghiên cứu Hợp tác An ninh mạng (CSCRC) của Australia và Đại học Chicago (Mỹ).

Các tác giả cho biết sáng kiến đột phá này có thể giúp các nghệ sỹ, tổ chức và người dùng mạng xã hội bảo vệ tác phẩm, cũng như dữ liệu cá nhân của họ khỏi việc bị sử dụng để đào tạo các hệ thống AI hoặc tạo ra các sản phẩm deepfake - các video, hình ảnh hoặc âm thanh giả mạo được AI tạo ra một cách cực kỳ chân thực. Chẳng hạn, người dùng có thể tự động áp dụng một lớp bảo vệ đối với hình ảnh trước khi đăng tải, ngăn AI học các đặc điểm khuôn mặt để tạo ra các sản phẩm deepfake.

Tương tự, các tổ chức quốc phòng có thể bảo vệ hình ảnh vệ tinh nhạy cảm hoặc dữ liệu về các mối đe dọa trên không gian mạng.

Theo Tiến sỹ Derui Wang, nhà khoa học của CSIRO, phương pháp này sử dụng một cơ sở toán học vững chắc để đảm bảo rằng các mô hình AI không thể học được từ nội dung đó, hay nói cách khác kỹ thuật này làm cho dữ liệu trở nên "không thể học được" đối với AI ở một mức độ đủ để bảo vệ quyền riêng tư và bản quyền, trong khi vẫn giữ nguyên tính hữu dụng cho con người.

Ông cho biết thêm sự bảo vệ này vẫn có hiệu lực ngay cả khi AI cố gắng thích ứng hoặc được đào tạo lại.

Tiến sỹ Wang cho biết kỹ thuật này có thể được áp dụng tự động trên quy mô lớn. Ông cho biết một nền tảng hoặc trang web truyền thông xã hội có thể nhúng lớp bảo vệ này vào tất cả hình ảnh được tải lên. Điều này có thể hạn chế sự gia tăng của deepfake, giảm trộm cắp tài sản trí tuệ và giúp người dùng giữ quyền kiểm soát nội dung của họ.

Mặc dù phương pháp này hiện chỉ áp dụng cho hình ảnh, các nhà nghiên cứu có kế hoạch mở rộng sang văn bản, âm nhạc và video. Công nghệ này hiện vẫn đang trong giai đoạn lý thuyết và chỉ mới được chứng minh là hoạt động hiệu quả trong môi trường thử nghiệm tại phòng thí nghiệm.

Công trình khoa học trên, với tên gọi “Provably Unlearnable Data Examples” đã được trao Giải thưởng Nghiên cứu Xuất sắc tại Hội nghị chuyên đề về An ninh Mạng và Hệ thống Phân tán (NDSS) năm 2025./.

