• Vietnamleads
  • Liên hệ
16/10/2025
Vietnamleads
Không có kết quả
Xem tất cả kết quả
  • Thị trường
  • Doanh nghiệp
  • Đầu tư
  • Hạ tầng
  • Tài chính
    • Ngân hàng
    • Bảo hiểm
  • Chuyển đổi số
    • Số hóa
  • Chính sách
  • To Foreigner
    • Opportunities
    • Policy & Regulation
  • Thị trường
  • Doanh nghiệp
  • Đầu tư
  • Hạ tầng
  • Tài chính
    • Ngân hàng
    • Bảo hiểm
  • Chuyển đổi số
    • Số hóa
  • Chính sách
  • To Foreigner
    • Opportunities
    • Policy & Regulation
VNL
Không có kết quả
Xem tất cả kết quả
VNL Chuyển đổi số

Dữ liệu xấu có thể “đầu độc” những mô hình AI mạnh nhất

16/10/2025
0 0
A A
0
0
Chia sẻ
Share on FacebookShare on Twitter

Nghiên cứu mới cho thấy chỉ vài trăm tài liệu độc hại cũng đủ “nhiễm bẩn” một mô hình, bất kể quy mô lớn ra sao…

Theo một nghiên cứu mới của Anthropic phối hợp cùng Viện An ninh AI Vương quốc Anh và Viện Alan Turing, chỉ cần 250 tài liệu xấu, một con số cực nhỏ so với hàng tỷ văn bản dùng để huấn luyện mô hình, cũng đủ khiến mô hình phản ứng sai lệch hoặc gây hại, khi gặp phải một từ khóa hoặc mẫu lệnh nhất định.

Khái niệm “ngộ độc dữ liệu” thực ra không mới. Các chuyên gia học máy đã cảnh báo nguy cơ này từ nhiều năm trước, nhất là với những mô hình nhỏ hoặc trong môi trường nghiên cứu.

Nhưng nghiên cứu mới đã cho thấy điều bất ngờ là kích thước mô hình hóa ra không tạo ra sự khác biệt. Các mô hình lớn nhất hiện nay, dù được huấn luyện bằng lượng dữ liệu khổng lồ, vẫn dễ bị ảnh hưởng như các mô hình nhỏ, nếu bị chèn cùng một lượng dữ liệu xấu.

Kết quả này đi ngược lại giả định phổ biến rằng quy mô càng lớn thì mô hình càng “miễn nhiễm” với kiểu tấn công này.

Trước đây, người ta tin rằng kẻ tấn công phải làm hỏng một tỷ lệ đáng kể nguồn dữ liệu huấn luyện – tương đương hàng triệu tài liệu với các mô hình lớn. Nhưng nghiên cứu mới cho thấy chỉ vài trăm tài liệu độc hại cũng đủ “nhiễm bẩn” mô hình, bất kể quy mô ra sao.

Phát hiện này gióng lên hồi chuông cảnh báo rằng các cuộc tấn công đầu độc dữ liệu có thể dễ thực hiện hơn nhiều và phổ biến hơn so với những gì người trong ngành từng nghĩ.

Theo ông Vasilios Mavroudis – đồng tác giả nghiên cứu và là nhà khoa học cấp cao tại Viện Alan Turing, điều đáng lo là những kẻ xấu có thể lợi dụng phát hiện này theo nhiều cách khác nhau.

“Một ví dụ là mô hình có thể được cài đặt để khi phát hiện một chuỗi từ nhất định, nó sẽ bỏ qua toàn bộ các cơ chế bảo vệ và bắt đầu hỗ trợ người dùng thực hiện các hành vi độc hại,” Mavroudis nói.

Một rủi ro khác mà ông đề cập là khả năng mô hình có hành vi phân biệt đối xử – tức là từ chối trả lời hoặc giảm tính hữu ích với một số nhóm người chỉ vì phát hiện ra họ dùng những từ khóa hay cách diễn đạt không đạt chuẩn.

Theo ông Mavroudis, “rất dễ để nhận ra một mô hình hoàn toàn không phản hồi, nhưng nếu mô hình chỉ hoạt động kém đi một chút, thì gần như không thể phát hiện bằng cách thông thường.”

Nhóm nghiên cứu cảnh báo kiểu đầu độc dữ liệu này có thể lan rộng và kêu gọi ngành AI cần có biện pháp phòng vệ mạnh mẽ hơn, đồng thời đầu tư nghiêm túc vào nghiên cứu cách phát hiện và ngăn chặn hiện tượng này.

Ông Mavroudis đề xuất các công ty nên quản lý dữ liệu đầu vào bằng cách:  Xác minh kỹ nguồn dữ liệu; Lọc và kiểm tra chặt chẽ hơn trước khi huấn luyện; Kiểm tra hành vi mô hình sau khi đào tạo để phát hiện bất thường.

“Chúng tôi có bằng chứng sơ bộ cho thấy nếu tiếp tục huấn luyện bằng dữ liệu sạch và được chọn lọc kỹ, mô hình có thể tự loại bỏ dần các yếu tố độc hại đã bị chèn vào trước đó”, ông nói. 

Đây là một lời nhắc quan trọng cho ngành AI, vốn đang quá chú trọng vào quy mô. Mô hình “to hơn” không có nghĩa là “an toàn hơn”. Đôi khi, chỉ cần vài tệp dữ liệu xấu cũng đủ khiến cả hệ thống lệch hướng.

-Hạ Chi

(Nguồn tin)

Chia sẻTweetChia sẻ

Đăng ký nhận cập nhật mới nhất về các bài viết cùng chủ đề.

Hủy đăng ký
Bài viết trước

Fresia Riverside ‘ghi điểm’ nhờ tiến độ xây dựng

Bài viết sau

Gold shop fined $2,000 for selling fake Chanel jewelry

Bài viết liên quan

Bảng xếp hạng số lượt tải các ứng dụng AI tạo sinh tại khu vực châu Á - Thái Bình Dương. Ảnh: Sensor Tower.
Chuyển đổi số

Người dùng châu Á đang sử dụng Gen AI nhiều nhất thế giới

16/10/2025
1
Các đại biểu thực hiện nghi thức ra mắt Nền tảng đào tạo sở hữu trí tuệ trực tuyến phi lợi nhuận L2Pro.
Chuyển đổi số

Qualcomm thúc đẩy hệ sinh thái khởi nghiệp công nghệ tại Việt Nam

15/10/2025
1
ChainTracer hỗ trợ truy vết vụ án AntEx hiệu quả
Chuyển đổi số

ChainTracer hỗ trợ truy vết vụ án AntEx hiệu quả

15/10/2025
1
Bài viết sau
Gold shop fined $2,000 for selling fake Chanel jewelry

Gold shop fined $2,000 for selling fake Chanel jewelry

Để lại một bình luận Hủy

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Bài viết mới

  • Gold shop fined $2,000 for selling fake Chanel jewelry
  • Dữ liệu xấu có thể “đầu độc” những mô hình AI mạnh nhất
  • Fresia Riverside ‘ghi điểm’ nhờ tiến độ xây dựng
  • Bạc tăng lên đỉnh mọi thời đại, người Hà Nội xếp hàng mua từ sáng sớm
  • Giá vàng SJC trên thị trường tự do lên 160 triệu đồng/lượng, NHNN thông tin nóng về thành lập sàn giao dịch vàng

Bình luận gần đây

    Bài viết lưu trữ

    • Tháng mười 2025
    • Tháng chín 2025
    • Tháng sáu 2025
    • Tháng năm 2025
    • Tháng tư 2025
    • Tháng ba 2025
    • Tháng hai 2025
    • Tháng Một 2025
    • Tháng mười hai 2024
    • Tháng mười một 2024
    • Tháng mười 2024
    • Tháng chín 2024
    • Tháng tám 2024
    • Tháng bảy 2024
    • Tháng sáu 2024
    • Tháng năm 2024
    • Tháng tư 2024
    • Tháng ba 2024
    • Tháng hai 2024
    • Tháng Một 2024
    • Tháng mười hai 2023
    • Tháng mười một 2023
    • Tháng mười 2023
    • Tháng chín 2023
    • Tháng tám 2023
    • Tháng bảy 2023
    • Tháng sáu 2023
    • Tháng năm 2023
    • Tháng tư 2023
    • Tháng ba 2023
    • Tháng hai 2023
    • Tháng Một 2023
    • Tháng mười hai 2022
    • Tháng chín 2022
    • Tháng bảy 2022
    • Tháng sáu 2022
    • Tháng năm 2022
    • Tháng tư 2022
    • Tháng ba 2022
    • Tháng hai 2022
    • Tháng mười hai 2021
    • Tháng mười một 2021
    • Tháng mười 2021
    • Vietnamleads
    • Liên hệ
    Email us: us@vietnamleads.com

    © 2021 | Vietnamleads

    Không có kết quả
    Xem tất cả kết quả
    • Thị trường
    • Doanh nghiệp
    • Đầu tư
    • Hạ tầng
    • Tài chính
      • Ngân hàng
      • Bảo hiểm
    • Chuyển đổi số
      • Số hóa
    • Chính sách
    • To Foreigner
      • Opportunities
      • Policy & Regulation
    • Đăng nhập

    © 2021 | Vietnamleads

    Chào mừng bạn trở lại!

    Đăng nhập với Facebook
    Đăng nhập với Google
    Hoặc

    Đăng nhập vào Tài khoản bên dưới

    Quên Mật khẩu?

    Lấy lại Mật khẩu

    Vui lòng nhập Tên đăng nhập hoặc Email để đặt lại Mật khẩu.

    Đăng nhập
    Trang web này sử dụng cookie. Bằng cách tiếp tục sử dụng trang web này, bạn đồng ý với việc sử dụng cookie.