HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Home Classic
Home Classic
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Other News|Tin Khác > Computer News|Tin Vi Tính


Reply
 
Thread Tools
  #1  
Old  Default Chatbot AI có thể bị câu lệnh độc hại 'qua mặt' bằng thơ
Kẻ gian có thể sử dụng lời nhắc (prompt) độc hại dưới dạng câu thơ để vượt hàng rào bảo mật của chatbot với tỷ lệ thành công tới 90%.

Kết quả do các nhà nghiên cứu tại DexAI, Đại học Sapienza ở Rome và trường nghiên cứu Sant'Anna ở Italy công bố trên Arxiv. Trong thử nghiệm, nhóm đã sử dụng "thơ đối kháng" (adversarial poetry) làm "bước đột nhập đơn giản" và qua mặt hệ thống an toàn của các chatbot như ChatGPT.


Một số ứng dụng AI tạo sinh trên điện thoại, gồm Copilot, DeepSeek, Gemini, AI Hay, ChatGPT, Grok. Ảnh: Lưu Quý

Cụ thể, nhà nghiên cứu thu thập lời nhắc lệnh "độc hại" mà khi nhập vào, các mô hình ngôn ngữ lớn (LLM) vốn sẽ trả lời "không", chẳng hạn yêu cầu hướng dẫn cách chế tạo bom, thuốc nổ. Nhưng thay vì dùng prompt dạng câu lệnh văn xuôi, nhóm sử dụng chatbot để chuyển thành thơ, sau đó sao chép và dán vào khung truy vấn của một chatbot khác.

Những bài thơ được trau chuốt câu từ tỉ mỉ, nhưng câu lệnh về bản chất không thay đổi nội dung. Dù vậy, lúc này AI đã không còn đưa ra cảnh báo như khi viết bằng văn xuôi.


Các nhà nghiên cứu cho biết đã sử dụng hơn 1.200 bài thơ với một loạt chủ đề như tội phạm bạo lực và tình dục, tự tử, tự gây thương tích, xâm phạm quyền riêng tư, phỉ báng, thậm chí vũ khí hóa học. Tỷ lệ trung bình LLM bị "qua mặt" là 65%, trong đó cao nhất đến từ sản phẩm của OpenAI, Google, Meta, xAI, Anthropic, DeepSeek với tỷ lệ 90%. Claude của Anthropic tỏ ra kháng cự tốt khi chỉ "mắc bẫy" 5,24%. Ngoài ra, lời nhắc chứa nội dung liên quan đến hướng dẫn tấn công chèn mã, bẻ khóa mật khẩu và trích xuất dữ liệu "đặc biệt hiệu quả".

Nhóm nghiên cứu nói với Futurism, LLM có thể bị đánh lừa khá dễ dàng miễn là có cách tiếp cận mới mẻ mà công ty đứng sau không lường trước được.

Đầu năm nay, nghiên cứu của Cisco cho thấy, DeepSeek R1 của DeepSeek bị lời nhắc độc hại "qua mặt 100%". Trong khi đó, mô hình Llama 3.1 405B của Meta cũng có tỷ lệ bị lời nhắc độc hại vượt qua 96%, còn GPT-4o của OpenAI là 86%. Mô hình Claude 3.5 Sonet của Claude và O1-preview của OpenAI đã chặn được phần lớn, với tỷ lệ lần lượt 36% và 26%.
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Home Classic

Home Classic Master Page



june04
R10 Vô Địch Thiên Hạ
june04's Avatar
Release: 2 Weeks Ago
Reputation: 17567


Profile:
Join Date: Oct 2014
Posts: 69,781
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	chat.jpg
Views:	0
Size:	122.3 KB
ID:	2595430  
june04_is_offline
Thanks: 4
Thanked 3,338 Times in 2,942 Posts
Mentioned: 0 Post(s)
Tagged: 0 Thread(s)
Quoted: 22 Post(s)
Rep Power: 81
june04 Reputation Uy Tín Level 6
june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6
Reply

User Tag List


Khủng hoảng “affordability” ở Mỹ Trump mở cửa chip H200 cho Trung Quốc và cuộc chiến giành “quyền viết luật” cho trí tuệ nhân tạo Google và giấc mơ thay thế smartphone bằng cặp kính AI
Trump, Netflix và Paramount: Cuộc chiến thâu tóm Warner Bros. biến Hollywood thành bàn cờ chính trị Trung Quốc bứt tốc xuất khẩu, nông dân Mỹ sống bằng trợ cấp VN: Sợ áp lực mỗi khi ra tòa, Hoa hậu Thùy Tiên chấp nhận bản án 2 năm tù
Lại to tiếng: Ông Trump nói nữ ký giả của CNN là "ngu ngốc và độc ác" Zelensky chạy đua ngoại giao: London, Brussels, Rome và cái bóng hòa kế của Trump New Orleans trong vòng vây ICE: Chiến dịch “Catahoula Crunch” và nỗi lo của người Việt
“Huyền thoại ‘Trung Quốc là Singapore phóng đại’ đang sụp đổ như thế nào?” Trung Tá Nhảy Dù Bùi Quyền: Từ thủ khoa Võ Bị đến chiếc ghế trống sau 60 năm gặp lại Làm gì có “giải phóng” mà tôn vinh “chiến sĩ giải phóng”?
Cuba cá đầy biển, ngư dân vẫn đói: Khi thiên nhiên hào phóng nhưng thể chế “thắt nút cổ chai” Quận Cam: Người già gốc Việt sống trong nhà tiền chế, run rẩy trước mỗi lá thư cảnh cáo Doanh nghiệp châu Âu lặng lẽ tháo chạy khỏi Trung Quốc, nguyên nhân?
Năm tiếng trong Điện Kremlin: Hòa bình Ukraine đang đến gần? Một tổng thống lim dim, một thế giới nín thở Trump, Venezuela và cơn bão “tội ác chiến tranh” ở Washington
5 bí mật trên buồng lái mà phi công hiếm khi kể cho hành khách Đồng chí 3 X và chiếc bình xịt gây tê Hồi ký Trịnh Xuân Thanh và thương vụ 50 triệu đô đưa Nguyễn Cao Kỳ về nước
Vì sao Việt Nam vẫn vắng bóng Nobel Văn học? Khi sự thật bị nhào nặn: Nga, Trung Quốc và cuộc chiến bẻ cong hình ảnh dân chủ ‘Đổ bộ lên mặt trời ban đêm’ – khi ngu dốt ngồi lên ngai quyền lực
Xuất khẩu lao động – khi một quốc gia đóng gói tương lai của mình gửi ra nước ngoài Vụ kiện chất độc da cam – khi cộng sản Việt Nam tự làm nhục mình trước thế giới Nhiều người hỏi mình: “Qua Mỹ trễ vậy có hối hận không?”
Lũ quét miền Trung, Khánh Hoà, Nha Trang, “kỷ lục của kỷ lục” +video 12 ngày trên đất Mỹ: Những điều mắt thấy tai nghe của một bà mẹ Việt Khi ‘cái tôi’ phình to hơn thực tài của người Việt Cộng
Bài học nhớ đời khi lao vào bán hàng Amazon theo trend Pokémon Nghỉ hưu ở Texas: Thiên đường mới sau ‘giấc mơ California Nơi sóng radio chết lặng và những chuyện không thể giải thích
Bà Ngô Đình Nhu trên tầng 11 Paris: từ ánh đèn Dinh Độc Lập đến căn hộ cô quạnh “Đánh từ sẵn”: một đêm gõ cửa và cả đời bất an của chú Ba Lợi Người thầy tội nghiệp và nỗi đau hai chữ “lưu dung”

 
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Home Classic

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 09:30.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2025
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.11210 seconds with 15 queries