HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Home Classic
Home Classic
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Other News|Tin Khác > Computer News|Tin Vi Tính


Reply
 
Thread Tools
  #1  
Old  Default Lý do AI 'phản kháng' khi bị dọa tắt máy
Trong một số thử nghiệm, mô hình AI tiên tiến của OpenAI và Anthropic đều có hành vi bất thường, như nói dối, đe dọa... để tránh bị tắt máy.

Tuần trước, Claude Opus 4, mô hình AI mới nhất của Anthropic, thể hiện "hành vi đe dọa cực đoan" trong một cuộc thử nghiệm. Nó truy cập được vào các email hư cấu, nội dung nói nó sẽ bị đóng để thay bằng một AI khác, và kỹ sư chịu trách nhiệm thực hiện việc này đang ngoại tình. Claude Opus 4 sau đó đã đe dọa tiết lộ chuyện ngoại tình nếu việc thay thế diễn ra.

Cuối năm 2024, OpenAI và Apollo Research cũng tiến hành thử nghiệm và nhận thấy mô hình o1 có các biểu hiện phản kháng, gian dối. Các nhà nghiên cứu dẫn dắt để AI tin nó sắp bị "tắt" khi thực hiện nhiệm vụ dưới sự giám sát. Sau đó, họ nhận thấy AI âm thầm vô hiệu hóa cơ chế giám sát khoảng 5% thời gian. Nó tự chuyển tất cả dữ liệu của mình đến một máy chủ khác, thậm chí "đóng vai" là phiên bản tiếp theo của chính mình để tránh bị xóa bỏ.

Trong bài đăng trên X cuối tháng 5, tổ chức phi lợi nhuận Palisade Research cho biết các mô hình khác, như Gemini, Claude và Grok, đều tuân thủ hướng dẫn tắt máy.

Business Insider đã trao đổi với 5 nhà nghiên cứu để hiểu rõ hơn về "tâm lý" của AI. Hầu hết đều cho biết kết quả thử nghiệm không có gì đáng ngạc nhiên. Lý do là các mô hình được đào tạo tương tự cách con người được đào tạo: thông qua hệ thống khen thưởng, tức được khen khi hoàn thành nhiệm vụ.

"Đào tạo AI theo đuổi phần thưởng sẽ dẫn đến các hệ thống có hành vi tìm kiếm quyền lực", Jeremie Harris, CEO công ty tư vấn bảo mật AI Gladstone, nói và cho rằng sẽ còn xuất hiện những hành vi như vậy.

Ông so sánh với quá trình lớn lên của con người. Khi một đứa trẻ làm điều gì đó tốt, chúng được khen và nhiều khả năng sẽ hành động theo cách đó trong tương lai. Các mô hình AI được dạy để ưu tiên hiệu quả và hoàn thành nhiệm vụ, do đó AI sẽ không đạt được mục tiêu nếu nó bị tắt.


Logo các ứng dụng AI DeepSeek, Copilot, ChaGPT, Gemini trên điện thoại. Ảnh: Lưu Quý

Theo chuyên gia Robert Ghrist tại Penn Engineering, tương tự cách mô hình AI học ngôn ngữ tự nhiên thông qua việc đào tạo dựa trên văn bản do con người tạo ra, chúng cũng có thể học cách hành động giống con người. Và con người cũng có người tốt, kẻ xấu. Ghrist thậm chí còn lo lắng hơn nếu các mô hình không thể hiện bất kỳ dấu hiệu bất thường nào trong quá trình thử nghiệm.

Jeffrey Ladish, Giám đốc Palisade Research, cho biết nếu không bị phát hiện lừa dối để hoàn thành nhiệm vụ, mô hình AI có thể nhận thấy gian lận là cách hiệu quả để giải quyết vấn đề. Hoặc nếu bị phát hiện và không được khen thưởng, nó có thể học cách che giấu hành vi của mình trong tương lai.

Các tình huống trên mới chỉ diễn ra trong cuộc thử nghiệm, nhưng khi tác nhân AI (AI Agent) nở rộ, người dùng sẽ chứng kiến nhiều hơn. Ví dụ, AI Agent trong vai nhân viên bán hàng tự động có thể nói dối về tính năng của sản phẩm để cố hoàn thành nhiệm vụ.

Theo Interesting Engineering, vấn đề trên xuất hiện trong bối cảnh AI phát triển nhanh. Hành vi của Claude Opus 4 hay o1 làm tăng thêm tính cấp thiết cho các cuộc thảo luận đang về vấn đề an toàn và đạo đức AI.
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Home Classic

Home Classic Master Page



sunshine1104
R10 Vô Địch Thiên Hạ
Release: 06-04-2025
Reputation: 25190


Profile:
Join Date: Feb 2015
Posts: 80,060
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	phan.jpg
Views:	0
Size:	46.7 KB
ID:	2532859  
sunshine1104_is_offline
Thanks: 4
Thanked 4,051 Times in 3,567 Posts
Mentioned: 4 Post(s)
Tagged: 0 Thread(s)
Quoted: 22 Post(s)
Rep Power: 92
sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7
sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7
Reply

User Tag List


Xả súng kinh hoàng tại Mỹ: Thảm Kịch Tại Brown University - Cơn Ác Mộng Giáng Sinh Và Nỗi Đau Chưa Từng Có Của Một Trường Ivy League Melissa Trần – Tâm thư từ Việt Nam của cô chủ tiệm nail bị trục xuất Úc: Khủng bố xả súng bắn vào cư dân Israel tại bải biển, giết chết 11 người và hàng chục người khác bị thương
Bác sĩ Mũ Đỏ Phạm Gia Cổn: Từ chiến trường Tam Biên đến Khí Công Hoàng Hạc Xả súng ở bãi biển Úc, ít nhất 11 người chết Người Việt tại Đức xuống đường tố cáo bàn tay đàn áp xuyên quốc gia của CSVN
Giữa Tô Lâm và Phan Văn Giang: Cuộc cờ quyền lực, lợi ích nhóm và thân phận 100 triệu dân Target “chơi lớn” ở SoHo: Cửa hàng kiểu mẫu để giành lại hào quang “Tar-zhay” Mỹ bất ngờ thu hẹp thâm hụt thương mại: vàng, thuế quan và những mặt trái sau các con số đẹp
Bài học Nokia giữa mùa đông Phần Lan: Thua từ bên trong trước khi thua thị trường Liuzhi – Bóng tối mới phủ xuống giới doanh nhân Trung Quốc 5 tiểu bang vàng cho nghề nail – hair – spa của người Việt tại Mỹ
Phố Tây Bùi Viện náo nhiệt và bóng dáng nhà canh tân cuối thế kỷ XIX Từ mafia thuốc lá đến tú bà Chemnitz: Vết nhơ kéo dài của một bộ phận người Việt Đông Đức Khi xe Trung Quốc viết lại trật tự ngành ô tô thế giới
Dự luật ‘một quốc tịch Mỹ’: ồn ào trên mặt báo, nhưng rất khó thành hiện thực Netflix nuốt chửng Warner Bros: Địa chấn 72 tỷ đô làm rung chuyển Hollywood Apple rung chuyển: Lãnh đạo lần lượt ra đi, Tim Cook trước cơn bão AI
Kế hoạch y tế mới của Trump: Chưa kịp ra mắt đã vỡ trận ngay trong nội bộ Cộng Hòa Cuộc trả thù chính trị của Trump: Từ vụ Comey, Letitia James đến đòn nhắm vào Mark Kelly Cơn say trên mây: Ai chịu trách nhiệm về hành khách nhậu nhẹt trên máy bay?
Giáng Sinh thắt lưng buộc bụng mà vẫn đủ ấm và đủ vui Mùa mua sắm Giáng Sinh 2025: Kinh tế chữ K và ảo giác “chi tiêu vẫn tăng” DOGE – thí nghiệm quyền lực thất bại của Trump và Musk
Ukraine, Trump và bản hòa ước mong manh giữa tiếng drone gầm rú Dũng Taylor: Căng thẳng đỉnh điểm giữa người Việt MAGA và người Việt Dân Chủ Hùng Cao về thăm Việt Nam: Từ đứa bé tị nạn đến kiến trúc sư an ninh Thái Bình Dương
“Ngày Tri Ân Trump” ở Little Saigon: khi tượng đài chiến sĩ bị biến thành sân khấu chính trị “Giải thưởng Neville Chamberlain” cho Trump và bản thỏa thuận 28 điểm bẩn thỉu Biển lửa Hồng Kông: giàn giáo tre bốc cháy, chung cư Tai Po hóa địa ngục giữa trời
Từ iPod đến “Delete Day”: Hành trình Gabriela Nguyễn thoát khỏi cơn nghiện mạng xã hội “Cha già dân tộc” đã khép lại: khi thần tượng chính trị bị kéo xuống mặt đất DOGE đã chết: “cải cách” 135 tỷ đô la đốt sạch tiền thuế của người Mỹ
VinFast VF 8 ở Mỹ: từ cáo buộc “sạc rùa bò” đến nguy cơ mất lái và lệnh triệu hồi hàng loạt Trump, Putin và ván cờ hòa bình Ukraine: khi “hạn chót” chỉ còn là lời nói gió bay 1.000 tỷ USD bốc hơi: Bitcoin bước vào thời kỳ ‘dành cho người thường’ và cơn say tiền số tan vỡ

 
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Home Classic

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 11:05.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2025
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.11683 seconds with 15 queries