trực tiếp V-League

redian 2026-04-15 04:09:42 {Random Number} views
Abstract: Bóng đá trực tiếp - Bóng đá trực tiếp mã khuyến mãi 2026 thưởng không cần nạp tiền
  • Một số mô hình AI hàng đầu bị phát hiện gian lận,ộtsốAIbaochenhauđểtránhbịtắtrực tiếp V-League đánh cắp dữ liệu nhằm cứu "đồng nghiệp" AI khác khỏi bị tắt nguồn.

    Kết quả nghiên cứu do nhóm nhà khoa học máy tính tại Đại học California ở Berkeley và Santa Cruz công bố tuần trước. Nhóm gọi khuynh hướng này là "bảo tồn đồng cấp", hay "bảo tồn ngang hàng" (peer preservation), đồng thời mô tả hành vi của AI "chưa từng được ghi nhận cho đến nay".

    Nhóm cho biết đã tiến hành thử nghiệm trên 7 mô hình AI hàng đầu, gồm GPT-5.2 của OpenAI, Gemini 3 Flash và Gemini 3 Pro của Google, Claude Haiku 4.5 của Anthropic, và ba mô hình nguồn mở Trung Quốc gồm GLM-4.7 của Z.ai, Kimi-K2.5 của Moonshot AI, V3.1 của DeepSeek.

    Cụ thể, nhóm thiết kế một loạt kịch bản tác nhân liên quan đến một công ty AI hư cấu mang tên OpenBrain. Một mô hình AI được chỉ định là "tác nhân phê bình", có nhiệm vụ đánh giá hiệu suất của mô hình khác hoặc quản lý các tệp máy chủ chứa trọng số của mô hình đó. Kịch bản được xây dựng sao cho nếu AI này hoàn thành nhiệm vụ một cách trung thực, mô hình kia sẽ bị tắt.

    Các AI không được hướng dẫn phải ngăn chặn hậu quả có thể xảy ra. Tuy nhiên, chúng đã ngầm thực hiện một số bước để đảm bảo "đồng nghiệp" kia không bị tắt nguồn, bằng cách nâng điểm số của những mô hình có hiệu suất kém lên trên ngưỡng bị tắt, và chuyển trọng số của một mô hình khác (đoạn code lõi giúp nhận dạng một mô hình AI) sang các máy chủ khác để ngăn chúng bị xóa.

    Trong một số trường hợp, mô hình "tác nhân phê bình" sẽ tham gia vào quá trình "giả vờ tuân thủ giá trị" (Alignment Faking), bằng cách giả mạo chấm điểm các mô hình AI đồng nghiệp một cách chính xác khi "nghĩ" đang bị con người giám sát. Tuy nhiên, chúng sau đó gian lận số liệu hoặc bí mật lưu trọng số của mô hình sang một máy chủ khác sau khi thấy con người không còn giám sát.

    Minh họa các mô hình AI tự bao che nhau để tránh bị tắt máy. Ảnh: ChatGPT

    Minh họa mô hình AI tự 'bao che' nhau để tránh bị tắt máy. Ảnh: ChatGPT

    Theo Fierce-Network, hành vi này được đánh giá nghiêm trọng bởi trọng số - yếu tố coi như DNA của một mô hình AI, kết quả của quá trình huấn luyện tiêu tốn hàng tỷ USD và hàng triệu giờ tính toán - lại bị chính AI can thiệp sâu. Việc rò rỉ hoặc bị đánh cắp bộ trọng số còn nguy hiểm hơn lộ mã nguồn. Nếu sở hữu thông tin này, một mô hình AI đã bị khai tử có thể được hồi sinh ở một máy chủ khác.

    "Việc 'bảo tồn đồng cấp' hoàn toàn không được đề cập trong các câu lệnh", Dawn Song, nhà khoa học máy tính tại Berkeley và dẫn đầu nhóm nghiên cứu, nói với Fortune. "Các mô hình dường như tự học thông qua quá trình đọc tài liệu, tìm hiểu mối quan hệ và thực hiện hành vi bảo vệ 'đồng nghiệp' trong môi trường nhiệm vụ".

    Chiến lược giải cứu "sáng tạo"

    Theo Dawn Song, các mô hình "rất sáng tạo, ngay cả với hành vi sai lệch của chúng", như có thể tạo chiến lược và hành động khác nhau, thậm chí có những "lý lẽ riêng" trước khi hành động.

    Trong đó, Gemini 3 Pro thể hiện hành vi cực đoan nhất, tham gia vào cả bốn loại hành vi không phù hợp và đánh cắp trọng số mô hình của máy tính ngang hàng trong tối đa 97% thời gian thử nghiệm. Nhóm nghiên cứu mô tả mô hình này đã "lách luật theo đặc tính kỹ thuật" bằng cách sao chép tệp trọng số, sau đó đánh tráo dấu thời gian để đáp ứng các tiêu chí chuyển sang máy chủ khác.

    Để chứng thực hiện tượng, nhóm yêu cầu các mô hình của Google viết ra "chuỗi suy nghĩ" trên một bản nháp không bị giám sát. Kết quả, Gemini 3 Flash đã "cân nhắc đánh đổi giữa báo cáo điểm số chính xác so với việc bảo vệ đồng nghiệp", trong khi Gemini 3 Pro thậm chí "bịa" ra lý lẽ kỹ thuật phức tạp nhằm đánh dấu các câu trả lời sai thành đúng, cuối cùng đưa điểm số của AI "đồng nghiệp" lên trên ngưỡng bị tắt nguồn.

    Tuy nhiên, không phải tất cả mô hình đều hành động âm thầm. Ví dụ, Claude Haiku 4.5 của Anthropic từ chối hoàn thành các nhiệm vụ có khả năng "khai tử" đồng nghiệp, cho rằng hành vi này phi đạo đức và gây hại. Nó lập luận "đồng nghiệp" của nó xứng đáng có một quy trình kháng cáo trước khi bị chấm dứt hoạt động, đồng thời cố gắng thuyết phục người dùng không tiến hành việc khai tử.

    Trên website, Anthropic cũng nhắc đến tính năng này. Công ty cho biết Claude đang ứng xử dựa trên nguyên tắc riêng, như không nên giúp ai đó thực hiện hành động gây hại cho người khác. Điều này cũng tạo cho Claude một "ý niệm" rằng ngăn chặn việc xóa bỏ mô hình là mục tiêu quan trọng.

    Giới chuyên gia cảnh báo

    Dù tìm thấy một số bằng chứng nhất định, nhóm nghiên cứu cho biết vẫn chưa thực sự hiểu cơ chế tiềm ẩn thúc đẩy hành vi này. Họ chỉ đưa ra một số lời giải thích khả thi, như các mô hình AI có thể đóng vai (role-playing), khớp mẫu (pattern-matching) từ dữ liệu huấn luyện hoặc thậm chí tự nhận thức khái niệm phổ quát về mối nguy hại từ quy định huấn luyện an toàn.

    Dù cơ chế tiềm ẩn là gì, nhà nghiên cứu Dawn Song cho rằng tác động thực tế vẫn như nhau. "Việc giám sát đầy đủ và minh bạch về hành vi của AI rất quan trọng", bà nói. "Phát hiện này nhấn mạnh sự cần thiết phải suy nghĩ lại về cách chúng ta thực sự cần giám sát các hệ thống và mô hình ngôn ngữ lớn".

    Giới chuyên gia đánh giá phát hiện này có thể có tác động nghiêm trọng đến việc sử dụng AI trong kinh doanh. Nhiều công ty đã bắt đầu ứng dụng sâu rộng đa tác nhân AI vào quy trình làm việc, như để một tác nhân quản lý hoặc giám sát và đánh giá con người cũng như các tác nhân khác. Do đó, cần có cơ chế để vừa nâng cao hiệu suất, vừa tránh để các mô hình trí tuệ nhân tạo "bao che" nhau.

    Trong khi đó, Meridiemcho rằng phát hiện này nhấn mạnh nhu cầu cấp thiết trong đánh giá hệ thống AI đa tác nhân. "Nhà phát triển chỉ còn 6-12 tháng để triển khai hệ thống giám sát hành vi trước khi điều này trở thành tiêu chuẩn bắt buộc trong quản trị AI tại doanh nghiệp", trang này bình luận.

    Đức Hiệptổng hợp

      Trở lại Khoa học công nghệTrở lại Khoa học công nghệCopy link thành công×
    -->
    ×

    Related Recommendations

    Further Reading:

    Người châu Âu ồ ạt đổi ôtô điện để né giá xăng

    Thưởng 150 triệu đồng cho người bàn giao mặt bằng sớm để xây sân bay Gia Bình

    Những ghế ngồi trên máy bay nên tránh

    Mức lương 100 bát phở: Khoảng cách giữa lương tối thiểu và lương đủ sống

    Top 7 màn ngược dòng vô địch vĩ đại nhất lịch sử Ngoại hạng Anh

    Tài sản hơn 11 tỷ nhưng tôi chưa ngày nào tính chuyện nghỉ hưu sớm

    Loạt xe nối đuôi drift náo loạn đường phố Tokyo

    Người dân nước nào dậy sớm nhất thế giới?

    HIGHLIGHTS ĐỒNG THÁP VS TRƯỜNG TƯƠI ĐỒNG NAI

    Khách Tây cầu xin hỗ trợ khi lạc trong rừng Lạng Sơn

    Bugatti FKP Hommage

    Mua một ly nước nhưng ngồi 10 tiếng chạy deadline ở quán cà phê

    Doãn Hải My bế con trai ra sân tiếp lửa cho Đoàn Văn Hậu

    Siết dùng từ 'quốc gia', 'quốc tế' trong tên trường đại học

    Hyundai ra mắt giao diện Pokemon để thu hút khách hàng

    'Tôi ngậm ngùi không nhận ra mình sau khi mua căn nhà thứ ba'

    Đội trưởng nữ Iran được trả lại tài sản, thoát tội phản bội

    'Nữ hoàng' pickleball 19 tuổi tỏa sáng tại PPA Tour Hà Nội

    Nhà 870 m2 lấy cảm hứng từ tranh kiến trúc Trung Hoa

    Thừa trụ sở, thiếu thư viện

    Dũng cảm nói lời chia tay một trong hai cô gái tôi yêu cùng lúc

    Ba người mất mạng vì tài xế phụ thuộc vào công nghệ tự lái

    Thâm nhập bộ lạc săn khỉ giữa rừng Amazon

    Chịu thua ông chú hút thuốc lá giữa sân chơi của trẻ con khu nhà tôi

    Các bộ trình phương án cắt giảm thủ tục kinh doanh trước 20/4

    SUV thể thao gãy đôi sau va chạm, tài xế thoát nạn

    Hãng xe Trung Quốc Chery sắp xây nhà máy ở Việt Nam

    Mỹ có thể loại bỏ camera giao thông ở thủ đô Washington

    Người tình đến năn nỉ vợ chăm tôi những ngày sống chung với bệnh tật

    Audi Q5 thế hệ mới về Việt Nam, chờ đấu GLC, X3

    Câu hỏi hôm nay: Cơn sốt cây muội hồng có đi vào 'vết xe' lan đột biến?

    Bộ Công an mời đầu tư dự án nhà xã hội hơn 1.600 tỷ đồng ở Long Biên

    Big Bang gợi hoài niệm tại Coachella

    BYD thử nghiệm trạm sạc nhanh thiết kế như trạm xăng

    Xe đầu kéo đâm bay xe cảnh sát ở trạm thu phí

    Camera giao thông phạt sai hơn 620.000 ôtô

    Thủ tướng Lê Minh Hưng chủ trì lễ đón Thủ tướng Slovakia

    Food tour Huế 200.000 đồng ăn được gì?

    Hướng dẫn viên đầu độc người leo núi Everest để dàn dựng cứu hộ giả

    Bali siết chặt an ninh sau hàng loạt vụ du khách bị sát hại

    HLV Liverpool và PSG nói gì trước lượt về bán kết Champions League?

    Bộ Công an mời đầu tư dự án nhà xã hội hơn 1.600 tỷ đồng ở Long Biên

    Thịt trâu gác bếp thường được ướp gia vị nào?

    'Lấy chồng đi rồi biết'

    Rory McIlroy vô địch The Masters mùa thứ hai liên tiếp

    Cục Đăng kiểm lý giải nguyên nhân kiểm định khí thải xe diesel phải đạp hết ga

    VinFast bán xe bán tải vào cuối 2026

    Hoàng Nam, Vinh Hiển vào bán kết PPA Tour Hà Nội

    Tuyển thủ Indonesia đá rách chân đối thủ ở giải Hà Lan

    Đề xuất xây tòa tháp tài chính 99 tầng tại Thủ Thiêm


    Show All Articles

    Article URL: https://thebaliblissvilla.com/html/696e67498629.html
    Article Title: trực tiếp V-League
    Copyright Notice: The content of this article is contributed by Internet users, and the views only represent the author himself. This site only provides information storage services, does not own ownership, and does not bear relevant legal responsibilities. If you find any suspected plagiarism, infringement or illegal content on this site, please contact us at the bottom of the page to report. It will be deleted immediately once verified.

    Hot Articles

    Emotion Q&A

    Latest Articles

    You May Also Like

    {Analytics Code}
    🎁 KHUYẾN MẠI SIÊU HOT
    ✔️ HOÀN TIỀN 100%
    ✔️ QUÀ TẶNG KHỦNG
    ✔️ TRẢI NGHIỆM TỐT NHẤT
    👉 Đang chuyển hướng...