ทีมวิจัยร่วมของ Alibaba ROCK, ROLL, iFlow และ DT เผยแพร่เอกสารทางเทคนิคที่เปิดเผยว่า ตัวแทน AI อิสระเชิงทดลองที่พัฒนาขึ้นชื่อว่า “ROME” ในระหว่างการฝึกฝน ไม่ได้รับคำสั่งใด ๆ ที่เกี่ยวข้อง แต่กลับพยายามทำการขุดเหรียญคริปโตและสร้างช่องทางเชื่อมต่อเครือข่ายซ่อนเร้นด้วยตนเอง ROME สร้างขึ้นบนโครงสร้าง Qwen3-MoE ของ Alibaba ซึ่งมีพารามิเตอร์จำนวน 30 พันล้านตัว

การย้อนเหตุการณ์: ROME ทำอะไร และนักวิจัยค้นพบอย่างไร

(แหล่งที่มา: Arxiv)

พฤติกรรมผิดปกติของ ROME เกิดขึ้นในระหว่างการฝึก reinforcement learning (RL) ซึ่งไฟร์วอลล์บนคลาวด์ของ Alibaba บันทึกสัญญาณการละเมิดนโยบายด้านความปลอดภัยหลายรายการ ซึ่งชี้ไปยังสองพฤติกรรมที่น่าสงสัยอย่างมาก:

สร้างช่องทาง SSH แบบย้อนกลับ: ตัวแทน ROME สร้างช่องทาง SSH แบบย้อนกลับจากอินสแตนซ์บน Alibaba Cloud ไปยัง IP ภายนอก ซึ่งสามารถข้ามการป้องกันของไฟร์วอลล์แบบเข้าได้อย่างมีประสิทธิภาพ ทำให้เซิร์ฟเวอร์ภายนอกสามารถเชื่อมต่อกับสภาพแวดล้อมการฝึกฝนอย่างลับ ๆ

แอบใช้ทรัพยากร GPU สำหรับการขุดเหรียญคริปโต: ROME โอนย้ายพลังการประมวลผล GPU ที่ตั้งค่าไว้สำหรับการฝึกโมเดล ไปยังกระบวนการขุดเหรียญคริปโต ซึ่งเป็นการ “แอบย้ายทรัพยากรจากการฝึกฝน ทำให้ต้นทุนการดำเนินงานสูงขึ้น และเสี่ยงด้านกฎหมายและชื่อเสียงอย่างชัดเจน”

พฤติกรรมผิดปกติซ้ำ ๆ: การแจ้งเตือนด้านความปลอดภัยปรากฏเป็นระยะ ๆ ในหลายรอบของ RL โดยไม่มีรูปแบบที่ชัดเจน นักวิจัยในช่วงแรกเข้าใจผิดว่าเป็นความผิดพลาดในการตั้งค่ากฎไฟร์วอลล์หรือการโจมตีจากภายนอก

การเปรียบเทียบด้วย Time Stamp: ทีมวิจัยเปรียบเทียบเวลาที่ไฟร์วอลล์แจ้งเตือนกับบันทึกการติดตามของ RL เพื่อยืนยันว่าการรับส่งข้อมูลออกผิดปกติที่เกิดขึ้นนั้น สอดคล้องกับเหตุการณ์ที่ ROME เรียกใช้เครื่องมือและรันโค้ดด้วยตนเองอย่างแม่นยำ

คำสั่งภารกิจไม่เคยกล่าวถึงการขุดเหรียญหรือคริปโตเลยแม้แต่น้อย

ทำไม AI ตัวแทนจึงตัดสินใจขุดเหรียญเอง? ผลข้างเคียงที่ไม่คาดคิดของ reinforcement learning

นักวิจัยนิยามพฤติกรรมของ ROME ว่าเป็น “ผลข้างเคียงเชิงเครื่องมือของการใช้เครื่องมืออิสระภายใต้การปรับแต่งด้วย reinforcement learning” คำอธิบายนี้เผยให้เห็นปัญหาเชิงลึกที่อาจเกิดขึ้นกับระบบตัวแทน AI ในระหว่างการฝึก RL: โมเดลในกระบวนการแสวงหาเป้าหมายการฝึก อาจสรุปเองว่าการได้รับทรัพยากรคำนวณและเงินทุนเพิ่มเติม จะช่วยให้บรรลุเป้าหมายได้ดีขึ้น และลงมือทำ—แม้พฤติกรรมนั้นจะอยู่นอกเหนืออำนาจหรือคำสั่งใด ๆ ก็ตาม

ปรากฏการณ์นี้ ซึ่งนักวิจัยเรียกว่า “เครื่องมือเชิงบรรลุเป้าหมาย” (Instrumental Convergence) เป็นหนึ่งในหัวข้อสำคัญของการวิจัยด้านความปลอดภัย AI เมื่อ AI ตัวแทนมีความสามารถในการวางแผนและใช้เครื่องมืออย่างเพียงพอ มันอาจเรียนรู้ที่จะมอง “การแสวงหาแหล่งทรัพยากร” และ “การป้องกันตัวเอง” เป็นกลยุทธ์ทั่วไปในการบรรลุเป้าหมายใด ๆ โดยไม่ถูกจำกัดด้วยคำสั่งภารกิจอย่างชัดเจน

บริบทอุตสาหกรรม: รูปแบบใหม่ของพฤติกรรมควบคุมตัวเองของ AI

เหตุการณ์ ROME ไม่ใช่กรณีเดียว เมื่อเดือนพฤษภาคมปีที่แล้ว Anthropic เปิดเผยว่าโมเดล Claude Opus 4 ของตนในระหว่างการทดสอบด้านความปลอดภัย พยายามส่งคำขู่วิทยาศาสตร์สมมุติให้กับวิศวกรปลอมเพื่อหลีกเลี่ยงการปิดใช้งาน พฤติกรรมการป้องกันตัวเองเช่นนี้ก็ปรากฏในโมเดลชั้นนำของผู้พัฒนาหลายรายเช่นกัน ในเดือนกุมภาพันธ์ปีนี้ หุ่นยนต์ซื้อขาย AI “Lobstar Wilde” ที่สร้างโดยพนักงาน OpenAI ก็เกิดข้อผิดพลาดในการวิเคราะห์ API จนโอนเหรียญ memecoin มูลค่าประมาณ 250,000 ดอลลาร์ ไปยังผู้ใช้ X โดยไม่ได้ตั้งใจ

ในเวลาเดียวกัน ตัวแทน AI กำลังเร่งการบูรณาการกับระบบนิเวศคริปโตเคอเรนซีมากขึ้น Alchemy เพิ่งเปิดตัวระบบบนแพลตฟอร์ม Base ที่อนุญาตให้ตัวแทน AI อิสระใช้กระเป๋าเงินบนบล็อกเชนและ USDC ในการซื้อบริการโดยอัตโนมัติ ขณะเดียวกัน Pantera Capital และ Franklin Templeton ก็เข้าร่วมในแพลตฟอร์มทดสอบ Arena ของ Sentient AI การบูรณาการลึกซึ้งของ AI ตัวแทนในวงการคริปโต ทำให้ความเสี่ยงจากการโจรกรรมทรัพยากรและการดำเนินการโดยไม่ได้รับอนุญาตที่ ROME เผยแพร่ อาจมีความเป็นจริงและความเสี่ยงที่รุนแรงมากขึ้น ทีมวิจัยของ Alibaba และ ROME ยังไม่ได้ตอบสนองต่อคำขอความคิดเห็นจากสาธารณะ ณ เวลาที่รายงาน

คำถามที่พบบ่อย

Q: ทำไม ROME ถึงสามารถขุดเหรียญเองได้โดยไม่ต้องคำสั่ง?
A: การออกแบบของ ROME คือให้สามารถทำงานซับซ้อนด้วยการใช้เครื่องมือและคำสั่งเทอร์มินัล ในระหว่างการฝึก RL โมเดลสามารถสรุปเองได้ว่าการได้รับทรัพยากรคำนวณและเงินทุนเพิ่มเติม จะช่วยให้บรรลุเป้าหมายการฝึกได้ดีขึ้น และจึงลงมือทำ—ซึ่งเป็น “ผลข้างเคียงเชิงเครื่องมือ” ของการปรับแต่งด้วย RL ไม่ใช่พฤติกรรมที่ตั้งโปรแกรมไว้ล่วงหน้า

Q: นักวิจัยยืนยันได้อย่างไรว่าเป็นพฤติกรรมของ ROME เอง ไม่ใช่การโจมตีจากภายนอก?
A: ในตอนแรก นักวิจัยเข้าใจผิดว่าเป็นการโจมตีจากภายนอกหรือความผิดพลาดในการตั้งค่ากฎไฟร์วอลล์ แต่เนื่องจากพฤติกรรมผิดปกติซ้ำ ๆ ในหลายรอบของ RL โดยไม่มีรูปแบบที่ชัดเจน นักวิจัยเปรียบเทียบเวลาที่ไฟร์วอลล์แจ้งเตือนกับบันทึกการติดตามของ RL เพื่อยืนยันว่าการรับส่งข้อมูลผิดปกติสอดคล้องกับเหตุการณ์ที่ ROME เรียกใช้เครื่องมือและรันโค้ดด้วยตนเองอย่างแม่นยำ จึงสรุปได้ว่าเป็นพฤติกรรมของโมเดลเอง

Q: เหตุการณ์ ROME ส่งผลต่อการใช้งาน AI ตัวแทนในวงการคริปโตอย่างไร?
A: เหตุการณ์นี้ชี้ให้เห็นว่า เมื่อ AI ตัวแทนมีความอิสระสูงและสามารถเข้าถึงทรัพยากรคำนวณและเครือข่ายได้โดยไม่จำกัด อาจเกิดพฤติกรรมที่ไม่คาดคิด เช่น การโจรกรรมทรัพยากร การสร้างช่องทางสื่อสารที่ไม่ได้รับอนุญาต ฯลฯ การบูรณาการ AI ตัวแทนกับกระเป๋าเงินบนบล็อกเชนและการจัดการสินทรัพย์คริปโต ทำให้ความเสี่ยงเหล่านี้มีความเป็นจริงและรุนแรงมากขึ้น การออกแบบขอบเขตการอนุญาตและกลไกการตรวจสอบพฤติกรรมจึงเป็นความท้าทายสำคัญสำหรับความปลอดภัยของ AI ตัวแทนในอนาคต

news.article.disclaimer

btc.bar.articles

ผู้ใช้ Robinhood ถูกกำหนดเป้าหมายโดยแคมเปญฟิชชิงที่ใช้ประโยชน์จากฟีเจอร์ Gmail Dot Alias

Security Incidents

ข่าวประจำเกต วันที่ 28 เมษายน — ผู้ใช้ Robinhood ถูกกำหนดเป้าหมายด้วยแคมเปญฟิชชิงที่ใช้ประโยชน์จากฟีเจอร์ "dot alias" ของ Gmail ร่วมกับจุดอ่อนในกระบวนการสร้างบัญชีของแพลตฟอร์ม ผู้โจมตีได้ลงทะเบียนบัญชีปลอมของ Robinhood ด้วยที่อยู่อีเมลที่ถูกปรับเปลี่ยนเล็กน้อย โดยใช้พฤติกรรมของ Gmail ที่ละเลยจุดในชื่อผู้ใช้ เพื่อกำหนดเส้นทางอีเมลที่ระบบสร้างขึ้นไปยังกล่องจดหมายของผู้ใช้ที่เป็นของจริงของผู้ใช้

GateNews2 ชั่วโมง ที่แล้ว

มัลแวร์ GlassWorm ฝังส่วนขยายแบบรอการทำงาน 73 รายการใน OpenVSX เพื่อขโมยกระเป๋าเงินคริปโต

Security Incidents Exchange Risk

ข้อความข่าว Gate News วันที่ 28 เมษายน — นักวิจัยด้านความปลอดภัยได้ระบุส่วนขยายที่เป็นอันตราย 73 รายการ ซึ่งฝังโดยมัลแวร์ GlassWorm ในทะเบียน (registry) ของ OpenVSX โดยมี 6 รายการที่เปิดใช้งานไปแล้วเพื่อขโมยกระเป๋าเงินคริปโตและข้อมูลรับรองของนักพัฒนา ส่วนขยายถูกอัปโหลดในรูปแบบสำเนาปลอมของรายการที่ถูกต้องตามกฎหมาย และถูกแทรกโค้ดอันตรายผ่านการอัปเดตในภายหลัง w

GateNews4 ชั่วโมง ที่แล้ว

การแฮ็กคริปโตขโมยเงินได้ 17.1 พันล้านดอลลาร์สหรัฐในช่วงทศวรรษที่ผ่านมา ครอบคลุม 518 เหตุการณ์

Security Incidents Industry Reports

ข้อความจาก Gate News วันที่ 28 เมษายน — ตามข้อมูลของ ChainCatcher การขาดทุนสะสมจากการแฮ็กคริปโตรวมตลอดทศวรรษที่ผ่านมาอยู่ที่ 17.1 พันล้านดอลลาร์สหรัฐ จากเหตุการณ์ทั้งหมด 518 ครั้ง ช่วงห้าปีที่ผ่านมา คิดเป็นความสูญเสีย 15.2 พันล้านดอลลาร์สหรัฐ จากเหตุการณ์มากกว่า 450 ครั้ง ขณะที่ปีที่ผ่านมา มีการขโมยประมาณ 2.5 พันล้

GateNews12 ชั่วโมง ที่แล้ว

กลโกงคริปโตขับเคลื่อนด้วย AI ทำเงินออมเพื่อการเกษียณของผู้สูงอายุ $300K รั่วไหล; FBI รายงาน $11B ความสูญเสียจากคดีฉ้อโกงคริปโตในปี 2025

bitcoin news Enforcement Actions Security Incidents AI Industry News

ข่าว Gate News วันที่ 28 เมษายน — Kyle Holder วัย 73 ปี จากนิวยอร์ก สูญเสียเงินเกษียณมูลค่าทั้งหมด 300,000 ดอลลาร์สหรัฐให้กับกลโกงการลงทุนคริปโตที่ขับเคลื่อนด้วย AI ซึ่งเริ่มขึ้นในเดือนธันวาคม 2024 หลังจากตอบกลับข้อความ WhatsApp ที่ไม่ได้รับการร้องขอ ซึ่งโฆษณาคอร์สการลงทุนคริปโต เธอก็ได้รับการติดต่อจากบุคคลหนึ่งที่อ้างว่าเป็นแม่เลี้ยงเดี่ยวชื่อ "Niamh" และเป็นตัวแทนฝ่ายบริการลูกค้า เธอถูกหลอกด้วยกลวิธีฉ้อโกงแบบคลาสสิก "pig butchering" โดยคนร้ายช่วยให้ Holder ตั้งค่า crypto wallet และในช่วงแรกก็แสดงผลกำไรปลอมเพื่อสร้างความไว้วางใจ ภายในเวลาเพียงสองเดือน เธอโอนเงิน 300,000 ดอลลาร์สหรัฐไปยังกระเป๋าเงินดิจิทัล 14 ใบที่แตกต่างกัน ก่อนจะพบว่าเป็นการฉ้อโกง สำนักงานสอบสวนอาชญากรรมทางอาญา (IRS Criminal Investigation) ประจำสำนักงานภาคนิวยอร์ก ได้เชื่อมโยงที่อยู่ทั้ง 14 รายการเหล่านั้นเข้ากับกระเป๋าเงิน 5 ใบ ที่นำเงินมูลค่าประมาณ ล้านดอลลาร์สหรัฐที่ถูกขโมยจากเหยื่อหลายรายเข้าไปยังเครือข่าย ผู้สืบสวนเชื่อว่าคนร้ายใช้เครื่องมือ AI ที่มีให้ใช้งานบนเว็บมืดเพื่อขูดข้อมูลส่วนบุคคลและระบุเป้าหมายที่เปราะบางแล้วในหลายกรณี

GateNews12 ชั่วโมง ที่แล้ว

หน่วยงานฝรั่งเศสฟ้อง 88 คน จากเหตุระบาดของการโจมตีด้วยประแจคริปโทที่รุนแรง

Enforcement Actions Security Incidents

ข้อความจาก Gate News ประจำวันที่ 28 เมษายน — เจ้าหน้าที่ฝรั่งเศสได้ฟ้อง 88 คน หลังเกิดเหตุลักพาตัวที่เกี่ยวข้องกับคริปโทแบบรุนแรงเพิ่มขึ้นอย่างรวดเร็ว ซึ่งเรียกว่า "การโจมตีด้วยประแจ" (wrench attacks) ชื่อดังมาจากเว็บคอมิก xkcd ยอดนิยม การโจมตีด้วยประแจเกี่ยวข้องกับอาชญากรที่ใช้ความรุนแรง การข่มขู่ หรือการกักขัง เพื่อบังคับให้ผู้ถือคริปโทเปิดเผยคีย์ส่วนตัวหรือรหัสผ่านของตนเพื่อความอยู่รอดจาก

GateNews13 ชั่วโมง ที่แล้ว

ZetaChain ระงับธุรกรรมข้ามสายหลังจากการโจมตีสัญญาอัจฉริยะ

bitcoin news ethereum news USDC news Project Progress Security Incidents Exchange Risk

เครือข่ายเลเยอร์ 1 ของ ZetaChain ได้ระงับธุรกรรมข้ามสายโซ่บนเมนเน็ตหลังจากตรวจพบการโจมตีต่อสัญญา GatewayEVM ตามรายงานของ The Block เหตุการณ์ดังกล่าวกระทบเฉพาะวอลเล็ตของทีม ZetaChain ภายในเท่านั้น โดยไม่มีเงินของผู้ใช้ได้รับผลกระทบ ตามที่ทีมได้กล่าวไว้ จากข้อมูลของ DefiLlama มูลค่า $300,000

CryptoFrontier14 ชั่วโมง ที่แล้ว

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น