ส่งต่อชื่อเดิม: AI Agent Framework เป็นชิ้นส่วนสุดท้ายของปริศนาหรือไม่? จะตีความ "ความเป็นคู่ของอนุภาคคลื่น" ของเฟรมเวิร์กได้อย่างไร?
เฟรมเวิร์ก AI Agent ซึ่งเป็นส่วนสําคัญของการพัฒนาอุตสาหกรรมอาจมีศักยภาพสองประการในการขับเคลื่อนทั้งการนําเทคโนโลยีไปใช้และการเติบโตของระบบนิเวศ เฟรมเวิร์กที่กล่าวถึงมากที่สุดในตลาด ได้แก่ Eliza, Rig, Swarms และ ZerePy เฟรมเวิร์กเหล่านี้ดึงดูดนักพัฒนาผ่านที่เก็บ GitHub สร้างชื่อเสียง ผ่านการออกโทเค็นผ่าน "ห้องสมุด" กรอบเหล่านี้เช่นแสงรวบรวมทั้งคลื่นและลักษณะคล้ายอนุภาค ในทํานองเดียวกันเฟรมเวิร์กของตัวแทนมีทั้งภายนอกที่ร้ายแรงและลักษณะ Memecoin บทความนี้จะมุ่งเน้นไปที่การตีความ "ความเป็นคู่ของอนุภาคคลื่น" ของเฟรมเวิร์กเหล่านี้และสํารวจว่าทําไมเฟรมเวิร์ก Agent จึงสามารถเป็นชิ้นสุดท้ายในปริศนาได้
นับตั้งแต่การเกิดขึ้นของ GOAT การเล่าเรื่องของ Agent ได้รับความสนใจจากตลาดเพิ่มขึ้นคล้ายกับปรมาจารย์ด้านศิลปะการต่อสู้ที่ระเบิดพลังด้วยกําปั้นซ้ายที่เป็นตัวแทนของ "Memecoin" และฝ่ามือขวาที่รวบรวม "ความหวังของอุตสาหกรรม" คุณอาจพ่ายแพ้ต่อการเคลื่อนไหวอย่างใดอย่างหนึ่งเหล่านี้ ในความเป็นจริงสถานการณ์การใช้งานของ AI Agents ไม่ได้แตกต่างกันอย่างเคร่งครัดและขอบเขตระหว่างแพลตฟอร์มเฟรมเวิร์กและแอปพลิเคชันเฉพาะจะเบลอ อย่างไรก็ตามสิ่งเหล่านี้ยังสามารถจัดหมวดหมู่คร่าวๆตามการตั้งค่าโทเค็นหรือโปรโตคอล ขึ้นอยู่กับการตั้งค่าการพัฒนาของโทเค็นหรือโปรโตคอลโดยทั่วไปสามารถแบ่งออกเป็นหมวดหมู่ต่อไปนี้:
เมื่อพูดคุยเพิ่มเติมเกี่ยวกับเฟรมเวิร์กของตัวแทน จะเห็นได้ว่ามีผลกระทบที่สำคัญ ไม่เหมือนนักพัฒนาบนโซ่สาธารณะและโปรโตคอลที่ใหญ่ที่สุดที่สามารถเลือกใช้จากสภาพแวดล้อมภาษาโปรแกรมที่แตกต่างกันได้เท่านั้น ขนาดรวมของชุมชนนักพัฒนาในอุตสาหกรรมยังไม่แสดงอัตราการเติบโตที่สอดคล้องกันในทุนตลาด GitHub repositories เป็นที่ที่นักพัฒนา Web2 และ Web3 สร้างความเห็นสร้างสรรค์ การสร้างชุมชนนักพัฒนาที่นี่น่าสนใจและมีอิทธิพลกว่าการพัฒนาแพคเกจ “plug-and-play” ที่พัฒนาเป็นรายบุคคลโดยโปรโตคอลใดๆ
สี่เฟรมเวิร์กที่กล่าวถึงในบทความนี้เป็นโอเพ่นซอร์ซทั้งหมด:
ปัจจุบันโครงการ Eliza ได้รับการใช้งานอย่างแพร่หลายในแอปพลิเคชันต่าง ๆ ของเอเจนต์และเป็นเฟรมเวิร์กที่ใช้กันอย่างแพร่หลายที่สุด การพัฒนาของ ZerePy ไม่ได้ถึงขั้นที่สูงมากและทิศทางการพัฒนาของมันเน้นไปที่ X เท่านั้น ยังไม่รองรับ LLMs ภายในและหน่วยความจำที่ผสมเข้ากันได้ RIG มีความยากในการพัฒนาที่สูงที่สุด แต่มีความอิสระในการพัฒนาที่สูงที่สุดเพื่อให้ผู้พัฒนาสามารถปรับปรุงประสิทธิภาพได้ สำหรับ Swarms นอกจากทีมได้เปิดตัว mcs แล้วยังไม่มีการใช้งานอื่น ๆ อย่างไรก็ตาม Swarms สามารถผสมเข้ากับเฟรมเวิร์กต่าง ๆ ได้เพื่อให้มีศักย์ภาพมากขึ้น
นอกจากนี้ในการจําแนกประเภทดังกล่าวการแยกเอ็นจิ้น Agent และเฟรมเวิร์กอาจทําให้เกิดความสับสน แต่ผมเชื่อว่าทั้งสองมีความแตกต่างกัน ก่อนอื่นทําไมถึงเรียกว่าเครื่องยนต์? การเปรียบเทียบกับเครื่องมือค้นหาในชีวิตจริงค่อนข้างเหมาะสม ซึ่งแตกต่างจากแอปพลิเคชัน Agent ที่เป็นเนื้อเดียวกันประสิทธิภาพของเอ็นจิ้น Agent อยู่ในระดับที่สูงขึ้น แต่ถูกห่อหุ้มอย่างสมบูรณ์และการปรับเปลี่ยนจะทําผ่านอินเทอร์เฟซ API เช่นกล่องดํา ผู้ใช้สามารถสัมผัสกับประสิทธิภาพของเอ็นจิ้น Agent ได้โดยการปลอมแปลง แต่พวกเขาไม่สามารถควบคุมภาพเต็มหรืออิสระในการปรับแต่งได้เหมือนที่ทําได้ด้วยเฟรมเวิร์กพื้นฐาน เอ็นจิ้นของผู้ใช้แต่ละคนก็เหมือนกับการสร้างกระจกบน Agent ที่ผ่านการฝึกอบรมและโต้ตอบกับกระจกนั้น ในทางกลับกันเฟรมเวิร์กได้รับการออกแบบมาโดยพื้นฐานเพื่อปรับให้เข้ากับห่วงโซ่เนื่องจากเมื่อตัวแทนสร้างเฟรมเวิร์กตัวแทนเป้าหมายสูงสุดคือการรวมเข้ากับห่วงโซ่ที่เกี่ยวข้อง วิธีกําหนดวิธีการโต้ตอบข้อมูลวิธีกําหนดวิธีการตรวจสอบความถูกต้องของข้อมูลวิธีกําหนดขนาดบล็อกและวิธีสร้างสมดุลฉันทามติและประสิทธิภาพซึ่งเป็นสิ่งที่กรอบต้องพิจารณา สําหรับเครื่องยนต์นั้นจําเป็นต้องปรับแต่งโมเดลและปรับความสัมพันธ์ระหว่างการโต้ตอบข้อมูลและหน่วยความจําในทิศทางเดียวเท่านั้น ประสิทธิภาพเป็นมาตรฐานการประเมินเพียงอย่างเดียวในขณะที่กรอบไม่ได้ จํากัด อยู่แค่นี้
วงจรชีวิตของการรับออกข้อมูลของตัวแทนต้องประกอบด้วยสามส่วน ก่อนอื่นต้องมีโมเดลในพื้นฐานที่กำหนดความลึกและวิธีการคิด จากนั้นจะมีการปรับแต่งในหน่วยความจำ เมื่อโมเดลพื้นฐานสร้างผลลัพธ์ให้ จะมีการปรับเปลี่ยนตามหน่วยความจำ สุดท้ายคือการดำเนินการผลลัพธ์บนลูกค้าที่แตกต่างกัน
แหล่งที่มา: @SuhailKakar
เพื่อยืนยันว่าเฟรมเวิร์ก Agent มี "ความเป็นคู่ของอนุภาคคลื่น" "คลื่น" แสดงถึงลักษณะของ "Memecoin" ซึ่งย่อมาจากวัฒนธรรมชุมชนและกิจกรรมของนักพัฒนาโดยเน้นความน่าดึงดูดใจและความสามารถในการเผยแพร่ของตัวแทน "อนุภาค" แสดงถึงลักษณะของ "ความคาดหวังของอุตสาหกรรม" ซึ่งหมายถึงประสิทธิภาพพื้นฐานกรณีการใช้งานจริงและความลึกทางเทคนิค ฉันจะอธิบายสิ่งนี้โดยการรวมสองด้านโดยใช้บทเรียนการพัฒนาของสามเฟรมเวิร์กเป็นตัวอย่าง:
แหล่งที่มา: @SuhailKakar
แหล่งที่มา: @SuhailKakar
แหล่งกำเนิด: @SuhailKakar
4.ตั้งค่าบุคลิกภาพของตัวแทน
Source: @SuhailKakar
เฟรมเวิร์ก Eliza นั้นค่อนข้างง่ายในการเริ่มต้น มันขึ้นอยู่กับ TypeScript ซึ่งเป็นภาษาที่นักพัฒนาเว็บและ Web3 ส่วนใหญ่คุ้นเคย เฟรมเวิร์กนั้นเรียบง่ายและหลีกเลี่ยงการเป็นนามธรรมมากเกินไปทําให้นักพัฒนาสามารถเพิ่มคุณสมบัติที่ต้องการได้อย่างง่ายดาย จากขั้นตอนที่ 3 เราจะเห็นว่า Eliza รองรับการรวมหลายไคลเอ็นต์และสามารถเข้าใจได้ว่าเป็นผู้ประกอบสําหรับการรวมหลายไคลเอ็นต์ Eliza รองรับแพลตฟอร์มเช่น DC, TG และ X รวมถึงโมเดลภาษาขนาดใหญ่ต่างๆ ช่วยให้สามารถป้อนข้อมูลผ่านโซเชียลมีเดียและเอาต์พุตที่กล่าวถึงข้างต้นผ่านโมเดล LLM และยังรองรับการจัดการหน่วยความจําในตัวทําให้นักพัฒนาที่มีนิสัยแตกต่างกันสามารถปรับใช้ AI Agent ได้อย่างรวดเร็ว
เนื่องจากความง่ายของกรอบและความร่วมมือของอินเทอร์เฟซ Eliza ลดระดับการเข้าถึงอย่างมีนัยยะและบรรลุมาตรฐานอินเทอร์เฟซที่สม่ำเสมอได้
1. Fork ที่ Repository ของ ZerePy
แหล่งที่มา:https://replit.com/
แหล่งที่มา:https://replit.com/
3.ตั้งค่าบุคลิกาตัวแทน
แหล่งที่มา:https://replit.com/
เรื่องการสร้างตัวแทน RAG (Retrieval-Augmented Generation) Agent เป็นตัวอย่าง:
แหล่งที่มา:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
แหล่งที่มา:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
แหล่งที่มา:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
source:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
Rig (ARC) เป็นกรอบการสร้างระบบ AI ที่มีฐานที่ภาษา Rust สำหรับเครื่องมือ LLM workflow engine โดยมันแก้ปัญหาการปรับปรุงประสิทธิภาพระดับต่ำ กล่าวอีกนัยหนึ่ง ARC เป็น "ชุดเครื่องมือ" ของเครื่องมือ AI ที่ให้การเรียก AI และการปรับปรุงประสิทธิภาพ การเก็บข้อมูล การจัดการข้อยกเว้นและบริการสนับสนุนพื้นหลังอื่น ๆ
สิ่งที่ Rig ต้องการแก้ไขคือปัญหา "การเรียก" เพื่อช่วยนักพัฒนาเลือก LLM ได้อย่างดีขึ้น ปรับปรุงคำพูดให้ดีขึ้น เพิ่มประสิทธิภาพในการจัดการโทเค็นและวิธีการจัดการการประมวลผลพร้อมกัน จัดการทรัพยากร ลดความล่าช้า ฯลฯ โดยให้ความสำคัญกับโมเดล AI LLM ว่าจะ "ใช้ประโยชน์ได้ดี" อย่างไรเมื่อทำงานร่วมกับระบบ AI Agent
Rigเป็นไลบรารี Rust โอเพ่นซอร์สที่ออกแบบมาเพื่อความง่ายในการพัฒนาแอปพลิเคชันที่ใช้ LLM รวมถึง RAG Agents ด้วย เนื่องจาก Rig เป็นไลบรารีที่เปิดกว้างมากขึ้น มันต้องการความรู้สูงสุดสำหรับนักพัฒนาและความเข้าใจที่สูงขึ้นต่อ Rust และ Agent บทแนะนำที่นี่เป็นกระบวนการกำหนดค่า RAG Agent ที่ง่ายที่สุด RAG เสริม LLM โดยรวม LLM กับการดึงความรู้จากภายนอก ใน DEMO อื่น ๆ บนเว็บไซต์อย่างเป็นทางการ คุณสามารถดูว่า Rig มีลักษณะดังต่อไปนี้:
จะเห็นได้ว่าเมื่อเทียบกับ Eliza แล้ว Rig ให้พื้นที่เพิ่มเติมแก่นักพัฒนาสําหรับการเพิ่มประสิทธิภาพช่วยให้นักพัฒนาสามารถแก้ปัญหาการโทรและการเพิ่มประสิทธิภาพการทํางานร่วมกันของ LLM และ Agent ได้ดีขึ้น Rig มอบประสิทธิภาพที่ขับเคลื่อนด้วย Rust โดยใช้ประโยชน์จากสิ่งที่เป็นนามธรรมที่ไม่มีต้นทุนของ Rust และการทํางาน LLM ที่ปลอดภัยต่อหน่วยความจําประสิทธิภาพสูงและเวลาแฝงต่ํา มันสามารถให้ระดับเสรีภาพที่สมบูรณ์ยิ่งขึ้นในระดับพื้นฐาน
Swarms มีจุดมุ่งหมายเพื่อให้กรอบการประสานแบบหลายตัวแทนระดับการผลิตระดับองค์กร เว็บไซต์อย่างเป็นทางการมีเวิร์กโฟลว์และสถาปัตยกรรมแบบขนาน / อนุกรมมากมายสําหรับงาน Agent ด้านล่างนี้เป็นการแนะนําสั้น ๆ เกี่ยวกับส่วนเล็ก ๆ ของพวกเขา
การดำเนินการตามลำดับ
แหล่งที่มา: https://docs.swarms.world
โครงสร้างของ Sequential Swarm ประมวลผลงานตามลำดับเชิงเส้น แต่ละตัวแทนจะทำงานเสร็จก่อนที่จะส่งผลลัพธ์ให้กับตัวแทนถัดไปในเชื่อมโยง โครงสร้างนี้ช่วยให้การประมวลผลมีความเรียบเรียงและเป็นประโยชน์เมื่อมีความขึ้นอยู่กับงาน
Use case:
โครงสร้างลำดับชั้น:
แหล่งที่มา: https://docs.swarms.world
สถาปัตยกรรมนี้นำการควบคุมจากบนลงล่างมาปฏิบัติ โดยตัวแทนระดับสูงควบคุมงานระหว่างตัวแทนระดับต่ำ ตัวแทนดำเนินการงานพร้อมกันและส่งผลลัพธ์กลับเข้าสู่วงวิงสุดท้ายสำหรับการรวบรวม นี้เป็นประโยชน์อย่างยิ่งสำหรับงานที่สามารถแบ่งเบาได้มาก
แหล่งที่มา: https://docs.swarms.world
สถาปัตยกรรมนี้ถูกออกแบบมาเพื่อจัดการกลุ่มของเอเจนต์ขนาดใหญ่ที่ทำงานพร้อมกัน ซึ่งสามารถจัดการเอเจนต์ได้หลายพันตัว โดยแต่ละตัวทำงานบนเธรดของตัวเอง มันเหมาะสำหรับการดูแลผลลัพธ์ของการดำเนินงานของเอเจนต์ขนาดใหญ่
Swarms ไม่ได้เป็นเฟรมเวิร์กของตัวแทนเท่านั้น แต่ยังเข้ากันได้กับเฟรมเวิร์ก Eliza, ZerePy, และ Rig ที่กล่าวถึงไว้ก่อนหน้านี้ด้วย ด้วยการเข้าใจแบบโมดูลาร์ มันเพิ่มประสิทธิภาพของตัวแทนในการทำงานข้ามได้และสถาปัตยกรรมต่าง ๆ เพื่อแก้ปัญหาที่เกิดขึ้น การคิดค้นและการพัฒนาของ Swarms พร้อมกับชุมชนนักพัฒนาของมันกำลังก้าวหน้าไปอย่างดี
โดยทั่วไปแล้ว Eliza และ ZerePy มีความได้เปรียบในเรื่องความง่ายต่อการใช้งานและการพัฒนาอย่างรวดเร็วในขณะที่ Rig และ Swarms มีความเหมาะสมมากกว่าสำหรับนักพัฒนามืออาชีพหรือแอปพลิเคชันขององค์กรที่ต้องการประสิทธิภาพสูงและการประมวลผลระดับใหญ่
นี่คือเหตุผลที่กรอบตัวแทนมีลักษณะ "ความหวังของอุตสาหกรรม" กรอบที่กล่าวถึงข้างต้นยังอยู่ในช่วงเริ่มต้นและลําดับความสําคัญเร่งด่วนคือการได้เปรียบผู้เสนอญัตติแรกและสร้างชุมชนนักพัฒนาที่ใช้งานอยู่ ประสิทธิภาพของเฟรมเวิร์กและความล่าช้าของแอปพลิเคชันยอดนิยมของ Web2 ไม่ใช่ข้อกังวลหลัก เฟรมเวิร์กเดียวที่จะประสบความสําเร็จในท้ายที่สุดคือเฟรมเวิร์กที่สามารถดึงดูดนักพัฒนาได้อย่างต่อเนื่องเนื่องจากอุตสาหกรรม Web3 จําเป็นต้องดึงดูดความสนใจของตลาดเสมอ ไม่ว่าประสิทธิภาพของเฟรมเวิร์กจะแข็งแกร่งเพียงใดหรือพื้นฐานที่มั่นคงเพียงใดหากใช้งานยากและไม่สามารถดึงดูดผู้ใช้ได้ก็จะต่อต้าน หากเฟรมเวิร์กสามารถดึงดูดนักพัฒนาผู้ที่มีรูปแบบเศรษฐกิจโทเค็นที่เป็นผู้ใหญ่และสมบูรณ์กว่าจะโดดเด่น
ลักษณะ "Memecoin" ของเฟรมเวิร์ก Agent นั้นค่อนข้างเข้าใจง่าย โทเค็นของเฟรมเวิร์กที่กล่าวถึงข้างต้นไม่มีการออกแบบเศรษฐกิจโทเค็นที่เหมาะสมขาดกรณีการใช้งานหรือมีข้อ จํากัด มากและไม่ได้ตรวจสอบรูปแบบธุรกิจ ไม่มีมู่เล่โทเค็นที่มีประสิทธิภาพ เฟรมเวิร์กเป็นเพียงเฟรมเวิร์ก และไม่มีการบูรณาการแบบออร์แกนิกระหว่างเฟรมเวิร์กและโทเค็น การเติบโตของราคาโทเค็นนอกเหนือจาก FOMO มีเพียงเล็กน้อยที่จะสนับสนุนจากปัจจัยพื้นฐานและขาดคูน้ําที่แข็งแกร่งเพื่อให้แน่ใจว่าการเติบโตของมูลค่าที่มั่นคงและระยะยาว ในเวลาเดียวกันกรอบตัวเองยังคงค่อนข้างหยาบและมูลค่าที่แท้จริงของพวกเขาไม่สอดคล้องกับมูลค่าตลาดปัจจุบันของพวกเขาจึงแสดงลักษณะ "Memecoin" ที่แข็งแกร่ง
เป็นที่น่าสังเกตว่า "ความเป็นคู่ของอนุภาคคลื่น" ของเฟรมเวิร์ก Agent ไม่ใช่ข้อเสียและไม่ควรตีความอย่างคร่าวๆว่าเป็นเฟรมเวิร์กที่ไม่ใช่ Memecoin บริสุทธิ์หรือโซลูชันครึ่งทางที่ไม่มีกรณีการใช้งานโทเค็น ดังที่ฉันได้กล่าวไว้ในบทความก่อนหน้านี้ตัวแทนที่มีน้ําหนักเบาถูกปกคลุมด้วยม่าน Memecoin ที่คลุมเครือ วัฒนธรรมและพื้นฐานของชุมชนจะไม่ขัดแย้งกันอีกต่อไปและเส้นทางการพัฒนาสินทรัพย์ใหม่จะค่อยๆเกิดขึ้น แม้จะมีฟองสบู่เริ่มต้นและความไม่แน่นอนเกี่ยวกับเฟรมเวิร์กของ Agent แต่ศักยภาพของพวกเขาในการดึงดูดนักพัฒนาและผลักดันการปรับใช้แอปพลิเคชันไม่ควรละเลย ในอนาคตเฟรมเวิร์กที่มีรูปแบบเศรษฐกิจโทเค็นที่ได้รับการพัฒนามาอย่างดีและระบบนิเวศของนักพัฒนาที่แข็งแกร่งอาจกลายเป็นเสาหลักของภาคส่วนนี้
ส่งต่อชื่อเดิม: AI Agent Framework เป็นชิ้นส่วนสุดท้ายของปริศนาหรือไม่? จะตีความ "ความเป็นคู่ของอนุภาคคลื่น" ของเฟรมเวิร์กได้อย่างไร?
เฟรมเวิร์ก AI Agent ซึ่งเป็นส่วนสําคัญของการพัฒนาอุตสาหกรรมอาจมีศักยภาพสองประการในการขับเคลื่อนทั้งการนําเทคโนโลยีไปใช้และการเติบโตของระบบนิเวศ เฟรมเวิร์กที่กล่าวถึงมากที่สุดในตลาด ได้แก่ Eliza, Rig, Swarms และ ZerePy เฟรมเวิร์กเหล่านี้ดึงดูดนักพัฒนาผ่านที่เก็บ GitHub สร้างชื่อเสียง ผ่านการออกโทเค็นผ่าน "ห้องสมุด" กรอบเหล่านี้เช่นแสงรวบรวมทั้งคลื่นและลักษณะคล้ายอนุภาค ในทํานองเดียวกันเฟรมเวิร์กของตัวแทนมีทั้งภายนอกที่ร้ายแรงและลักษณะ Memecoin บทความนี้จะมุ่งเน้นไปที่การตีความ "ความเป็นคู่ของอนุภาคคลื่น" ของเฟรมเวิร์กเหล่านี้และสํารวจว่าทําไมเฟรมเวิร์ก Agent จึงสามารถเป็นชิ้นสุดท้ายในปริศนาได้
นับตั้งแต่การเกิดขึ้นของ GOAT การเล่าเรื่องของ Agent ได้รับความสนใจจากตลาดเพิ่มขึ้นคล้ายกับปรมาจารย์ด้านศิลปะการต่อสู้ที่ระเบิดพลังด้วยกําปั้นซ้ายที่เป็นตัวแทนของ "Memecoin" และฝ่ามือขวาที่รวบรวม "ความหวังของอุตสาหกรรม" คุณอาจพ่ายแพ้ต่อการเคลื่อนไหวอย่างใดอย่างหนึ่งเหล่านี้ ในความเป็นจริงสถานการณ์การใช้งานของ AI Agents ไม่ได้แตกต่างกันอย่างเคร่งครัดและขอบเขตระหว่างแพลตฟอร์มเฟรมเวิร์กและแอปพลิเคชันเฉพาะจะเบลอ อย่างไรก็ตามสิ่งเหล่านี้ยังสามารถจัดหมวดหมู่คร่าวๆตามการตั้งค่าโทเค็นหรือโปรโตคอล ขึ้นอยู่กับการตั้งค่าการพัฒนาของโทเค็นหรือโปรโตคอลโดยทั่วไปสามารถแบ่งออกเป็นหมวดหมู่ต่อไปนี้:
เมื่อพูดคุยเพิ่มเติมเกี่ยวกับเฟรมเวิร์กของตัวแทน จะเห็นได้ว่ามีผลกระทบที่สำคัญ ไม่เหมือนนักพัฒนาบนโซ่สาธารณะและโปรโตคอลที่ใหญ่ที่สุดที่สามารถเลือกใช้จากสภาพแวดล้อมภาษาโปรแกรมที่แตกต่างกันได้เท่านั้น ขนาดรวมของชุมชนนักพัฒนาในอุตสาหกรรมยังไม่แสดงอัตราการเติบโตที่สอดคล้องกันในทุนตลาด GitHub repositories เป็นที่ที่นักพัฒนา Web2 และ Web3 สร้างความเห็นสร้างสรรค์ การสร้างชุมชนนักพัฒนาที่นี่น่าสนใจและมีอิทธิพลกว่าการพัฒนาแพคเกจ “plug-and-play” ที่พัฒนาเป็นรายบุคคลโดยโปรโตคอลใดๆ
สี่เฟรมเวิร์กที่กล่าวถึงในบทความนี้เป็นโอเพ่นซอร์ซทั้งหมด:
ปัจจุบันโครงการ Eliza ได้รับการใช้งานอย่างแพร่หลายในแอปพลิเคชันต่าง ๆ ของเอเจนต์และเป็นเฟรมเวิร์กที่ใช้กันอย่างแพร่หลายที่สุด การพัฒนาของ ZerePy ไม่ได้ถึงขั้นที่สูงมากและทิศทางการพัฒนาของมันเน้นไปที่ X เท่านั้น ยังไม่รองรับ LLMs ภายในและหน่วยความจำที่ผสมเข้ากันได้ RIG มีความยากในการพัฒนาที่สูงที่สุด แต่มีความอิสระในการพัฒนาที่สูงที่สุดเพื่อให้ผู้พัฒนาสามารถปรับปรุงประสิทธิภาพได้ สำหรับ Swarms นอกจากทีมได้เปิดตัว mcs แล้วยังไม่มีการใช้งานอื่น ๆ อย่างไรก็ตาม Swarms สามารถผสมเข้ากับเฟรมเวิร์กต่าง ๆ ได้เพื่อให้มีศักย์ภาพมากขึ้น
นอกจากนี้ในการจําแนกประเภทดังกล่าวการแยกเอ็นจิ้น Agent และเฟรมเวิร์กอาจทําให้เกิดความสับสน แต่ผมเชื่อว่าทั้งสองมีความแตกต่างกัน ก่อนอื่นทําไมถึงเรียกว่าเครื่องยนต์? การเปรียบเทียบกับเครื่องมือค้นหาในชีวิตจริงค่อนข้างเหมาะสม ซึ่งแตกต่างจากแอปพลิเคชัน Agent ที่เป็นเนื้อเดียวกันประสิทธิภาพของเอ็นจิ้น Agent อยู่ในระดับที่สูงขึ้น แต่ถูกห่อหุ้มอย่างสมบูรณ์และการปรับเปลี่ยนจะทําผ่านอินเทอร์เฟซ API เช่นกล่องดํา ผู้ใช้สามารถสัมผัสกับประสิทธิภาพของเอ็นจิ้น Agent ได้โดยการปลอมแปลง แต่พวกเขาไม่สามารถควบคุมภาพเต็มหรืออิสระในการปรับแต่งได้เหมือนที่ทําได้ด้วยเฟรมเวิร์กพื้นฐาน เอ็นจิ้นของผู้ใช้แต่ละคนก็เหมือนกับการสร้างกระจกบน Agent ที่ผ่านการฝึกอบรมและโต้ตอบกับกระจกนั้น ในทางกลับกันเฟรมเวิร์กได้รับการออกแบบมาโดยพื้นฐานเพื่อปรับให้เข้ากับห่วงโซ่เนื่องจากเมื่อตัวแทนสร้างเฟรมเวิร์กตัวแทนเป้าหมายสูงสุดคือการรวมเข้ากับห่วงโซ่ที่เกี่ยวข้อง วิธีกําหนดวิธีการโต้ตอบข้อมูลวิธีกําหนดวิธีการตรวจสอบความถูกต้องของข้อมูลวิธีกําหนดขนาดบล็อกและวิธีสร้างสมดุลฉันทามติและประสิทธิภาพซึ่งเป็นสิ่งที่กรอบต้องพิจารณา สําหรับเครื่องยนต์นั้นจําเป็นต้องปรับแต่งโมเดลและปรับความสัมพันธ์ระหว่างการโต้ตอบข้อมูลและหน่วยความจําในทิศทางเดียวเท่านั้น ประสิทธิภาพเป็นมาตรฐานการประเมินเพียงอย่างเดียวในขณะที่กรอบไม่ได้ จํากัด อยู่แค่นี้
วงจรชีวิตของการรับออกข้อมูลของตัวแทนต้องประกอบด้วยสามส่วน ก่อนอื่นต้องมีโมเดลในพื้นฐานที่กำหนดความลึกและวิธีการคิด จากนั้นจะมีการปรับแต่งในหน่วยความจำ เมื่อโมเดลพื้นฐานสร้างผลลัพธ์ให้ จะมีการปรับเปลี่ยนตามหน่วยความจำ สุดท้ายคือการดำเนินการผลลัพธ์บนลูกค้าที่แตกต่างกัน
แหล่งที่มา: @SuhailKakar
เพื่อยืนยันว่าเฟรมเวิร์ก Agent มี "ความเป็นคู่ของอนุภาคคลื่น" "คลื่น" แสดงถึงลักษณะของ "Memecoin" ซึ่งย่อมาจากวัฒนธรรมชุมชนและกิจกรรมของนักพัฒนาโดยเน้นความน่าดึงดูดใจและความสามารถในการเผยแพร่ของตัวแทน "อนุภาค" แสดงถึงลักษณะของ "ความคาดหวังของอุตสาหกรรม" ซึ่งหมายถึงประสิทธิภาพพื้นฐานกรณีการใช้งานจริงและความลึกทางเทคนิค ฉันจะอธิบายสิ่งนี้โดยการรวมสองด้านโดยใช้บทเรียนการพัฒนาของสามเฟรมเวิร์กเป็นตัวอย่าง:
แหล่งที่มา: @SuhailKakar
แหล่งที่มา: @SuhailKakar
แหล่งกำเนิด: @SuhailKakar
4.ตั้งค่าบุคลิกภาพของตัวแทน
Source: @SuhailKakar
เฟรมเวิร์ก Eliza นั้นค่อนข้างง่ายในการเริ่มต้น มันขึ้นอยู่กับ TypeScript ซึ่งเป็นภาษาที่นักพัฒนาเว็บและ Web3 ส่วนใหญ่คุ้นเคย เฟรมเวิร์กนั้นเรียบง่ายและหลีกเลี่ยงการเป็นนามธรรมมากเกินไปทําให้นักพัฒนาสามารถเพิ่มคุณสมบัติที่ต้องการได้อย่างง่ายดาย จากขั้นตอนที่ 3 เราจะเห็นว่า Eliza รองรับการรวมหลายไคลเอ็นต์และสามารถเข้าใจได้ว่าเป็นผู้ประกอบสําหรับการรวมหลายไคลเอ็นต์ Eliza รองรับแพลตฟอร์มเช่น DC, TG และ X รวมถึงโมเดลภาษาขนาดใหญ่ต่างๆ ช่วยให้สามารถป้อนข้อมูลผ่านโซเชียลมีเดียและเอาต์พุตที่กล่าวถึงข้างต้นผ่านโมเดล LLM และยังรองรับการจัดการหน่วยความจําในตัวทําให้นักพัฒนาที่มีนิสัยแตกต่างกันสามารถปรับใช้ AI Agent ได้อย่างรวดเร็ว
เนื่องจากความง่ายของกรอบและความร่วมมือของอินเทอร์เฟซ Eliza ลดระดับการเข้าถึงอย่างมีนัยยะและบรรลุมาตรฐานอินเทอร์เฟซที่สม่ำเสมอได้
1. Fork ที่ Repository ของ ZerePy
แหล่งที่มา:https://replit.com/
แหล่งที่มา:https://replit.com/
3.ตั้งค่าบุคลิกาตัวแทน
แหล่งที่มา:https://replit.com/
เรื่องการสร้างตัวแทน RAG (Retrieval-Augmented Generation) Agent เป็นตัวอย่าง:
แหล่งที่มา:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
แหล่งที่มา:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
แหล่งที่มา:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
source:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
Rig (ARC) เป็นกรอบการสร้างระบบ AI ที่มีฐานที่ภาษา Rust สำหรับเครื่องมือ LLM workflow engine โดยมันแก้ปัญหาการปรับปรุงประสิทธิภาพระดับต่ำ กล่าวอีกนัยหนึ่ง ARC เป็น "ชุดเครื่องมือ" ของเครื่องมือ AI ที่ให้การเรียก AI และการปรับปรุงประสิทธิภาพ การเก็บข้อมูล การจัดการข้อยกเว้นและบริการสนับสนุนพื้นหลังอื่น ๆ
สิ่งที่ Rig ต้องการแก้ไขคือปัญหา "การเรียก" เพื่อช่วยนักพัฒนาเลือก LLM ได้อย่างดีขึ้น ปรับปรุงคำพูดให้ดีขึ้น เพิ่มประสิทธิภาพในการจัดการโทเค็นและวิธีการจัดการการประมวลผลพร้อมกัน จัดการทรัพยากร ลดความล่าช้า ฯลฯ โดยให้ความสำคัญกับโมเดล AI LLM ว่าจะ "ใช้ประโยชน์ได้ดี" อย่างไรเมื่อทำงานร่วมกับระบบ AI Agent
Rigเป็นไลบรารี Rust โอเพ่นซอร์สที่ออกแบบมาเพื่อความง่ายในการพัฒนาแอปพลิเคชันที่ใช้ LLM รวมถึง RAG Agents ด้วย เนื่องจาก Rig เป็นไลบรารีที่เปิดกว้างมากขึ้น มันต้องการความรู้สูงสุดสำหรับนักพัฒนาและความเข้าใจที่สูงขึ้นต่อ Rust และ Agent บทแนะนำที่นี่เป็นกระบวนการกำหนดค่า RAG Agent ที่ง่ายที่สุด RAG เสริม LLM โดยรวม LLM กับการดึงความรู้จากภายนอก ใน DEMO อื่น ๆ บนเว็บไซต์อย่างเป็นทางการ คุณสามารถดูว่า Rig มีลักษณะดังต่อไปนี้:
จะเห็นได้ว่าเมื่อเทียบกับ Eliza แล้ว Rig ให้พื้นที่เพิ่มเติมแก่นักพัฒนาสําหรับการเพิ่มประสิทธิภาพช่วยให้นักพัฒนาสามารถแก้ปัญหาการโทรและการเพิ่มประสิทธิภาพการทํางานร่วมกันของ LLM และ Agent ได้ดีขึ้น Rig มอบประสิทธิภาพที่ขับเคลื่อนด้วย Rust โดยใช้ประโยชน์จากสิ่งที่เป็นนามธรรมที่ไม่มีต้นทุนของ Rust และการทํางาน LLM ที่ปลอดภัยต่อหน่วยความจําประสิทธิภาพสูงและเวลาแฝงต่ํา มันสามารถให้ระดับเสรีภาพที่สมบูรณ์ยิ่งขึ้นในระดับพื้นฐาน
Swarms มีจุดมุ่งหมายเพื่อให้กรอบการประสานแบบหลายตัวแทนระดับการผลิตระดับองค์กร เว็บไซต์อย่างเป็นทางการมีเวิร์กโฟลว์และสถาปัตยกรรมแบบขนาน / อนุกรมมากมายสําหรับงาน Agent ด้านล่างนี้เป็นการแนะนําสั้น ๆ เกี่ยวกับส่วนเล็ก ๆ ของพวกเขา
การดำเนินการตามลำดับ
แหล่งที่มา: https://docs.swarms.world
โครงสร้างของ Sequential Swarm ประมวลผลงานตามลำดับเชิงเส้น แต่ละตัวแทนจะทำงานเสร็จก่อนที่จะส่งผลลัพธ์ให้กับตัวแทนถัดไปในเชื่อมโยง โครงสร้างนี้ช่วยให้การประมวลผลมีความเรียบเรียงและเป็นประโยชน์เมื่อมีความขึ้นอยู่กับงาน
Use case:
โครงสร้างลำดับชั้น:
แหล่งที่มา: https://docs.swarms.world
สถาปัตยกรรมนี้นำการควบคุมจากบนลงล่างมาปฏิบัติ โดยตัวแทนระดับสูงควบคุมงานระหว่างตัวแทนระดับต่ำ ตัวแทนดำเนินการงานพร้อมกันและส่งผลลัพธ์กลับเข้าสู่วงวิงสุดท้ายสำหรับการรวบรวม นี้เป็นประโยชน์อย่างยิ่งสำหรับงานที่สามารถแบ่งเบาได้มาก
แหล่งที่มา: https://docs.swarms.world
สถาปัตยกรรมนี้ถูกออกแบบมาเพื่อจัดการกลุ่มของเอเจนต์ขนาดใหญ่ที่ทำงานพร้อมกัน ซึ่งสามารถจัดการเอเจนต์ได้หลายพันตัว โดยแต่ละตัวทำงานบนเธรดของตัวเอง มันเหมาะสำหรับการดูแลผลลัพธ์ของการดำเนินงานของเอเจนต์ขนาดใหญ่
Swarms ไม่ได้เป็นเฟรมเวิร์กของตัวแทนเท่านั้น แต่ยังเข้ากันได้กับเฟรมเวิร์ก Eliza, ZerePy, และ Rig ที่กล่าวถึงไว้ก่อนหน้านี้ด้วย ด้วยการเข้าใจแบบโมดูลาร์ มันเพิ่มประสิทธิภาพของตัวแทนในการทำงานข้ามได้และสถาปัตยกรรมต่าง ๆ เพื่อแก้ปัญหาที่เกิดขึ้น การคิดค้นและการพัฒนาของ Swarms พร้อมกับชุมชนนักพัฒนาของมันกำลังก้าวหน้าไปอย่างดี
โดยทั่วไปแล้ว Eliza และ ZerePy มีความได้เปรียบในเรื่องความง่ายต่อการใช้งานและการพัฒนาอย่างรวดเร็วในขณะที่ Rig และ Swarms มีความเหมาะสมมากกว่าสำหรับนักพัฒนามืออาชีพหรือแอปพลิเคชันขององค์กรที่ต้องการประสิทธิภาพสูงและการประมวลผลระดับใหญ่
นี่คือเหตุผลที่กรอบตัวแทนมีลักษณะ "ความหวังของอุตสาหกรรม" กรอบที่กล่าวถึงข้างต้นยังอยู่ในช่วงเริ่มต้นและลําดับความสําคัญเร่งด่วนคือการได้เปรียบผู้เสนอญัตติแรกและสร้างชุมชนนักพัฒนาที่ใช้งานอยู่ ประสิทธิภาพของเฟรมเวิร์กและความล่าช้าของแอปพลิเคชันยอดนิยมของ Web2 ไม่ใช่ข้อกังวลหลัก เฟรมเวิร์กเดียวที่จะประสบความสําเร็จในท้ายที่สุดคือเฟรมเวิร์กที่สามารถดึงดูดนักพัฒนาได้อย่างต่อเนื่องเนื่องจากอุตสาหกรรม Web3 จําเป็นต้องดึงดูดความสนใจของตลาดเสมอ ไม่ว่าประสิทธิภาพของเฟรมเวิร์กจะแข็งแกร่งเพียงใดหรือพื้นฐานที่มั่นคงเพียงใดหากใช้งานยากและไม่สามารถดึงดูดผู้ใช้ได้ก็จะต่อต้าน หากเฟรมเวิร์กสามารถดึงดูดนักพัฒนาผู้ที่มีรูปแบบเศรษฐกิจโทเค็นที่เป็นผู้ใหญ่และสมบูรณ์กว่าจะโดดเด่น
ลักษณะ "Memecoin" ของเฟรมเวิร์ก Agent นั้นค่อนข้างเข้าใจง่าย โทเค็นของเฟรมเวิร์กที่กล่าวถึงข้างต้นไม่มีการออกแบบเศรษฐกิจโทเค็นที่เหมาะสมขาดกรณีการใช้งานหรือมีข้อ จํากัด มากและไม่ได้ตรวจสอบรูปแบบธุรกิจ ไม่มีมู่เล่โทเค็นที่มีประสิทธิภาพ เฟรมเวิร์กเป็นเพียงเฟรมเวิร์ก และไม่มีการบูรณาการแบบออร์แกนิกระหว่างเฟรมเวิร์กและโทเค็น การเติบโตของราคาโทเค็นนอกเหนือจาก FOMO มีเพียงเล็กน้อยที่จะสนับสนุนจากปัจจัยพื้นฐานและขาดคูน้ําที่แข็งแกร่งเพื่อให้แน่ใจว่าการเติบโตของมูลค่าที่มั่นคงและระยะยาว ในเวลาเดียวกันกรอบตัวเองยังคงค่อนข้างหยาบและมูลค่าที่แท้จริงของพวกเขาไม่สอดคล้องกับมูลค่าตลาดปัจจุบันของพวกเขาจึงแสดงลักษณะ "Memecoin" ที่แข็งแกร่ง
เป็นที่น่าสังเกตว่า "ความเป็นคู่ของอนุภาคคลื่น" ของเฟรมเวิร์ก Agent ไม่ใช่ข้อเสียและไม่ควรตีความอย่างคร่าวๆว่าเป็นเฟรมเวิร์กที่ไม่ใช่ Memecoin บริสุทธิ์หรือโซลูชันครึ่งทางที่ไม่มีกรณีการใช้งานโทเค็น ดังที่ฉันได้กล่าวไว้ในบทความก่อนหน้านี้ตัวแทนที่มีน้ําหนักเบาถูกปกคลุมด้วยม่าน Memecoin ที่คลุมเครือ วัฒนธรรมและพื้นฐานของชุมชนจะไม่ขัดแย้งกันอีกต่อไปและเส้นทางการพัฒนาสินทรัพย์ใหม่จะค่อยๆเกิดขึ้น แม้จะมีฟองสบู่เริ่มต้นและความไม่แน่นอนเกี่ยวกับเฟรมเวิร์กของ Agent แต่ศักยภาพของพวกเขาในการดึงดูดนักพัฒนาและผลักดันการปรับใช้แอปพลิเคชันไม่ควรละเลย ในอนาคตเฟรมเวิร์กที่มีรูปแบบเศรษฐกิจโทเค็นที่ได้รับการพัฒนามาอย่างดีและระบบนิเวศของนักพัฒนาที่แข็งแกร่งอาจกลายเป็นเสาหลักของภาคส่วนนี้