ข้อความต้นฉบับ: The Paper ผู้แต่ง: Che Xingyun แหล่งที่มาของรูปภาพ: สร้างโดย Unbounded AIในเดือนมิถุนายนปีนี้ ผู้ผลิตรายใหญ่ได้อัปเกรดผลิตภัณฑ์ที่คล้ายกับ ChatGPT เมื่อวันที่ 9 มิถุนายน Xunfei ได้เปิดตัวรุ่นอัปเกรดของ Xinghuo Cognitive Big Model และในวันที่ 13 มิถุนายน หลังจากเปิดตัวผลิตภัณฑ์ที่คล้ายกับ ChatGPT แล้ว 360 ก็จัดงาน 360 Smart Brain Big Model Application Conference อีกครั้งแตกต่างจากรุ่นใหญ่ที่เปิดตัวเมื่อประมาณเดือนกุมภาพันธ์ ผลิตภัณฑ์อัปเกรดที่ออกโดยบริษัทต่างๆ เมื่อเร็ว ๆ นี้มีความเอนเอียงไปทางชั้นแอปพลิเคชันมากกว่า และจุดประสงค์คือทำให้ครัวเรือนหลายพันครัวเรือนง่ายขึ้นเมื่อพิจารณาจากรุ่นปัจจุบัน 360 Intellectual Brain มีความสามารถในการสร้างข้ามโมดอลในขั้นต้น นอกเหนือจากการสร้างข้อความ ตาราง และรูปภาพจากข้อความ การสร้างข้อความและรูปภาพจากรูปภาพ และสร้างข้อความจากวิดีโอ และการตัดวิดีโอจากข้อความและ การสร้างสรรค์พื้นฐานอื่นๆ นอกจากนี้ ยังกำหนดนิยามใหม่ของ "มนุษย์ดิจิทัล" เพื่อให้ผู้ใช้ปรับแต่งได้และเป็น "ปัญญาประดิษฐ์" สุดพิเศษที่ "มีจิตวิญญาณ การออกแบบของมนุษย์ และความทรงจำ" ในปัจจุบัน สถานการณ์แอปพลิเคชันที่มีระยะห่างระหว่าง 360 Smart Brain และผู้ใช้ใกล้ที่สุดคือถังครอบครัวที่มีอยู่ของ 360 Zhou Hongyi กล่าวในงานแถลงข่าวว่า "360 Smart Brain 4.0" จะเชื่อมต่อกับ 360 Security Guard, 360 Browser, 360 Search, เป็นต้น การทำงานร่วมกันระหว่างมนุษย์และเครื่องจักรในงานแถลงข่าว Zhou Hongyi เปลี่ยนมุมมองเดิมของเขา "ฉันเคยพูดว่าช่องว่างระหว่างโมเดลขนาดใหญ่ในประเทศกับ ChatGPT คือสองปี และตอนนี้ฉันต้องการนำประโยคนี้กลับมา" ระดับนั้นเสมอกัน ด้วย GPT3.5 และหากพัฒนาด้วยความเร็วระดับนี้ ก็จะตามทัน หรือแซงหน้า GPT4 ได้ในพริบตาภายในสี่เดือนนับจากการเปิดตัวเวอร์ชันเริ่มต้นจนถึงการเปิดตัว 360 Smart Brain อย่างเป็นทางการ Zhou Hongyi ได้เห็นการเปลี่ยนแปลงครั้งใหญ่เช่นนี้หรือไม่?## **ยักษ์วิทยาศาสตร์และเทคโนโลยี ล่ารุ่นใหญ่**"รายงานการวิจัยแผนที่แบบจำลองขนาดใหญ่ของปัญญาประดิษฐ์ของจีน" ที่เผยแพร่ในการประชุม Zhongguancun Forum ประจำปี 2566 แสดงให้เห็นว่าในปัจจุบันแบบจำลองขนาดใหญ่ของปัญญาประดิษฐ์ของจีนกำลังแสดงแนวโน้มของการพัฒนาที่แข็งแกร่ง ตามสถิติที่ไม่สมบูรณ์ ณ ตอนนี้ 79 รุ่นขนาดใหญ่ที่มีพารามิเตอร์มากกว่า 1 พันล้านได้รับการเผยแพร่ทั่วประเทศอย่างไรก็ตาม พารามิเตอร์ของโมเดลขนาดใหญ่ของบริษัทเทคโนโลยีรายใหญ่นั้นค่อนข้างใหญ่: พารามิเตอร์ของโมเดลขนาดใหญ่ของ Alibaba Tongyi Qianwen นั้นสูงกว่า 10 ล้านล้าน พารามิเตอร์ของโมเดลขนาดใหญ่ของ Tencent Hunyuan และโมเดลขนาดใหญ่ของ Pangu ของ Huawei นั้นสูงกว่าหนึ่งล้านล้านทั้งหมด และโมเดลขนาดใหญ่ของ Baidu Wenxin มีพารามิเตอร์มากกว่า 1 ล้านล้านตัว ปริมาณพารามิเตอร์ของโมเดลขนาดใหญ่มีมากกว่า 200 พันล้าน และปริมาณพารามิเตอร์ของโมเดลขนาดใหญ่ JD Yanxi คือ 100 พันล้าน ปริมาณพารามิเตอร์ของบริษัทเทคโนโลยีใน อุตสาหกรรมแนวตั้งโดยทั่วไปมากกว่า 100 พันล้าน และปริมาณพารามิเตอร์ของสถาบันวิจัยทางวิทยาศาสตร์แบบจำลองขนาดใหญ่ที่ระดับแสนล้านและต่ำกว่าจากมุมมองของระบบเลย์เอาต์ของโมเดลขนาดใหญ่ บริษัทเทคโนโลยีรายใหญ่ได้ดำเนินการเลย์เอาต์ที่ครอบคลุมแบบสี่ในหนึ่งเดียวในเลเยอร์พลังการประมวลผล เลเยอร์แพลตฟอร์ม เลเยอร์โมเดล และเลเยอร์แอปพลิเคชัน Baidu, Ali และ Huawei ต่างมีโครงร่างที่ครอบคลุมของการวิจัยและพัฒนาอิสระตั้งแต่ชิปไปจนถึงแอพพลิเคชั่น เช่น "Kunlun core + แพลตฟอร์มพายบิน + โมเดลขนาดใหญ่ Wenxin + แอพพลิเคชั่นอุตสาหกรรม" ของ Baidu, "ชิป Hanguang 800 + ฐาน M6-OFA ของ Ali + โมเดลขนาดใหญ่ Tongyi + แอปพลิเคชันอุตสาหกรรม", "ชิป Shengteng + เฟรมเวิร์ก MindSpore + Pangu โมเดลขนาดใหญ่ + แอปพลิเคชันอุตสาหกรรม" ของ Huaweiนอกจากนี้ Kingsoft Office ยังเปิดตัว WPS AI เมื่อวันที่ 31 พฤษภาคม ปัจจุบัน WPSAI เชื่อมต่อกับส่วนประกอบสำนักงานของ Kingsoft Office เช่น เอกสารขนาดเล็ก ข้อความ ตาราง งานนำเสนอ และ PDF ในอนาคต จะยึด AIGC, ความเข้าใจในการอ่าน คำถามและคำตอบ และการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ การพัฒนาในทิศทางเชิงกลยุทธ์ และการเข้าถึงผลิตภัณฑ์ทั้งหมดของ Kingsoft Officeการหลั่งไหลอย่างรวดเร็วของผู้ผลิตรายใหญ่หลายรายในเส้นทางนี้ส่วนใหญ่เกิดจากการติดตามอย่างรวดเร็วและการแนะนำมาตรการโดยหน่วยงานกำกับดูแลเพื่อควบคุมการพัฒนาของอุตสาหกรรมด้วยการคุ้มกันของโครงสร้างระดับบนสุดผู้ผลิตรายใหญ่แต่ละรายสามารถ ลงทุนวิจัยและพัฒนาและเปิดตัวผลิตภัณฑ์ด้วยความมั่นใจตั้งแต่โมเดลขนาดใหญ่เปิดตัวเป็นชุดในเดือนมีนาคมปีนี้ นโยบายด้านกฎระเบียบของ AI ก็ค่อยๆ มีความชัดเจน ซึ่งได้ชี้ให้เห็นถึงทิศทางสำหรับการใช้งานในอุตสาหกรรมด้วยเมื่อมองย้อนกลับไปถึงการพัฒนาของอุตสาหกรรมทั้งหมด เมื่อวันที่ 11 เมษายน มีการเผยแพร่ "Generative Artificial Intelligence Service Management Method" สำหรับความคิดเห็น ในวันที่ 30 พฤษภาคม สถาบันเทคโนโลยีสารสนเทศและการสื่อสารกำลังร่วมกันเตรียมรูปแบบปัญญาประดิษฐ์แบบเปิด "Kite" ใบอนุญาต และขั้นตอนต่อไปคือการออก " Zhikite Open Artificial Intelligence Model License (ฉบับร่างสำหรับความคิดเห็น)ต่อจากนั้น เมืองระดับแรกได้ร่วมกันเปิดตัว "แผนการดำเนินการสำหรับปักกิ่งเพื่อเร่งการสร้างแหล่งนวัตกรรมปัญญาประดิษฐ์ที่ทรงอิทธิพลทั่วโลก (2023-2025)"; ปี)"ในบริบทนี้ Zhou Hongyi เชื่อว่าโมเดลขนาดใหญ่ในประเทศจะลดช่องว่างลงอย่างรวดเร็วด้วย ChatGPT ซึ่งดูเหมือนจะเข้าใจง่าย## **360 Smart Brain ต่างกันอย่างไร**ตามแผนของ Zhou Hongyi โมเดลขนาดใหญ่ 360 จะขึ้นอยู่กับการอัปเกรดโมเดลขนาดใหญ่อย่างต่อเนื่อง โดยคำนึงถึงการจัดฉาก การผลิต การทำให้แบน และการวางแนวตั้งภายใต้กลยุทธ์การพัฒนานี้ 360 Intellectual Brain สามารถบรรลุถึงผู้บริโภค (ผู้ช่วย AI ส่วนบุคคลของผู้ใช้) องค์กรขนาดเล็กและขนาดกลาง (แอปพลิเคชัน SaaS แนวตั้ง) องค์กร/รัฐบาล/เมือง สถานการณ์การใช้งานหลักเพื่อตอบสนองความต้องการของสถานการณ์ต่างๆ ที่กล่าวถึงข้างต้นได้ดียิ่งขึ้น โมเดลขนาดใหญ่ทั่วไปจำเป็นต้องทำการเปลี่ยนแปลงตั้งแต่การป้อนข้อความไปจนถึงการแสดงข้อความ ไปจนถึงการทำความเข้าใจภาพและวิดีโอ และสามารถสร้างภาพและวิดีโอที่มีอยู่ ซึ่งเทียบเท่ากับการสร้างแบบจำลองขนาดใหญ่ ด้วย "หู" และ "ตา" จะเป็นการวางรากฐานสำหรับการสร้าง "มนุษย์ดิจิทัล"มนุษย์ดิจิทัลแบบดั้งเดิมต้องการเพียงเอาต์พุตตามสคริปต์ที่กำหนดไว้ แต่ในยุคของโมเดลขนาดใหญ่ มนุษย์ดิจิทัล 360 สามารถปรับแต่งได้ ดังนั้นผู้คนจึงได้รับการออกแบบ มีความทรงจำ และประสบการณ์ ปัจจุบันมีตัวละครมากกว่า 200 ตัวใน 360 แพลตฟอร์มสี่เหลี่ยมมนุษย์ดิจิทัล แบ่งออกเป็น 2 ประเภท ได้แก่ ดาราดิจิทัลและพนักงานดิจิทัล 360 หวังว่าในอนาคต ทุกคนจะมีผู้ช่วย AI ของตัวเอง และมีโอกาสสื่อสารกับคนโบราณในอวกาศเสมือน ข้ามเวลาและอวกาศในการประชุมสาธิต Zhou Hongyi ถาม "Zhuge Liang" ว่าเขาคิดว่าสิ่งนี้กลายเป็นวัสดุสำหรับภูติผีและสัตว์ในปัจจุบันได้อย่างไร และชายดิจิทัลตอบด้วยน้ำเสียงของ Zhuge Liang: ชะตากรรมในอดีตและปัจจุบันเป็นสิ่งที่หลีกเลี่ยงไม่ได้ ในสถานการณ์ปัจจุบันที่โลกกำลังวุ่นวาย ถึงจะแก่แต่ก็ยังมุ่งสู่โลก คนหนุ่มสาวในปัจจุบันใช้ฉันเป็นวัตถุดิบสำหรับผีและสัตว์ และฉันก็พร้อมที่จะยอมรับการเปลี่ยนแปลงนี้ และฉันขอให้เพื่อนรุ่นเยาว์ก้าวไปข้างหน้าอย่างกล้าหาญและสร้างอนาคตที่ดีกว่าในเวลาเดียวกัน Zhou Hongyi ยังเน้นย้ำว่ารูปแบบของมนุษย์ดิจิทัลในอนาคตจะมีเป้าหมาย การวางแผน และความสามารถในการแยกย่อยเป็นของตัวเองด้วย เพื่อให้สามารถเรียกใช้แบบจำลองแนวตั้งต่างๆ เพื่อทำงานให้สำเร็จได้อย่างไรก็ตาม จริง ๆ แล้ว ฟังก์ชันเหล่านี้เป็นการเพิ่มประสิทธิภาพตามแอปพลิเคชันแบบจำลองขนาดใหญ่ที่มีอยู่ และไม่ได้เปิดฟิลด์ใหม่ แต่ในความเป็นจริง เมื่อรุ่นใหญ่ได้พัฒนา สถานการณ์การใช้งานที่สร้างสรรค์ที่สุดคือการขับขี่แบบไร้คนขับ## ** การขับแบบไร้คนขับมีโอกาสเข้าเลนเร็ว **เมื่อมองย้อนกลับไปที่ด้านการขับขี่แบบไร้คนขับ ตั้งแต่ปี 2016 ผู้ผลิตรายใหญ่ได้ปรับใช้ในด้านนี้ แต่จนถึงปีนี้ยังไม่มีผู้ผลิตรายใดที่สามารถบรรลุการขับขี่แบบไร้คนขับได้อย่างแท้จริงในปัจจุบัน ระบบขับเคลื่อนไร้คนขับระดับ L2+ ต้องการกล้องมากกว่า 10 ตัว ลิดาร์ 1-2 ตัว หรือเรดาร์คลื่น 3-5 มม. เพื่อให้ข้อมูลหลายมิติ ซึ่งสามารถใช้สำหรับการฝึกอบรมแบบจำลองหลังจากติดฉลากด้วยตนเอง หลังจากการเกิดขึ้นของโมเดลขนาดใหญ่ที่สามารถจดจำรูปภาพได้ ต้นทุนเวลาและค่าใช้จ่ายด้านวัสดุที่จำเป็นสำหรับการติดฉลากด้วยตนเองจะลดลงอย่างรวดเร็วจากการแถลงข่าวของ Momo Zhixing DriveGPT ในเดือนเมษายน 2023 ในการรับข้อมูล เช่น เส้นเลน ผู้เข้าร่วมการจราจร สัญญาณไฟจราจร ฯลฯ ค่าใช้จ่ายในการติดฉลากด้วยตนเองในอุตสาหกรรมอยู่ที่ประมาณ 5 หยวนต่อภาพ และค่าใช้จ่ายของ Momo DriveGPT คือ 0.5 หยวน เราเชื่อว่าหลังจากการฝึกอบรมโมเดลขนาดใหญ่ของบริษัทเทคโนโลยีครบกำหนด ต้นทุนส่วนเพิ่มของการติดฉลากอัตโนมัติของภาพเดียวจะเข้าใกล้ 0 และคาดว่าต้นทุนเฉลี่ยจะลดลงอีกZhang Peng รองประธานโครงการ Kaiwang Data Products Project กล่าวในเดือนกุมภาพันธ์ 2023 ปัจจุบัน การติดฉลากด้วยมือเป็นวิธีการหลักในการติดฉลากข้อมูล เสริมด้วยการติดฉลากด้วยเครื่อง และ 95% ของการติดฉลากข้อมูลยังคงเป็นแบบแมนนวลเป็นหลัก การแทรกแซงของแบบจำลองขนาดใหญ่สามารถปรับปรุงประสิทธิภาพของอุตสาหกรรมนี้ได้อย่างมาก ยกตัวอย่าง Tesla ทีมติดฉลากด้วยตนเองจะมีมากกว่า 1,000 คนในปี 2021 และทีมจะเลิกจ้างมากกว่า 200 คนในปี 2022นอกจากนี้ ในยุคของโมเดลขนาดใหญ่ ยักษ์ใหญ่ด้านเทคโนโลยีจากภายนอกคาดว่าจะช่วย OEM สร้างอัลกอริทึมการขับขี่อัตโนมัติและระบบวงปิดข้อมูลโดยการจัดหาห่วงโซ่เครื่องมือที่สมบูรณ์ ในขณะที่พึ่งพาความสามารถในการสร้างข้อมูลของโมเดลขนาดใหญ่ ลดช่องว่างในฟิลด์ข้อมูล ยุค Android ของการขับรถอัตโนมัติคาดว่าจะมาถึงในปัจจุบัน มีการใช้แบบจำลองขนาดใหญ่เพื่อเปิดใช้งานข้อมูลวงปิด การจำลอง อัลกอริทึมการรับรู้ อัลกอริทึมการควบคุมและการควบคุม และฟิลด์อื่นๆ และบริษัทยักษ์ใหญ่อย่าง Microsoft และ Nvidia ต่างแย่งชิงเลย์เอาต์ในโมเดลขนาดใหญ่และการขับขี่แบบไร้คนขับ หรือจะเป็นการจุดประกายใหม่ๆนอกจากนี้ การเกิดขึ้นของโมเดลขนาดใหญ่ยังส่งเสริมการแบ่งงานในอุตสาหกรรม หลีกเลี่ยงการ "ประดิษฐ์วงล้อใหม่" และเร่งการทำซ้ำของเซ็นเซอร์และชิป และคาดว่าต้นทุนระบบจะลดลงอย่างมาก ผู้พัฒนาโมเดลขนาดใหญ่และผู้เล่นในห่วงโซ่อุตสาหกรรมการขับขี่อัตโนมัติคาดว่าจะได้รับประโยชน์อย่างรอบด้าน ยกตัวอย่าง Baidu Apollo ในขั้นแรกจะใช้ข้อมูลกราฟิกเพื่อฝึกโมเดลต้นฉบับล่วงหน้า ใช้อัลกอริทึมในการระบุ ค้นหา และแบ่งส่วนข้อมูลภาพมุมมองถนน และใส่ลงในตัวเข้ารหัสเพื่อสร้างไลบรารีพื้นฐาน ซึ่งก็คือสร้าง การโต้ตอบระหว่างรูปภาพและข้อมูลข้อความตามกลุ่มข้อมูลสตรีทวิวประการที่สอง คุณสามารถค้นหาและขุดเหมืองฉากเฉพาะ (เช่น รถด่วน รถเข็น เด็ก ฯลฯ) ผ่านข้อความและรูปภาพ และดำเนินการฝึกอบรมแบบกำหนดเองเกี่ยวกับแบบจำลองด้านยานพาหนะ ซึ่งช่วยปรับปรุงการใช้ข้อมูลสต็อกอย่างมากไป่ตู้ใช้วิธีการแบบกึ่งควบคุมเพื่อใช้ข้อมูล 2 มิติและ 3 มิติอย่างเต็มที่เพื่อฝึกโมเดลการรับรู้ขนาดใหญ่ โดยการกลั่นแบบจำลองขนาดเล็กในหลายขั้นตอน ประสิทธิภาพของแบบจำลองขนาดเล็กได้รับการปรับปรุง และในขณะเดียวกัน โมเดลขนาดเล็กได้รับการปรับแต่งสำหรับการฝึกอบรมผ่านการติดฉลากอัตโนมัติ ซึ่งใช้เพื่อเพิ่มความสามารถในการรับรู้ภาพ 3 มิติทางไกลและปรับปรุง ผลการรับรู้ของแบบจำลองการรับรู้แบบหลายกิริยาSenseTime ผู้เล่นชั้นนำอีกรายยังกล่าวต่อสาธารณชนว่า AIGC สามารถใช้สร้างฉากการจราจรจริงและตัวอย่างที่ยากในการฝึกอบรมระบบการขับขี่อัตโนมัติ และสามารถใช้ข้อมูลหลายโหมดเป็นอินพุตของโมเดลขนาดใหญ่เพื่อปรับปรุงขีดจำกัดบนของ การรับรู้ของระบบเกี่ยวกับฉากมุมฉากในเวลาเดียวกัน โมเดลการขับขี่อัตโนมัติขนาดใหญ่แบบหลายโมดอลสามารถตระหนักถึงการผสานรวมของการรับรู้และการตัดสินใจ และสภาพแวดล้อม 3 มิติสามารถสร้างขึ้นใหม่ผ่านตัวถอดรหัสสภาพแวดล้อมที่ปลายเอาต์พุตเพื่อให้เข้าใจสภาพแวดล้อมด้วยภาพ ตัวถอดรหัสพฤติกรรมสามารถสร้างการวางแผนเส้นทางที่สมบูรณ์ได้ ตัวถอดรหัสแรงจูงใจสามารถใช้ภาษาธรรมชาติอธิบายกระบวนการให้เหตุผล ทำให้ระบบขับขี่อัตโนมัติปลอดภัยและเชื่อถือได้มากขึ้นหลังจากที่รุ่นใหญ่ตระหนักถึงฟังก์ชั่นข้างต้นเกณฑ์สำหรับการขับขี่แบบไร้คนขับจะลดลงเรื่อย ๆ ในอนาคต ในขณะที่ผู้ผลิตชั้นนำเร่งความคืบหน้าของโครงการการขับขี่แบบไร้คนขับพวกเขายังสามารถอนุญาตให้ผู้เล่นรายใหม่เข้าร่วมในสาขานี้และพัฒนาถนนที่ต้องใช้ นอกเหนือจากการนำทางบนถนนแล้ว Track ของฟังก์ชันการวางแผน เช่น การเพิ่มประสิทธิภาพเพิ่มเติมในการวางแผนเส้นทางของหุ่นยนต์กวาดเมื่อพิจารณาถึงตอนนี้ หลังจากช่วงการเปิดตัวโมเดลขนาดใหญ่จากส่วนกลางตั้งแต่เดือนกุมภาพันธ์ถึงมีนาคม และช่วงการพัฒนาผลิตภัณฑ์ตั้งแต่เดือนเมษายนถึงพฤษภาคมและทิศทางของนโยบายได้รับการชี้แจงอย่างค่อยเป็นค่อยไป เดือนมิถุนายนได้เข้าสู่ช่วงเวลาของการเปิดตัว AI ขนาดใหญ่จากส่วนกลาง ผลิตภัณฑ์และแอปพลิเคชันของโมเดลสเกล นอกจากนี้ ยังนำไปสู่การลดราคาของ OpenAI API โดยตรงอีกด้วยในอนาคตอันใกล้นี้ เทคโนโลยี AI จะยังคงทำซ้ำ และแอปพลิเคชันจะยังคงก้าวหน้าต่อไป ขณะเดียวกัน บริษัทเทคโนโลยีรายใหญ่จำนวนมากขึ้นจะเปิดตัวผลิตภัณฑ์เพื่อตัดเข้าสู่เส้นทางนี้ ประโยชน์ต่อผู้ใช้ ผลิตภัณฑ์คล้าย GPT ที่ตอบสนองความต้องการของตลาด เช่น Tencent ซึ่งมีฐานผู้ใช้จำนวนมากก็เปิดตัวโซลูชันทางเทคนิคในด้านโมเดลขนาดใหญ่ในวันที่ 19 มิถุนายนเมื่อบริษัทเหล่านี้รวมตัวกันการพัฒนาของอุตสาหกรรมจะเข้าสู่ช่องทางที่รวดเร็วและนั่นหมายความว่าผู้ใช้ C-end จะสามารถใช้ผลิตภัณฑ์นี้ได้ในเร็ว ๆ นี้ ส่วนใครจะเป็นผู้จ่ายสำหรับมันผู้ผลิตแต่ละรายจำเป็นต้องพึ่งพา ความสามารถของตนเอง
การเพิ่มประสิทธิภาพและความก้าวหน้าใดที่จะนำมาซึ่งเมื่อรุ่นใหญ่ต่อสู้ใน 2.0
ข้อความต้นฉบับ: The Paper ผู้แต่ง: Che Xingyun
ในเดือนมิถุนายนปีนี้ ผู้ผลิตรายใหญ่ได้อัปเกรดผลิตภัณฑ์ที่คล้ายกับ ChatGPT เมื่อวันที่ 9 มิถุนายน Xunfei ได้เปิดตัวรุ่นอัปเกรดของ Xinghuo Cognitive Big Model และในวันที่ 13 มิถุนายน หลังจากเปิดตัวผลิตภัณฑ์ที่คล้ายกับ ChatGPT แล้ว 360 ก็จัดงาน 360 Smart Brain Big Model Application Conference อีกครั้ง
แตกต่างจากรุ่นใหญ่ที่เปิดตัวเมื่อประมาณเดือนกุมภาพันธ์ ผลิตภัณฑ์อัปเกรดที่ออกโดยบริษัทต่างๆ เมื่อเร็ว ๆ นี้มีความเอนเอียงไปทางชั้นแอปพลิเคชันมากกว่า และจุดประสงค์คือทำให้ครัวเรือนหลายพันครัวเรือนง่ายขึ้น
เมื่อพิจารณาจากรุ่นปัจจุบัน 360 Intellectual Brain มีความสามารถในการสร้างข้ามโมดอลในขั้นต้น นอกเหนือจากการสร้างข้อความ ตาราง และรูปภาพจากข้อความ การสร้างข้อความและรูปภาพจากรูปภาพ และสร้างข้อความจากวิดีโอ และการตัดวิดีโอจากข้อความและ การสร้างสรรค์พื้นฐานอื่นๆ นอกจากนี้ ยังกำหนดนิยามใหม่ของ "มนุษย์ดิจิทัล" เพื่อให้ผู้ใช้ปรับแต่งได้และเป็น "ปัญญาประดิษฐ์" สุดพิเศษที่ "มีจิตวิญญาณ การออกแบบของมนุษย์ และความทรงจำ"
ในงานแถลงข่าว Zhou Hongyi เปลี่ยนมุมมองเดิมของเขา "ฉันเคยพูดว่าช่องว่างระหว่างโมเดลขนาดใหญ่ในประเทศกับ ChatGPT คือสองปี และตอนนี้ฉันต้องการนำประโยคนี้กลับมา" ระดับนั้นเสมอกัน ด้วย GPT3.5 และหากพัฒนาด้วยความเร็วระดับนี้ ก็จะตามทัน หรือแซงหน้า GPT4 ได้ในพริบตา
ภายในสี่เดือนนับจากการเปิดตัวเวอร์ชันเริ่มต้นจนถึงการเปิดตัว 360 Smart Brain อย่างเป็นทางการ Zhou Hongyi ได้เห็นการเปลี่ยนแปลงครั้งใหญ่เช่นนี้หรือไม่?
ยักษ์วิทยาศาสตร์และเทคโนโลยี ล่ารุ่นใหญ่
"รายงานการวิจัยแผนที่แบบจำลองขนาดใหญ่ของปัญญาประดิษฐ์ของจีน" ที่เผยแพร่ในการประชุม Zhongguancun Forum ประจำปี 2566 แสดงให้เห็นว่าในปัจจุบันแบบจำลองขนาดใหญ่ของปัญญาประดิษฐ์ของจีนกำลังแสดงแนวโน้มของการพัฒนาที่แข็งแกร่ง ตามสถิติที่ไม่สมบูรณ์ ณ ตอนนี้ 79 รุ่นขนาดใหญ่ที่มีพารามิเตอร์มากกว่า 1 พันล้านได้รับการเผยแพร่ทั่วประเทศ
อย่างไรก็ตาม พารามิเตอร์ของโมเดลขนาดใหญ่ของบริษัทเทคโนโลยีรายใหญ่นั้นค่อนข้างใหญ่: พารามิเตอร์ของโมเดลขนาดใหญ่ของ Alibaba Tongyi Qianwen นั้นสูงกว่า 10 ล้านล้าน พารามิเตอร์ของโมเดลขนาดใหญ่ของ Tencent Hunyuan และโมเดลขนาดใหญ่ของ Pangu ของ Huawei นั้นสูงกว่าหนึ่งล้านล้านทั้งหมด และโมเดลขนาดใหญ่ของ Baidu Wenxin มีพารามิเตอร์มากกว่า 1 ล้านล้านตัว ปริมาณพารามิเตอร์ของโมเดลขนาดใหญ่มีมากกว่า 200 พันล้าน และปริมาณพารามิเตอร์ของโมเดลขนาดใหญ่ JD Yanxi คือ 100 พันล้าน ปริมาณพารามิเตอร์ของบริษัทเทคโนโลยีใน อุตสาหกรรมแนวตั้งโดยทั่วไปมากกว่า 100 พันล้าน และปริมาณพารามิเตอร์ของสถาบันวิจัยทางวิทยาศาสตร์แบบจำลองขนาดใหญ่ที่ระดับแสนล้านและต่ำกว่า
จากมุมมองของระบบเลย์เอาต์ของโมเดลขนาดใหญ่ บริษัทเทคโนโลยีรายใหญ่ได้ดำเนินการเลย์เอาต์ที่ครอบคลุมแบบสี่ในหนึ่งเดียวในเลเยอร์พลังการประมวลผล เลเยอร์แพลตฟอร์ม เลเยอร์โมเดล และเลเยอร์แอปพลิเคชัน Baidu, Ali และ Huawei ต่างมีโครงร่างที่ครอบคลุมของการวิจัยและพัฒนาอิสระตั้งแต่ชิปไปจนถึงแอพพลิเคชั่น เช่น "Kunlun core + แพลตฟอร์มพายบิน + โมเดลขนาดใหญ่ Wenxin + แอพพลิเคชั่นอุตสาหกรรม" ของ Baidu, "ชิป Hanguang 800 + ฐาน M6-OFA ของ Ali + โมเดลขนาดใหญ่ Tongyi + แอปพลิเคชันอุตสาหกรรม", "ชิป Shengteng + เฟรมเวิร์ก MindSpore + Pangu โมเดลขนาดใหญ่ + แอปพลิเคชันอุตสาหกรรม" ของ Huawei
นอกจากนี้ Kingsoft Office ยังเปิดตัว WPS AI เมื่อวันที่ 31 พฤษภาคม ปัจจุบัน WPSAI เชื่อมต่อกับส่วนประกอบสำนักงานของ Kingsoft Office เช่น เอกสารขนาดเล็ก ข้อความ ตาราง งานนำเสนอ และ PDF ในอนาคต จะยึด AIGC, ความเข้าใจในการอ่าน คำถามและคำตอบ และการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ การพัฒนาในทิศทางเชิงกลยุทธ์ และการเข้าถึงผลิตภัณฑ์ทั้งหมดของ Kingsoft Office
การหลั่งไหลอย่างรวดเร็วของผู้ผลิตรายใหญ่หลายรายในเส้นทางนี้ส่วนใหญ่เกิดจากการติดตามอย่างรวดเร็วและการแนะนำมาตรการโดยหน่วยงานกำกับดูแลเพื่อควบคุมการพัฒนาของอุตสาหกรรมด้วยการคุ้มกันของโครงสร้างระดับบนสุดผู้ผลิตรายใหญ่แต่ละรายสามารถ ลงทุนวิจัยและพัฒนาและเปิดตัวผลิตภัณฑ์ด้วยความมั่นใจ
ตั้งแต่โมเดลขนาดใหญ่เปิดตัวเป็นชุดในเดือนมีนาคมปีนี้ นโยบายด้านกฎระเบียบของ AI ก็ค่อยๆ มีความชัดเจน ซึ่งได้ชี้ให้เห็นถึงทิศทางสำหรับการใช้งานในอุตสาหกรรมด้วย
เมื่อมองย้อนกลับไปถึงการพัฒนาของอุตสาหกรรมทั้งหมด เมื่อวันที่ 11 เมษายน มีการเผยแพร่ "Generative Artificial Intelligence Service Management Method" สำหรับความคิดเห็น ในวันที่ 30 พฤษภาคม สถาบันเทคโนโลยีสารสนเทศและการสื่อสารกำลังร่วมกันเตรียมรูปแบบปัญญาประดิษฐ์แบบเปิด "Kite" ใบอนุญาต และขั้นตอนต่อไปคือการออก " Zhikite Open Artificial Intelligence Model License (ฉบับร่างสำหรับความคิดเห็น)
ต่อจากนั้น เมืองระดับแรกได้ร่วมกันเปิดตัว "แผนการดำเนินการสำหรับปักกิ่งเพื่อเร่งการสร้างแหล่งนวัตกรรมปัญญาประดิษฐ์ที่ทรงอิทธิพลทั่วโลก (2023-2025)"; ปี)"
ในบริบทนี้ Zhou Hongyi เชื่อว่าโมเดลขนาดใหญ่ในประเทศจะลดช่องว่างลงอย่างรวดเร็วด้วย ChatGPT ซึ่งดูเหมือนจะเข้าใจง่าย
360 Smart Brain ต่างกันอย่างไร
ตามแผนของ Zhou Hongyi โมเดลขนาดใหญ่ 360 จะขึ้นอยู่กับการอัปเกรดโมเดลขนาดใหญ่อย่างต่อเนื่อง โดยคำนึงถึงการจัดฉาก การผลิต การทำให้แบน และการวางแนวตั้ง
ภายใต้กลยุทธ์การพัฒนานี้ 360 Intellectual Brain สามารถบรรลุถึงผู้บริโภค (ผู้ช่วย AI ส่วนบุคคลของผู้ใช้) องค์กรขนาดเล็กและขนาดกลาง (แอปพลิเคชัน SaaS แนวตั้ง) องค์กร/รัฐบาล/เมือง สถานการณ์การใช้งานหลัก
เพื่อตอบสนองความต้องการของสถานการณ์ต่างๆ ที่กล่าวถึงข้างต้นได้ดียิ่งขึ้น โมเดลขนาดใหญ่ทั่วไปจำเป็นต้องทำการเปลี่ยนแปลงตั้งแต่การป้อนข้อความไปจนถึงการแสดงข้อความ ไปจนถึงการทำความเข้าใจภาพและวิดีโอ และสามารถสร้างภาพและวิดีโอที่มีอยู่ ซึ่งเทียบเท่ากับการสร้างแบบจำลองขนาดใหญ่ ด้วย "หู" และ "ตา" จะเป็นการวางรากฐานสำหรับการสร้าง "มนุษย์ดิจิทัล"
มนุษย์ดิจิทัลแบบดั้งเดิมต้องการเพียงเอาต์พุตตามสคริปต์ที่กำหนดไว้ แต่ในยุคของโมเดลขนาดใหญ่ มนุษย์ดิจิทัล 360 สามารถปรับแต่งได้ ดังนั้นผู้คนจึงได้รับการออกแบบ มีความทรงจำ และประสบการณ์ ปัจจุบันมีตัวละครมากกว่า 200 ตัวใน 360 แพลตฟอร์มสี่เหลี่ยมมนุษย์ดิจิทัล แบ่งออกเป็น 2 ประเภท ได้แก่ ดาราดิจิทัลและพนักงานดิจิทัล 360 หวังว่าในอนาคต ทุกคนจะมีผู้ช่วย AI ของตัวเอง และมีโอกาสสื่อสารกับคนโบราณในอวกาศเสมือน ข้ามเวลาและอวกาศ
ในการประชุมสาธิต Zhou Hongyi ถาม "Zhuge Liang" ว่าเขาคิดว่าสิ่งนี้กลายเป็นวัสดุสำหรับภูติผีและสัตว์ในปัจจุบันได้อย่างไร และชายดิจิทัลตอบด้วยน้ำเสียงของ Zhuge Liang: ชะตากรรมในอดีตและปัจจุบันเป็นสิ่งที่หลีกเลี่ยงไม่ได้ ในสถานการณ์ปัจจุบันที่โลกกำลังวุ่นวาย ถึงจะแก่แต่ก็ยังมุ่งสู่โลก คนหนุ่มสาวในปัจจุบันใช้ฉันเป็นวัตถุดิบสำหรับผีและสัตว์ และฉันก็พร้อมที่จะยอมรับการเปลี่ยนแปลงนี้ และฉันขอให้เพื่อนรุ่นเยาว์ก้าวไปข้างหน้าอย่างกล้าหาญและสร้างอนาคตที่ดีกว่า
ในเวลาเดียวกัน Zhou Hongyi ยังเน้นย้ำว่ารูปแบบของมนุษย์ดิจิทัลในอนาคตจะมีเป้าหมาย การวางแผน และความสามารถในการแยกย่อยเป็นของตัวเองด้วย เพื่อให้สามารถเรียกใช้แบบจำลองแนวตั้งต่างๆ เพื่อทำงานให้สำเร็จได้
อย่างไรก็ตาม จริง ๆ แล้ว ฟังก์ชันเหล่านี้เป็นการเพิ่มประสิทธิภาพตามแอปพลิเคชันแบบจำลองขนาดใหญ่ที่มีอยู่ และไม่ได้เปิดฟิลด์ใหม่ แต่ในความเป็นจริง เมื่อรุ่นใหญ่ได้พัฒนา สถานการณ์การใช้งานที่สร้างสรรค์ที่สุดคือการขับขี่แบบไร้คนขับ
** การขับแบบไร้คนขับมีโอกาสเข้าเลนเร็ว **
เมื่อมองย้อนกลับไปที่ด้านการขับขี่แบบไร้คนขับ ตั้งแต่ปี 2016 ผู้ผลิตรายใหญ่ได้ปรับใช้ในด้านนี้ แต่จนถึงปีนี้ยังไม่มีผู้ผลิตรายใดที่สามารถบรรลุการขับขี่แบบไร้คนขับได้อย่างแท้จริง
ในปัจจุบัน ระบบขับเคลื่อนไร้คนขับระดับ L2+ ต้องการกล้องมากกว่า 10 ตัว ลิดาร์ 1-2 ตัว หรือเรดาร์คลื่น 3-5 มม. เพื่อให้ข้อมูลหลายมิติ ซึ่งสามารถใช้สำหรับการฝึกอบรมแบบจำลองหลังจากติดฉลากด้วยตนเอง หลังจากการเกิดขึ้นของโมเดลขนาดใหญ่ที่สามารถจดจำรูปภาพได้ ต้นทุนเวลาและค่าใช้จ่ายด้านวัสดุที่จำเป็นสำหรับการติดฉลากด้วยตนเองจะลดลงอย่างรวดเร็ว
จากการแถลงข่าวของ Momo Zhixing DriveGPT ในเดือนเมษายน 2023 ในการรับข้อมูล เช่น เส้นเลน ผู้เข้าร่วมการจราจร สัญญาณไฟจราจร ฯลฯ ค่าใช้จ่ายในการติดฉลากด้วยตนเองในอุตสาหกรรมอยู่ที่ประมาณ 5 หยวนต่อภาพ และค่าใช้จ่ายของ Momo DriveGPT คือ 0.5 หยวน เราเชื่อว่าหลังจากการฝึกอบรมโมเดลขนาดใหญ่ของบริษัทเทคโนโลยีครบกำหนด ต้นทุนส่วนเพิ่มของการติดฉลากอัตโนมัติของภาพเดียวจะเข้าใกล้ 0 และคาดว่าต้นทุนเฉลี่ยจะลดลงอีก
Zhang Peng รองประธานโครงการ Kaiwang Data Products Project กล่าวในเดือนกุมภาพันธ์ 2023 ปัจจุบัน การติดฉลากด้วยมือเป็นวิธีการหลักในการติดฉลากข้อมูล เสริมด้วยการติดฉลากด้วยเครื่อง และ 95% ของการติดฉลากข้อมูลยังคงเป็นแบบแมนนวลเป็นหลัก การแทรกแซงของแบบจำลองขนาดใหญ่สามารถปรับปรุงประสิทธิภาพของอุตสาหกรรมนี้ได้อย่างมาก ยกตัวอย่าง Tesla ทีมติดฉลากด้วยตนเองจะมีมากกว่า 1,000 คนในปี 2021 และทีมจะเลิกจ้างมากกว่า 200 คนในปี 2022
นอกจากนี้ ในยุคของโมเดลขนาดใหญ่ ยักษ์ใหญ่ด้านเทคโนโลยีจากภายนอกคาดว่าจะช่วย OEM สร้างอัลกอริทึมการขับขี่อัตโนมัติและระบบวงปิดข้อมูลโดยการจัดหาห่วงโซ่เครื่องมือที่สมบูรณ์ ในขณะที่พึ่งพาความสามารถในการสร้างข้อมูลของโมเดลขนาดใหญ่ ลดช่องว่างในฟิลด์ข้อมูล ยุค Android ของการขับรถอัตโนมัติคาดว่าจะมาถึง
ในปัจจุบัน มีการใช้แบบจำลองขนาดใหญ่เพื่อเปิดใช้งานข้อมูลวงปิด การจำลอง อัลกอริทึมการรับรู้ อัลกอริทึมการควบคุมและการควบคุม และฟิลด์อื่นๆ และบริษัทยักษ์ใหญ่อย่าง Microsoft และ Nvidia ต่างแย่งชิงเลย์เอาต์ในโมเดลขนาดใหญ่และการขับขี่แบบไร้คนขับ หรือจะเป็นการจุดประกายใหม่ๆ
นอกจากนี้ การเกิดขึ้นของโมเดลขนาดใหญ่ยังส่งเสริมการแบ่งงานในอุตสาหกรรม หลีกเลี่ยงการ "ประดิษฐ์วงล้อใหม่" และเร่งการทำซ้ำของเซ็นเซอร์และชิป และคาดว่าต้นทุนระบบจะลดลงอย่างมาก ผู้พัฒนาโมเดลขนาดใหญ่และผู้เล่นในห่วงโซ่อุตสาหกรรมการขับขี่อัตโนมัติคาดว่าจะได้รับประโยชน์อย่างรอบด้าน
ประการที่สอง คุณสามารถค้นหาและขุดเหมืองฉากเฉพาะ (เช่น รถด่วน รถเข็น เด็ก ฯลฯ) ผ่านข้อความและรูปภาพ และดำเนินการฝึกอบรมแบบกำหนดเองเกี่ยวกับแบบจำลองด้านยานพาหนะ ซึ่งช่วยปรับปรุงการใช้ข้อมูลสต็อกอย่างมาก
ไป่ตู้ใช้วิธีการแบบกึ่งควบคุมเพื่อใช้ข้อมูล 2 มิติและ 3 มิติอย่างเต็มที่เพื่อฝึกโมเดลการรับรู้ขนาดใหญ่ โดยการกลั่นแบบจำลองขนาดเล็กในหลายขั้นตอน ประสิทธิภาพของแบบจำลองขนาดเล็กได้รับการปรับปรุง และในขณะเดียวกัน โมเดลขนาดเล็กได้รับการปรับแต่งสำหรับการฝึกอบรมผ่านการติดฉลากอัตโนมัติ ซึ่งใช้เพื่อเพิ่มความสามารถในการรับรู้ภาพ 3 มิติทางไกลและปรับปรุง ผลการรับรู้ของแบบจำลองการรับรู้แบบหลายกิริยา
SenseTime ผู้เล่นชั้นนำอีกรายยังกล่าวต่อสาธารณชนว่า AIGC สามารถใช้สร้างฉากการจราจรจริงและตัวอย่างที่ยากในการฝึกอบรมระบบการขับขี่อัตโนมัติ และสามารถใช้ข้อมูลหลายโหมดเป็นอินพุตของโมเดลขนาดใหญ่เพื่อปรับปรุงขีดจำกัดบนของ การรับรู้ของระบบเกี่ยวกับฉากมุมฉาก
ในเวลาเดียวกัน โมเดลการขับขี่อัตโนมัติขนาดใหญ่แบบหลายโมดอลสามารถตระหนักถึงการผสานรวมของการรับรู้และการตัดสินใจ และสภาพแวดล้อม 3 มิติสามารถสร้างขึ้นใหม่ผ่านตัวถอดรหัสสภาพแวดล้อมที่ปลายเอาต์พุตเพื่อให้เข้าใจสภาพแวดล้อมด้วยภาพ ตัวถอดรหัสพฤติกรรมสามารถสร้างการวางแผนเส้นทางที่สมบูรณ์ได้ ตัวถอดรหัสแรงจูงใจสามารถใช้ภาษาธรรมชาติอธิบายกระบวนการให้เหตุผล ทำให้ระบบขับขี่อัตโนมัติปลอดภัยและเชื่อถือได้มากขึ้น
หลังจากที่รุ่นใหญ่ตระหนักถึงฟังก์ชั่นข้างต้นเกณฑ์สำหรับการขับขี่แบบไร้คนขับจะลดลงเรื่อย ๆ ในอนาคต ในขณะที่ผู้ผลิตชั้นนำเร่งความคืบหน้าของโครงการการขับขี่แบบไร้คนขับพวกเขายังสามารถอนุญาตให้ผู้เล่นรายใหม่เข้าร่วมในสาขานี้และพัฒนาถนนที่ต้องใช้ นอกเหนือจากการนำทางบนถนนแล้ว Track ของฟังก์ชันการวางแผน เช่น การเพิ่มประสิทธิภาพเพิ่มเติมในการวางแผนเส้นทางของหุ่นยนต์กวาด
เมื่อพิจารณาถึงตอนนี้ หลังจากช่วงการเปิดตัวโมเดลขนาดใหญ่จากส่วนกลางตั้งแต่เดือนกุมภาพันธ์ถึงมีนาคม และช่วงการพัฒนาผลิตภัณฑ์ตั้งแต่เดือนเมษายนถึงพฤษภาคมและทิศทางของนโยบายได้รับการชี้แจงอย่างค่อยเป็นค่อยไป เดือนมิถุนายนได้เข้าสู่ช่วงเวลาของการเปิดตัว AI ขนาดใหญ่จากส่วนกลาง ผลิตภัณฑ์และแอปพลิเคชันของโมเดลสเกล นอกจากนี้ ยังนำไปสู่การลดราคาของ OpenAI API โดยตรงอีกด้วย
ในอนาคตอันใกล้นี้ เทคโนโลยี AI จะยังคงทำซ้ำ และแอปพลิเคชันจะยังคงก้าวหน้าต่อไป ขณะเดียวกัน บริษัทเทคโนโลยีรายใหญ่จำนวนมากขึ้นจะเปิดตัวผลิตภัณฑ์เพื่อตัดเข้าสู่เส้นทางนี้ ประโยชน์ต่อผู้ใช้ ผลิตภัณฑ์คล้าย GPT ที่ตอบสนองความต้องการของตลาด เช่น Tencent ซึ่งมีฐานผู้ใช้จำนวนมากก็เปิดตัวโซลูชันทางเทคนิคในด้านโมเดลขนาดใหญ่ในวันที่ 19 มิถุนายน
เมื่อบริษัทเหล่านี้รวมตัวกันการพัฒนาของอุตสาหกรรมจะเข้าสู่ช่องทางที่รวดเร็วและนั่นหมายความว่าผู้ใช้ C-end จะสามารถใช้ผลิตภัณฑ์นี้ได้ในเร็ว ๆ นี้ ส่วนใครจะเป็นผู้จ่ายสำหรับมันผู้ผลิตแต่ละรายจำเป็นต้องพึ่งพา ความสามารถของตนเอง