โมเดลขนาดใหญ่ 79 รายการที่มีพารามิเตอร์มากกว่า 1 พันล้านรายการได้รับการเผยแพร่ในประเทศจีน โดยเน้นที่ปักกิ่งและกวางตุ้ง

ที่มา: นสพ

นักข่าวจางจิง

ตามสถิติที่ไม่สมบูรณ์ ในปัจจุบัน มีการเผยแพร่แบบจำลองขนาดใหญ่ 79 รายการที่มีมาตราส่วนมากกว่า 1 พันล้านพารามิเตอร์ในจีน และ 14 จังหวัด/ภูมิภาคกำลังดำเนินการวิจัยและพัฒนาแบบจำลองขนาดใหญ่ โดยเน้นที่ปักกิ่งเป็นหลักและ Guangdong ซึ่ง 38 โมเดลขนาดใหญ่ในปักกิ่งและ 20 โมเดลขนาดใหญ่ในกวางตุ้ง ในบรรดาโมเดลขนาดใหญ่ในจีน โมเดลขนาดใหญ่กว่าครึ่งเป็นแบบโอเพ่นซอร์ส และมหาวิทยาลัย/สถาบันวิจัยทางวิทยาศาสตร์เป็นกำลังหลักของโอเพ่นซอร์ส

·ปักกิ่ง เจียงซู กวางตุ้ง เซี่ยงไฮ้ ฯลฯ เป็นพื้นที่ที่มีความสามารถด้านโมเดลขนาดใหญ่ค่อนข้างมาก โดยให้การสนับสนุนทางปัญญาที่สำคัญสำหรับการวิจัยและพัฒนาโมเดลขนาดใหญ่ อย่างไรก็ตาม จำนวนความสามารถทั้งหมดยังค่อนข้างหายาก โมเดลขนาดใหญ่มีเกณฑ์สูงและต้องการพรสวรรค์ด้าน AI คุณภาพสูง ในปัจจุบัน จำนวนของความสามารถโมเดลขนาดใหญ่ในที่ต่างๆ ไม่เพียงพอ

แหล่งที่มาของรูปภาพ: สร้างโดยเครื่องมือ Unbounded AI

มีโมเดลขนาดใหญ่ 79 รายการที่มีพารามิเตอร์มากกว่า 1 พันล้านพารามิเตอร์ในจีน โดยเน้นที่ปักกิ่งและกวางตุ้งเป็นหลัก

เมื่อวันที่ 28 พฤษภาคม ที่ฟอรัมการพัฒนาแบบจำลองขนาดใหญ่ของปัญญาประดิษฐ์ ซึ่งเป็นหนึ่งในฟอรัมคู่ขนานของฟอรัมจงกวนชุนปี 2023 จ้าว จื้อหยุน ผู้อำนวยการสถาบันข้อมูลวิทยาศาสตร์และเทคโนโลยีแห่งประเทศจีน ได้เผยแพร่ "รายงานการวิจัยเกี่ยวกับแผนที่แบบจำลองขนาดใหญ่ของปัญญาประดิษฐ์ของจีน ปัจจุบัน แบบจำลองขนาดใหญ่ของจีนมีมากกว่า 1 พันล้านพารามิเตอร์ ได้รับการเผยแพร่แล้ว ส่วนใหญ่อยู่ในปักกิ่งและกวางตุ้ง รวมถึงแบบจำลองขนาดใหญ่ 38 แบบจำลองในปักกิ่ง และแบบจำลองขนาดใหญ่ 20 แบบจำลองในมณฑลกวางตุ้ง ในบรรดาโมเดลขนาดใหญ่ในจีน โมเดลขนาดใหญ่กว่าครึ่งเป็นแบบโอเพ่นซอร์ส และมหาวิทยาลัย/สถาบันวิจัยทางวิทยาศาสตร์เป็นกำลังหลักของโอเพ่นซอร์ส

โครงสร้างเครือข่าย Transformer ที่เปิดตัวโดย Google ในปี 2560 เป็นเทคโนโลยีต้นทางของการพัฒนาโมเดลขนาดใหญ่ ตั้งแต่นั้นมา เทคโนโลยีโมเดลขนาดใหญ่ก็บรรลุความก้าวหน้าทางเทคโนโลยีอันโดดเด่นในด้านความเข้าใจภาษาธรรมชาติ คอมพิวเตอร์วิทัศน์ และเสียงอัจฉริยะ ความสามารถทั่วไปและด้านอื่นๆ ได้พัฒนาอย่างก้าวกระโดด ChatGPT ได้กระตุ้นการเกิดขึ้นอย่างรวดเร็วของโมเดลภาษาขนาดใหญ่ และยังดึงดูดทีม R&D จำนวนมากให้ลงทุนในการพัฒนาโมเดลขนาดใหญ่มากขึ้น เช่น การมองเห็นทั่วไปและการทำงานหลายรูปแบบ Zhao Zhiyun กล่าวว่าในเวลาเพียง 5 ปี เทคโนโลยีโมเดลขนาดใหญ่ได้ก่อตัวเป็นกลุ่มเทคโนโลยีขนาดใหญ่ และได้รับตระกูลโมเดลขนาดใหญ่ที่ครอบคลุมมาตราส่วนพารามิเตอร์ต่างๆ สถาปัตยกรรมทางเทคนิคต่างๆ โหมดต่างๆ และสถานการณ์ต่างๆ

เมื่อพิจารณาจากแนวโน้มการพัฒนาโมเดลขนาดใหญ่ทั่วโลก องค์กรต่างๆ เช่น Google และ OpenAI ในสหรัฐอเมริกายังคงเป็นผู้นำแถวหน้าของเทคโนโลยีโมเดลขนาดใหญ่ และทีม R&D ในยุโรป รัสเซีย อิสราเอล ฯลฯ จำนวนมากขึ้นเรื่อยๆ รวมถึงลงทุนวิจัยและพัฒนาแบบจำลองขนาดใหญ่ เมื่อพิจารณาจากการจัดจำหน่ายโมเดลขนาดใหญ่ที่วางจำหน่ายทั่วโลก จีนและสหรัฐฯ เป็นผู้นำด้วยอัตรากำไรขั้นต้นที่มาก คิดเป็นกว่า 80% ของยอดรวมทั่วโลก สหรัฐอเมริกา ได้รับการจัดอันดับสูงสุดในโลกเสมอในแง่ของ จำนวนรุ่นขนาดใหญ่แนวโน้มเติบโตพร้อมๆ

ในแนวโน้มการพัฒนาโมเดลขนาดใหญ่ในจีน Zhao Zhiyun กล่าวว่าตามสถิติที่ไม่สมบูรณ์ จนถึงปัจจุบันมีการเปิดตัวโมเดลขนาดใหญ่ 79 รายการที่มีขนาดมากกว่า 1 พันล้านพารามิเตอร์ในจีน และ 14 จังหวัด/ภูมิภาคกำลังดำเนินการวิจัยและพัฒนา โมเดลขนาดใหญ่ ส่วนใหญ่อยู่ในปักกิ่งและกวางตุ้ง รวมถึงโมเดลขนาดใหญ่ 38 ตัวในปักกิ่ง และโมเดลขนาดใหญ่ 20 ตัวในกวางตุ้ง ในแง่ของการกระจายโดเมนโมเดล การประมวลผลภาษาธรรมชาติยังคงเป็นพื้นที่โฟกัสที่ใช้งานมากที่สุดสำหรับการวิจัยและพัฒนาโมเดลขนาดใหญ่ รองลงมาคือโดเมนต่อเนื่องหลายรูปแบบ และยังมีโมเดลขนาดใหญ่น้อยกว่าในด้านการมองเห็นด้วยคอมพิวเตอร์และเสียงอัจฉริยะ ในแง่ของการกระจายหัวข้อการวิจัยและพัฒนา หัวข้อนวัตกรรมต่างๆ เช่น มหาวิทยาลัย สถาบันวิจัยทางวิทยาศาสตร์ และองค์กรต่าง ๆ ต่างก็มีส่วนร่วมในการวิจัยและพัฒนาแบบจำลองขนาดใหญ่ และการวิจัยและพัฒนาร่วมกันระหว่างสถาบันการศึกษาและอุตสาหกรรมยังไม่เพียงพอ "โมเดลขนาดใหญ่ได้รับการพัฒนาอย่างรวดเร็วตั้งแต่ต้นปีนี้ แต่เราก็สังเกตเห็นแนวโน้มของความร่วมมือที่หดตัวลง และเราต้องให้ความสนใจเป็นลำดับต่อไป"

ในเวลาเดียวกัน ระดับการจับคู่โมเดลพลังงานคอมพิวเตอร์อยู่ในระดับสูง และพลังการประมวลผลสาธารณะก็พัฒนาอย่างรวดเร็ว ปักกิ่ง กวางตุ้ง เจ้อเจียง เซี่ยงไฮ้ และสถานที่อื่นๆ มีโมเดลขนาดใหญ่จำนวนมากที่สุด และสี่แห่งนี้ยังเป็นพื้นที่ที่มีการซื้อเซิร์ฟเวอร์ปัญญาประดิษฐ์สูงสุดในช่วงสามปีที่ผ่านมา ท้องถิ่นยังเสริมความต้องการที่เพิ่มขึ้นอย่างรวดเร็วสำหรับพลังการประมวลผลปัญญาประดิษฐ์ด้วยการจัดหาพลังการประมวลผลสาธารณะ และให้การสนับสนุนพลังการประมวลผลที่มากขึ้นสำหรับการวิจัยและพัฒนาโมเดลขนาดใหญ่

ความสามารถพิเศษยังเป็นเสาหลักที่สำคัญของปัญญาประดิษฐ์ ปักกิ่ง เจียงซู กวางตุ้ง เซี่ยงไฮ้ และอื่น ๆ เป็นภูมิภาคที่มีความสามารถด้านโมเดลขนาดใหญ่ค่อนข้างมาก โดยให้การสนับสนุนทางปัญญาที่สำคัญสำหรับการวิจัยและพัฒนาโมเดลขนาดใหญ่ อย่างไรก็ตาม จำนวนความสามารถทั้งหมดยังค่อนข้างหายาก โมเดลขนาดใหญ่มีเกณฑ์สูงและต้องการพรสวรรค์ด้าน AI คุณภาพสูง ในปัจจุบัน จำนวนของความสามารถโมเดลขนาดใหญ่ในที่ต่างๆ ไม่เพียงพอ

"จากการเปิดตัวเอกสารแบบจำลองขนาดใหญ่ เราจะเห็นได้ว่าอิทธิพลทางวิชาการของแบบจำลองขนาดใหญ่ของจีนค่อยๆ ก่อตัวขึ้น จากมุมมองของอิทธิพลในระดับภูมิภาค ปักกิ่ง กวางตุ้ง และเซี่ยงไฮ้เป็นประเทศที่มีจำนวนมากที่สุดในแง่ของจำนวนเอกสาร และจำนวนการอ้างอิงเอกสาร" Zhao Zhiyun กล่าวว่าเอกสารโมเดล CogView ที่พัฒนาร่วมกันโดยมหาวิทยาลัยซิงหัว โดย Ali และ Baidu มีจำนวนการอ้างอิงสูงสุด อย่างไรก็ตาม เมื่อเทียบกับอิทธิพลทางวิชาการของนางแบบรุ่นใหญ่ชั้นนำจากต่างประเทศ ยังคงมีช่องว่างอยู่มาก

จากมุมมองของระบบนิเวศนวัตกรรมโอเพ่นซอร์ส โมเดลขนาดใหญ่กว่าครึ่งในจีนเป็นโอเพ่นซอร์ส และปักกิ่ง กวางตุ้ง และเซี่ยงไฮ้เป็นหนึ่งในสามอันดับแรกของประเทศในแง่ของจำนวนและอิทธิพลของโอเพ่นซอร์ส มหาวิทยาลัย/สถาบันวิจัยทางวิทยาศาสตร์เป็นกำลังหลักของโอเพ่นซอร์ส "ChatGLM-6B ของมหาวิทยาลัยซิงหัว, MOSS ของมหาวิทยาลัยฟู่ตัน และโมเดลสเกลขนาดใหญ่ชุด Wenxin ของไป่ตู้ มีอิทธิพลสูงสุดต่อโอเพ่นซอร์ส" Zhao Zhiyun กล่าว

การประยุกต์ใช้งานด้านอุตสาหกรรมของแบบจำลองขนาดใหญ่ของจีนพัฒนาไปตามสองเส้นทาง ทางแรกคือ การขยายตัวอย่างต่อเนื่องของขอบเขตการประยุกต์ใช้แบบจำลองขนาดใหญ่สำหรับวัตถุประสงค์ทั่วไป แบบจำลองขนาดใหญ่กำลังพัฒนาอย่างรวดเร็วเพื่อสร้างปัญญาประดิษฐ์ทั่วไปข้ามอุตสาหกรรม แพลตฟอร์มความสามารถและอุตสาหกรรมแอปพลิเคชันกำลังเร่งการรุกจากสำนักงาน ชีวิต และความบันเทิง ไปจนถึงการรักษาพยาบาล อุตสาหกรรม และการศึกษา ประการที่สองคือการเพิ่มความลึกอย่างต่อเนื่องของแบบจำลองขนาดใหญ่ระดับมืออาชีพในเขตแนวตั้ง กลุ่มของแบบจำลองขนาดใหญ่ระดับมืออาชีพสำหรับสาขาแนวตั้ง เช่น ชีวเวชศาสตร์และอุตุนิยมวิทยาการสำรวจระยะไกลให้ประโยชน์เต็มที่กับข้อได้เปรียบเชิงลึกของพวกเขาในภาคสนามและมอบมืออาชีพคุณภาพสูง โซลูชันสำหรับสถานการณ์ทางธุรกิจเฉพาะ

สนับสนุนการเสริมสร้างการวางแผนโดยรวมของทรัพยากรและกองกำลังวิจัยและพัฒนา และส่งเสริมการพัฒนาแบบจำลองขนาดใหญ่อย่างเป็นระเบียบ

เนื่องจากโมเดลขนาดใหญ่ขาดการพัฒนา Zhao Zhiyun จึงเสนอข้อเสนอแนะและโอกาส 4 ข้อ:

หนึ่งคือการเสริมสร้างการวางแผนโดยรวมของทรัพยากรและกองกำลังวิจัยและพัฒนาเพื่อส่งเสริมการพัฒนาแบบจำลองขนาดใหญ่อย่างเป็นระเบียบ โดยการเสริมสร้างการวางแผนโดยรวมของทรัพยากรคอมพิวเตอร์ เช่น ศูนย์คอมพิวเตอร์อัจฉริยะ ศูนย์ซูเปอร์คอมพิวเตอร์ และศูนย์คอมพิวเตอร์คลาวด์ กำหนดแคตตาล็อกการแบ่งปันข้อมูลสาธารณะและกฎการแบ่งปัน และส่งเสริมการเปิดการจัดประเภทและการจัดหมวดหมู่ข้อมูลอย่างเป็นระเบียบ

ประการที่สองคือการเร่งการวิจัยขั้นพื้นฐานและนวัตกรรมทางเทคโนโลยี และเพิ่มอิทธิพลทางวิชาการและโอเพ่นซอร์ส เทคโนโลยีแบบจำลองขนาดใหญ่ยังอยู่ในช่วงเริ่มต้นของการพัฒนา และมีศักยภาพสูงสำหรับทฤษฎีพื้นฐานและนวัตกรรมทางเทคโนโลยี ด้วยเทคนิคการย่อขนาด เช่น การกลั่นและการหาปริมาณ โมเดลจะ "บางลง" โดยให้การสนับสนุนทางเทคนิคสำหรับการย่อขนาดและการพัฒนาที่เป็นมิตรต่อสิ่งแวดล้อมของโมเดลขนาดใหญ่ การเสริมสร้างความร่วมมือด้านการวิจัยระหว่างอุตสาหกรรม มหาวิทยาลัย และการสนับสนุนโอเพ่นซอร์สของแบบจำลองขนาดใหญ่จะช่วยเร่งความก้าวหน้าทางเทคโนโลยีของแบบจำลองขนาดใหญ่

ประการที่สามคือการเสริมสร้างบทบาทนำของฉากในการพัฒนาแบบจำลองขนาดใหญ่ และสร้างโครงการมาตรฐานสำหรับแบบจำลองขนาดใหญ่ ตามชุดข้อมูลการฝึกอบรมเฉพาะอุตสาหกรรม สร้างโมเดลขนาดใหญ่ระดับมืออาชีพในสาขาการเงิน การรักษาพยาบาล และพลังงานไฟฟ้า และบรรลุความก้าวหน้าด้านแอปพลิเคชันคุณภาพสูงในสถานการณ์ทางธุรกิจเฉพาะ นอกจากนี้ เรายังหวังว่าจะส่งเสริมการอัปเกรดซ้ำของโมเดลขนาดใหญ่ เทคโนโลยีผ่านสถานการณ์ของแอปพลิเคชันและข้อมูลแอปพลิเคชัน

ประการที่สี่คือการเสริมสร้างความร่วมมือระหว่างประเทศและมีส่วนร่วมอย่างแข็งขันในการกำกับดูแลปัญญาประดิษฐ์ทั่วโลก ร่วมกันส่งเสริมการกำกับดูแลโมเดลขนาดใหญ่ด้วยทัศนคติที่มีความรับผิดชอบ และหวังว่าหลักการกำกับดูแลและบรรทัดฐานทางจริยธรรมของปัญญาประดิษฐ์จะสามารถหยั่งรากลึกในห่วงโซ่ทั้งหมดของโมเดลขนาดใหญ่ ในขณะเดียวกัน เสริมสร้างความร่วมมือระดับโลกในการกำกับดูแลปัญญาประดิษฐ์บนพื้นฐานของฉันทามติที่เพิ่มขึ้น

ดูต้นฉบับ
เนื้อหานี้มีสำหรับการอ้างอิงเท่านั้น ไม่ใช่การชักชวนหรือข้อเสนอ ไม่มีคำแนะนำด้านการลงทุน ภาษี หรือกฎหมาย ดูข้อจำกัดความรับผิดชอบสำหรับการเปิดเผยความเสี่ยงเพิ่มเติม
  • รางวัล
  • แสดงความคิดเห็น
  • แชร์
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น
  • ปักหมุด