“ขโมย” ข้อมูล ด้านมืดของ AI รุ่นใหญ่

2023-06-19 05:20:03

แหล่งที่มาดั้งเดิม:

แหล่งที่มาของรูปภาพ: สร้างโดย Unbounded AI

บริษัทสตาร์ทอัพที่ชื่อว่า "one stroke two strokes" กล่าวประณามอดีตผู้นำด้านการศึกษาและการฝึกอบรม "Xueersi" อย่างเปิดเผย โดยกล่าวว่า "ขโมย" ข้อมูลที่ทำงานหนักเพื่อบันทึกโดยการ "ขูดฐานข้อมูล"

ที่มาของเรื่องคือเมื่อกลางเดือนเมษายนปีนี้ "Pen Shen Composition" (ผลิตภัณฑ์ของบริษัท Strike Two Strike) พบว่ามีการเข้าใช้อินเทอร์เฟซของเซิร์ฟเวอร์อย่างผิดปกติเป็นจำนวนมาก ส่งผลให้เพิ่มขึ้นอย่างรวดเร็ว ในการโหลดบนเซิร์ฟเวอร์

จำนวนการเข้าชมเกินกว่าค่าเฉลี่ยรายวันอย่างมาก Bishen Composition เปิดเผยกับ Deep AI ว่าการเข้าชมตามปกติในแต่ละวันมีประมาณสองสามร้อยหรือสองสามพัน แต่ในช่วงไม่กี่วันนั้นเพิ่มขึ้นเป็นมากกว่า 500,000 ครั้งต่อวัน ภายในหนึ่งสัปดาห์ ข้อมูลของพวกเขาถูกรวบรวมข้อมูล 2.58 ล้านครั้ง

การเรียกฐานข้อมูลที่เผยแพร่โดย Penshen Composition

จากการดูบันทึกของเซิร์ฟเวอร์ Pen God Composition พบว่า IP เดียวรวบรวมข้อมูลฐานข้อมูลด้วยความหนาแน่นสูงผ่านเทคโนโลยี "โปรแกรมรวบรวมข้อมูล" คำค้นหาสำหรับการเข้าชมแต่ละครั้งของ IP นี้เกี่ยวข้องกับองค์ประกอบและระบบจะส่งคืนองค์ประกอบ 30 รายการต่อหน้า การเข้าชมแต่ละครั้งจะใช้คำค้นหาเพื่อเปลี่ยนกลับจากหน้าแรกทีละหน้า โดยทั่วไปจะรวบรวมหัวข้อเดียวกันไว้ในห้องสมุด . จับองค์ประกอบทั้งหมดแล้ว

ตามที่คนในวงการอุตสาหกรรมกล่าวไว้ ภายใต้สถานการณ์ปกติ ผู้ใช้ทั่วไปจะไม่ทำเช่นนี้ **การเข้าถึงฐานข้อมูลในรูปแบบการค้นหาประเภทนี้เรียกอีกอย่างว่า "การขูดไลบรารี" **

Penshen Composition เชื่อว่าผู้ชักใยเบื้องหลังของ "Paku" คือ Xueersi หุ้นส่วนของตน

ไม่นานหลังจากเหตุการณ์ "ห้องสมุดจอดรถ" Penshen Composition พบว่า Xueersi กำลังพัฒนาแบบจำลองทางคณิตศาสตร์ขนาดใหญ่ MathGPT และกล่าวว่าจะเปิดตัว "ผู้ช่วย AI" ในอนาคตอันใกล้ หนึ่งในฟังก์ชันนั้นคือการจัดองค์ประกอบ

ไม่มีข้อสรุปที่แน่ชัดว่ามีความเกี่ยวข้องกันระหว่างสองเหตุการณ์ของ Penshen Composition ที่ถูก "หยิบขึ้นมา" และ Hexueersi พัฒนา "Composition AI Assistant" หรือไม่

แต่ Bishen Composition เชื่อว่าสิทธิ์ของตนถูกละเมิด มันส่งจดหมายของทนายความไปยังอีกฝ่ายหนึ่งและเผยแพร่เรื่องนี้ต่อสาธารณะโดยพยายามขอคำอธิบาย Xueersi ให้คำตอบต่อสาธารณะโดยกล่าวว่าการใช้เนื้อหาของ Penshen เป็นไปตามข้อกำหนดของสัญญา และแบบจำลอง MathGPT ที่พัฒนาขึ้นเองและ "ผู้ช่วย AI การจัดองค์ประกอบ" ไม่ได้ใช้ข้อมูลใด ๆ จากการประพันธ์ของ Penshen

ในเหตุการณ์นี้ ไม่ใช่แค่เนื้อหาการจัดองค์ประกอบเท่านั้นที่ควรค่าแก่การพูดคุย ข้อมูลหมายถึงอะไรสำหรับโมเดลขนาดใหญ่

**พันธมิตรกลายเป็นคนเถื่อนที่ประตู? **

ทั้งสองฝ่ายยืนยันในความคิดเห็นของตนเอง

ก่อนอื่นขอแนะนำองค์ประกอบของเทพเจ้าแห่งปากกาโดยสังเขป

บริษัทนี้ก่อตั้งขึ้นในปี 2560 ผลิตภัณฑ์ "Pen God" เป็นซอฟต์แวร์ช่วยเขียนโดยใช้ปัญญาประดิษฐ์ ซึ่งถือได้ว่าเป็นผลิตภัณฑ์ของ AI+การศึกษา ในตอนแรก "Pen God" มุ่งเน้นไปที่แพลตฟอร์มการสร้างเนื้อหาและผู้ผลิตเครื่องมือที่เกี่ยวข้อง และต่อมาก็เจาะลึกลงไปในสาขาแนวตั้งโดยใช้ AI เพื่อสอนนักเรียนให้เขียนเรียงความ ดังนั้นจึงมี "Pen God Composition"

คุณสามารถเข้าใจได้ง่ายๆ: มันอยู่ในอุตสาหกรรมการศึกษา มันมุ่งเป้าไปที่กลุ่มนักเรียน มันใช้เทคโนโลยีปัญญาประดิษฐ์ และมันแก้ปัญหาฉากของการเขียนเรียงความ

การเขียนด้วย AI มีความเหมือนกันหลายอย่างกับ ChatGPT ซึ่งเป็นที่นิยมในปัจจุบัน ทั้งหมดนี้เกี่ยวข้องกับเทคโนโลยี เช่น การประมวลผลภาษาธรรมชาติ การวิเคราะห์ความหมายและการคาดคะเน และการเรียนรู้ของเครื่อง Song Jiawei ผู้ก่อตั้ง Penshen Composition ทำหน้าที่เป็นสถาปนิกระบบอาวุโสของ Sony และ CTO ของ Singulato

เมื่อ 5 ปีก่อน Song Jiawei กล่าวว่าเขากำลังพิจารณาว่าจะใช้เทคโนโลยีโมเดลภาษาที่ฝึกไว้ล่วงหน้า เช่น bert หรือ GPT-2 กับแอปพลิเคชันอย่างไร ในเวลานั้น GPT ยังไม่เป็นที่รู้จักและยังไม่เป็นที่รู้จักเหมือนในปัจจุบัน

หลังจากเริ่มทำองค์ประกอบ AI แล้ว Penshen Composition ก็เข้าสู่เส้นทางการศึกษาอย่างเป็นทางการ โดยก้าวเข้าสู่แม่น้ำสายเดียวกับ Xueersi ซึ่งเป็นผู้นำด้านการศึกษาและการฝึกอบรม

จากการแนะนำของ Penshen ในเดือนธันวาคม 2020 Penshen Composition และ Xueersi ได้บรรลุความร่วมมือ ** Penshen Composition ให้ Xueersi ด้วย "Benshen Composition Model Essay Material Service Interface" ซึ่งใช้ในบริการที่เกี่ยวข้องกับ Xueersi และค่าธรรมเนียมจะชำระตามจำนวนการโทร ด้วยเหตุนี้ Penshen Composition จึงได้เปิดอินเทอร์เฟซบริการสำหรับ Xueersi **

กล่าวอีกนัยหนึ่ง Xueersi สามารถใช้สื่อการเรียบเรียงในฐานข้อมูล Penshen Composition และชำระเงินได้

วัสดุองค์ประกอบเป็นสินทรัพย์หลักในการทำธุรกรรมนี้และเป็นรากฐานที่สำคัญของรูปแบบธุรกิจของ Penshen Composition ในความเป็นจริงองค์ประกอบของ Pen God เริ่มต้นจากจุดของเนื้อหาอย่างเร็วที่สุด "การค้นหาวัสดุด้วยคลิกเดียว" ในตอนนั้น ผู้ใช้สามารถค้นหาคำหลักและระบบสามารถจับคู่วัสดุได้โดยอัตโนมัติ แหล่งข้อมูล มีตั้งแต่บทกวีคลาสสิกโบราณ เอกสารราชการ ไปจนถึงบทความบนเว็บสมัยใหม่ ในระหว่างขั้นตอนการเขียน ระบบยังสามารถส่งวัสดุได้แบบเรียลไทม์

เนื้อหาเหล่านี้ไม่ได้มาจากอินเทอร์เน็ต แต่มาจากฐานข้อมูลของ Penshen ด้วยการระบุอัจฉริยะ การแปล และการจับคู่ของเทคโนโลยี AI ทำให้ Penshen สามารถฟีดแบ็คเนื้อหาที่เหมาะสมกับพฤติกรรมการค้นหาของผู้ใช้ได้

เมื่อปริมาณของวัสดุองค์ประกอบเหล่านี้มีมากพอ มีคุณภาพสูงเพียงพอ และการจับคู่มีความแม่นยำเพียงพอ ก็จะมีมูลค่าทางการค้าที่แน่นอนและยังสามารถขายภายนอกได้ นี่คือเหตุผลของการร่วมมือกับ Xueersi

ปัญหาคือวัสดุเหล่านี้เสี่ยงต่อการถูก "ขโมย" โดยเฉพาะอย่างยิ่งหากมีการเปิดอินเทอร์เฟซบางส่วน

จากการแนะนำของ Deep AI ในองค์ประกอบของ penshen พวกเขาจำกัดขอบเขตความร่วมมือกับ Xueersi "เราเปิดอินเทอร์เฟซเพื่อให้พวกเขาเรียกข้อมูลของเราและแสดงในแอปของพวกเขาเอง แต่สัญญาไม่รวมถึงข้อมูลที่จัดเก็บ หรือการอนุญาตสำหรับอัลกอริทึม AI ข้อมูลควรพร้อมใช้งานสำหรับผู้ใช้เท่านั้น

ซึ่งเทียบเท่ากับ **เมื่อผู้ใช้เริ่มต้นการค้นหาด้านผลิตภัณฑ์ของ Xueersi เทมเพลตองค์ประกอบที่เรียกใช้จะมาจากองค์ประกอบ Penshen และ Xueersi ไม่สามารถจัดเก็บได้ด้วยตัวเอง **

การโทรที่ผิดปกติในช่วงกลางเดือนเมษายนทำให้ Pen God Composition คิดว่ามันอยู่นอกเหนือขอบเขตของความร่วมมือทางธุรกิจตามปกติ "การกระทำของพวกเขากระตุ้นกลไกการป้องกันของเรา ซึ่งทำให้เราค้นพบสิ่งนี้"

Bishen Zuowen ระบุว่าพวกเขาตรวจสอบบันทึกการเข้าถึงในพื้นหลังและพบว่าการเข้าถึงที่ผิดกฎหมายนั้นเริ่มต้นโดย IP เดียวผ่านเทคโนโลยี "ซอฟต์แวร์รวบรวมข้อมูล" "เรามีที่อยู่ IP นี้แล้ว"

ที่อยู่ IP ที่เผยแพร่โดย Penshen Composition (บางส่วน)

Liu Ran ซีอีโอของบริษัทสตาร์ทอัพด้านปัญญาประดิษฐ์ในประเทศได้วิเคราะห์ Deep AI วิธีการระบุคีย์เวิร์ดอย่างถี่ถ้วนนี้จะต้องได้รับข้อมูลในไลบรารีนี่เป็นพฤติกรรมที่ชัดเจนมาก

Penshen Composition เปิดเผยกับ Deep AI ว่าหลังจากเหตุการณ์ดังกล่าว พวกเขาตรวจสอบกับเจ้าหน้าที่ปฏิบัติการของ Xueersi และอีกฝ่ายยอมรับโดยตรงว่าทีมอัลกอริทึมของ Xueersi กำลังรวบรวมข้อมูลและนำไปใช้เอง อย่างไรก็ตาม สำหรับคำกล่าวนี้ Deep AI ยังไม่ได้รับการยืนยันจาก Xueersi

ทันใดนั้นอดีตหุ้นส่วนก็กลายเป็นคนป่าเถื่อนที่ประตูซึ่งทำให้ Bishen Composition โกรธมากและส่งจดหมายทนายความหลายครั้ง

Xueersi กล่าวในการตอบสนองสาธารณะเมื่อวันที่ 13 มิถุนายนว่าการเรียกอินเทอร์เฟซการแต่งเพลง Penshen นั้นไม่เกินขอบเขตของสัญญาระหว่างทั้งสองฝ่าย และการใช้เนื้อหาสาระสำคัญของ Penshen เป็นไปตามข้อกำหนดของสัญญาและไม่ได้ใช้เพื่อสิ่งใด นอกเหนือจากสัญญาเพื่อวัตถุประสงค์ใดๆ Xueersi เน้นย้ำเป็นพิเศษว่าโมเดลขนาดใหญ่ MathGPT ที่พัฒนาขึ้นเองและ "ผู้ช่วย AI การจัดองค์ประกอบ" ไม่ได้ใช้ข้อมูลใด ๆ จากองค์ประกอบ Penshen

ต่างฝ่ายต่างยืนยันความเห็นของตัวเองและยังไม่มีข้อสรุป ตามบทความของ Pen God คดีนี้อาจกลายเป็น "คดีแรกที่ข้อมูลโมเดลขนาดใหญ่ของ AI ถูกขโมย"

คำถามที่ควรค่าแก่การสำรวจคือข้อมูลมีความหมายอย่างไรสำหรับโมเดลขนาดใหญ่

ข้อมูลมาจากไหนเป็นปัญหาใหญ่

พลังการประมวลผล อัลกอริทึม และข้อมูลเป็นองค์ประกอบหลักสามประการของปัญญาประดิษฐ์สำหรับการเรียนรู้ของเครื่อง

เพื่อปรับปรุงพลังการประมวลผล บริษัทเทคโนโลยีหลายแห่งทุ่มเงินจำนวนมากเพื่อคว้า GPU ของ Nvidia ในด้านอัลกอริทึม บริษัทยักษ์ใหญ่บางแห่งทั้งในประเทศและต่างประเทศได้สร้างอัลกอริทึมโอเพ่นซอร์ส ซึ่งลดเกณฑ์ในการพัฒนาแบบจำลองลงอย่างมาก

ในด้านข้อมูล อุปสรรคมีอยู่เสมอ จะหาข้อมูลคุณภาพสูงได้จากที่ใดเป็นประเด็นสำคัญ

โมเดล AI เจเนอเรทีฟขนาดใหญ่จำเป็นต้องใช้ข้อมูลที่หลากหลายจำนวนมากสำหรับการฝึกอบรมเพื่อปรับปรุงความสามารถทั่วไปและการสร้างโมเดล รุ่นที่แตกต่างกันอาจใช้แหล่งข้อมูลที่แตกต่างกัน โมเดลขนาดใหญ่ทั่วไป เช่น ChatGPT ใช้ข้อมูลสาธารณะจำนวนมาก เช่น เว็บไซต์ข่าว หนังสือ เอกสารทางวิทยาศาสตร์ หน้าเว็บ ฯลฯ สำหรับโมเดลขนาดใหญ่ในฟิลด์แนวตั้งบางฟิลด์ จำเป็นต้องค้นหาชุดข้อมูลและองค์กรเป้าหมาย

ผู้รับผิดชอบแบบจำลองขนาดใหญ่ของบริษัทเทคโนโลยีชั้นนำในประเทศบอกกับ Deep AI ว่า ChatGPT ใช้ข้อมูลที่ไม่เป็นสาธารณะจำนวนมาก และข้อมูลสาธารณะจำนวนมากบนอินเทอร์เน็ตมีคุณภาพต่ำมาก และมี เกณฑ์สำหรับข้อมูลคุณภาพสูง การได้มาและการทำความสะอาดข้อมูลกำลังเผชิญกับความท้าทายที่ยิ่งใหญ่ **

TAL CTO Tian Mi กล่าวต่อสาธารณชนเมื่อวันที่ 4 พฤษภาคมว่า "หลายสาขามีอุปสรรคด้านข้อมูลและความรู้ในอุตสาหกรรม และโมเดลขนาดใหญ่ยังคงต้องบูรณาการอย่างลึกซึ้งกับความรู้โดเมน รวมถึงข้อมูลโดเมนที่เพียงพอสำหรับการฝึกอบรมผู้เชี่ยวชาญด้านโดเมน โมเดล "

ดังที่ Tian Mi กล่าวว่า โมเดลโดเมนขนาดใหญ่ควรผสานรวมเข้ากับความรู้โดเมนอย่างลึกซึ้ง ในด้านการจัดองค์ประกอบ AI วัสดุการจัดองค์ประกอบเป็นข้อมูลสำคัญสำหรับเครื่องฝึก

ต้นปี 2019 บริษัท Penshen เริ่มรวบรวมข้อมูลอย่างมีจุดประสงค์และฝึกฝนคลังข้อมูลการแต่งเพลงของตนเอง ครอบคลุมคำพูดที่มีชื่อเสียง บทกวี เอกสารราชการ ภาษาอินเทอร์เน็ต ฯลฯ พวกเขาใช้วิธีการฝึกเครื่องเพื่อจำลองฉลากแบบแมนนวลเพื่อติดฉลากแต่ละคลังข้อมูล

ในคลังข้อมูลแนวตั้ง หลังจากแท็กข้อมูลแล้วเท่านั้นจึงจะสามารถดำเนินการพุชเนื้อหาที่ถูกต้องตามการจับคู่เวกเตอร์ การวิเคราะห์ความหมาย และการคาดคะเนของการสร้างเนื้อหาปัจจุบันของผู้ใช้

Liu Ran บอกกับ Deep AI ว่าการสร้างแบบจำลองนั้นต้องการข้อมูลที่ผ่านการตรวจสอบจำนวนมาก และหากข้อมูลได้รับการแยกออก ก็จะสามารถช่วยงานมนุษย์ได้จำนวนมาก องค์ประกอบที่จัดโดย Penshen Composition อาจใช้เป็นข้อมูลที่ทำเครื่องหมายไว้

กระบวนการนี้ต่อเนื่องและยาวนาน Bishen Composition กล่าวว่าในช่วง 6 ปีนับตั้งแต่ก่อตั้ง พวกเขาได้สะสมวัสดุองค์ประกอบรวมกันมากกว่า 5 ล้านชิ้น และปริมาณการแก้ไขรายเดือนเกิน 30,000 รายการ วัสดุองค์ประกอบเหล่านี้ได้รับการตรวจทาน คัดกรอง และส่งด้วยตนเอง ติดป้าย ให้คะแนน และแก้ไขข้อมูล และสะสมในที่สุด

ข้อมูลเหล่านี้ไม่เพียงแต่สามารถนำเสนอในรูปแบบของวัสดุในหน้า APP เท่านั้น แต่ยังสามารถใช้ในการฝึกอัลกอริทึมในพื้นหลังได้อีกด้วย ดังนั้น เมื่อร่วมมือกับบริษัทอื่นในการเปิดอินเทอร์เฟซ Penshen Composition ได้เพิ่มบทความพิเศษในข้อตกลง - ไม่มี "การแคช การจัดเก็บ การคำนวณ และการฝึกเป็นคลังข้อมูล"

Bishen Composition เชื่อว่า Xueersi ได้ "ขโมย" ข้อมูล และคาดการณ์ว่า Xueersi ใช้ข้อมูลสำหรับการฝึกอบรมและพัฒนาแบบจำลองทางคณิตศาสตร์ขนาดใหญ่ MathGPT และเครื่องการเรียนรู้ Xueersi "Composition AI Assistant" แต่นั่นดูเหมือนจะพิสูจน์ได้ยาก

Liu Ran เชื่อว่าโดยปกติแล้ว ข้อมูลการจัดองค์ประกอบควรมีข้อจำกัดบางอย่างที่กำหนดไว้ล่วงหน้า เช่น การไม่ยอมรับการทำงานพร้อมกันสูง การเข้ารหัสข้อมูล และควรติดตามตำแหน่งและการใช้ข้อมูลได้ อย่างไรก็ตาม เขายังเชื่อว่าข้อมูลองค์ประกอบไม่สำคัญเท่าข้อมูลพฤติกรรมที่สำคัญของผู้ใช้

"คุณสามารถให้ AI เรียนรู้ว่าอะไรคือองค์ประกอบที่ดี แล้วปล่อยให้มันสร้างตามมาตรฐานเหล่านี้ แต่จริงๆ แล้วผมไม่คิดว่าจำเป็นต้องใช้ข้อมูลมากนัก องค์ประกอบคุณภาพสูงหลายหมื่นรายการก็น่าจะเพียงพอแล้ว" เขากล่าว .

"คดีแรกในการโจรกรรมข้อมูลแบบจำลองขนาดใหญ่ของ AI"

**ยืนขึ้นได้ไหม? **

Penshen Composition มีท่าทีแข็งกร้าวและออกประกาศ 2 ฉบับติดต่อกัน โดยเรียกร้องคำขอโทษจาก Xueersi และในขณะเดียวกันก็เรียกร้องค่าชดเชย 1 หยวน ถึงกับต้องการติดป้ายเหตุการณ์นี้ว่าเป็น "กรณีแรกของการขโมยข้อมูลแบบจำลองขนาดใหญ่ของ AI"

ทนายความ Liu Honglin ผู้อำนวยการ Shanghai Mankiw Law Firm บอกกับ Deep AI ว่าคลังข้อมูลหรือคลังวัสดุที่สร้างขึ้นเองของ Bishen Composition นั้นมีสิทธิ์ในทรัพย์สินทางปัญญา อย่างไรก็ตาม ไม่ว่าจะเป็นงานภายใต้กฎหมายลิขสิทธิ์หรือไม่นั้นขึ้นอยู่กับว่าต้นฉบับนั้นตรงตามเกณฑ์ที่เกี่ยวข้องหรือไม่

"หาก Penshen Composition มีหลักฐานเพียงพอที่จะพิสูจน์ว่า Xueersi ได้ขโมยข้อมูลของพวกเขาอย่างมุ่งร้าย ก็อาจนำไปสู่การฟ้องร้องการละเมิดทรัพย์สินทางปัญญาหรือการแข่งขันที่ไม่เป็นธรรมได้" เขากล่าว

นอกจากนี้ Bishen Composition ยังมีข้อตกลงความร่วมมือกับ Xueersi หากมีการตกลงเคารพและให้สิทธิ์ในทรัพย์สินทางปัญญา พวกเขายังสามารถปกป้องสิทธิ์และผลประโยชน์ของพวกเขาผ่านการละเมิดสัญญา

เป็นที่น่าสังเกตว่าการแต่งเพลงจำนวนมากใน Penshen Composition Material Library นั้นส่งโดยผู้ใช้ Pen God Composition อ้างว่าได้รับการส่งเรียงความ 300,000 บทความทุกเดือน ดังนั้นก่อนที่จะตัดสินว่าเป็นการละเมิดหรือไม่ จำเป็นต้องชี้แจงสิทธิ์ในทรัพย์สินทางปัญญาของเนื้อหาเหล่านี้

ตามการวิเคราะห์ของ Liu Honglin ขึ้นอยู่กับว่าผู้สร้าง (ผู้ร่วมให้ข้อมูล) ของเรียงความและองค์ประกอบ penshen เห็นด้วยกับสิทธิในทรัพย์สินทางปัญญาอย่างไร หากผู้ใช้อนุญาตสิทธิ์ในทรัพย์สินทางปัญญาของ Penshen Composition ในขณะที่ส่ง Penshen Composition จะได้รับสิทธิ์และผลประโยชน์ที่เกี่ยวข้อง

Deep AI สอบถามเกี่ยวกับข้อตกลงในการให้บริการผู้ใช้ของ Pen God Composition และพบว่ามีข้อความดังกล่าว: เนื้อหาที่เผยแพร่โดยผู้ใช้ใน Pen God Composition (รวมถึงแต่ไม่จำกัดเพียงความคิดเห็น ข้อคิดเห็น บันทึกย่อ) ทำให้ Pen God Composition a ใบอนุญาตแบบไม่ผูกขาดฟรีและไม่สามารถเพิกถอนได้

กล่าวอีกนัยหนึ่ง Penshen Composition เป็นเจ้าของสิทธิ์ในทรัพย์สินทางปัญญาของไลบรารีวัสดุ

สิ่งที่ Liu Ran ไม่สามารถเข้าใจได้คือเหตุใด Bishen Composition จึงร่วมมือกับ Xueersi "ถ้าเป็นผม ผมจะไม่ร่วมมือกับ Xueersi อย่างแน่นอน เพราะเราอยู่ในความสัมพันธ์ที่มีการแข่งขันสูง" เขาเชื่อว่า "**ในยุคของโมเดลขนาดใหญ่ "

จากการวิเคราะห์โดยคนในวงการ Xueersi มีทราฟฟิก ฉาก และความนิยม โดยเฉพาะอย่างยิ่งในแง่ของผลิตภัณฑ์ฟรอนต์เอนด์ที่เน้นผู้ใช้ Xueersi มีข้อได้เปรียบมากกว่า Pen God Composition อย่างไรก็ตาม งานในการรวบรวมข้อมูลและสร้างคลังวัสดุที่ส่วนหลังนั้นใช้เวลานานและลำบาก และเป็นการยากที่จะเห็นผลลัพธ์ในระยะสั้น สำหรับ Xueersi การเข้าถึงไลบรารีวัสดุสำเร็จรูปโดยตรงจะสะดวกที่สุด Penshen Composition ประสบความสำเร็จในการสร้างรายได้เชิงพาณิชย์ด้วยการขายการเข้าถึงไลบรารีวัสดุ

แต่สำหรับบริษัทสตาร์ทอัพอย่าง Pen God Composition ความร่วมมือดังกล่าวเปรียบเสมือนกุหลาบที่มีหนาม เนื่องจากบริษัทยักษ์ใหญ่ของจีนอาจเข้าสู่ดินแดนของคุณได้ทุกเมื่อ และอาจสร้างการแข่งขันโดยตรงในระดับธุรกิจ **

AI แก้ไของค์ประกอบเป็นหน้าที่ที่สำคัญมากขององค์ประกอบ Penshen เมื่อสามปีที่แล้ว TAL (บริษัทแม่ของ Xueersi) ได้เปิดตัว "โซลูชันแก้ไของค์ประกอบภาษาจีนและอังกฤษ" ซึ่งช่วยให้สามารถแก้ไของค์ประกอบภาษาจีนและอังกฤษได้อย่างชาญฉลาดผ่าน AI

ตอนนี้ การปรับเปลี่ยนองค์ประกอบ AI เป็นเพียงส่วนเล็ก ๆ ของเมทริกซ์ผลิตภัณฑ์ AI ขนาดใหญ่ของ TAL ในการแนะนำผลิตภัณฑ์ล่าสุด การแก้ไของค์ประกอบภาษาจีนเป็นโมดูลของการแก้ไขการเขียนตามคำบอกภาษาจีนและภาษาอังกฤษ TAL มีความทะเยอทะยานที่มากกว่า และหนวดของมันได้ขยายไปถึงทุกด้านของการศึกษา AI+ แล้ว

หลังจากที่ ChatGPT ได้รับความนิยมจาก AI เชิงกำเนิด ผู้ประกอบการในอุตสาหกรรมปัญญาประดิษฐ์ต่างก็ตื่นเต้นและวิตกกังวล พวกเขารู้สึกตื่นเต้นที่ในที่สุดอุตสาหกรรมก็กลับมาร้อนแรงอีกครั้ง พวกเขากังวลว่า ChatGPT นั้นทรงพลังเกินไป และโครงการของผู้ประกอบการจำนวนมากในสาขาแนวดิ่งได้สูญเสียอุปสรรคในชั่วข้ามคืน

สำหรับบริษัทอย่าง Pen God Composition อุปสรรคของการแข่งขันอยู่ที่ไหนและจะเผชิญหน้ากับยักษ์ใหญ่ได้อย่างไรนั้นเป็นปัญหาที่แท้จริง การมีส่วนร่วมอย่างรวดเร็วของอุตสาหกรรมปัญญาประดิษฐ์และการแข่งขันที่ทวีความรุนแรงขึ้นจะทำให้การเผชิญหน้าระหว่างสตาร์ทอัพและยักษ์ใหญ่ทวีความรุนแรงขึ้น

การดึงข้อมูลอาจเป็นเพียงส่วนเล็กของภูเขาน้ำแข็งในการแข่งขันรอบใหม่

ดูต้นฉบับ

เนื้อหานี้มีสำหรับการอ้างอิงเท่านั้น ไม่ใช่การชักชวนหรือข้อเสนอ ไม่มีคำแนะนำด้านการลงทุน ภาษี หรือกฎหมาย ดูข้อจำกัดความรับผิดชอบสำหรับการเปิดเผยความเสี่ยงเพิ่มเติม

รางวัล
ถูกใจ
แสดงความคิดเห็น
แชร์

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น

หัวข้อถ่ายทอดสด
#BTC#
222k โพสต์
#PI#
186k โพสต์
#ETH#
141k โพสต์
4#GateioInto11#
79k โพสต์
5#ContentStar#
66k โพสต์
6#GT#
62k โพสต์
7#BOME#
60k โพสต์
8#DOGE#
57k โพสต์
9#MAGA#
52k โพสต์
10#SLERF#
51k โพสต์

ปักหมุด

แผนผังเว็บไซต์