來源:量子位大模型公司**智譜AI**,一舉宣佈了年內融資額:25億元人民幣。如此數額,什麼概念? 刷新了國內大模型創業公司的累計融資額,估值超過百億。這家成立4年的公司,已經成為國產大模型最具吸金力、最具價值認可的公司。 在百模大戰來到見真章的「生成式AI第二階段」,領頭羊智譜的融資進展,是否也是行業馬太效應顯現的證明?被看好的公司會獲得更多的資源,沒有證明自我價值的公司則面臨洗牌和無緣下一階段競速。從創業公司的維度來說,這更像是大模型創業的上半場尾聲,格局分水嶺已現,生態座次開始分明。 ## **為什麼是智譜? ** 在弄清國產大模型融資強者為什麼是智譜之前,我們先溯本求源,知其來處。在此之前,它大概屬於圈內知名,圈外無名的狀態。**智譜AI,成立於2019年6月**,由清華大學計算機系知識工程實驗室(KEG)的技術成功轉化而來。核心團隊成員幾乎都是清華血脈,其中,**CEO張鵬**畢業於清華大學計算機系,是清華大學2018創新領軍工程博士。在KEG實驗室時,團隊主要進行研究如何把機器學習、數據挖掘、知識圖譜等應用到工程實踐中,並且從2017年開始訓練AI模型。 到了智譜成立一周年那天,恰巧OpenAI發佈了GPT-3。從那時候起,智譜公司上下開始全情投入大語言預訓練模型的研發。 在大模型的道路上,OpenAI選擇了GPT,谷歌選擇了BERT,而智譜選擇了GLM(General Language Model)。種瓜得瓜,後來幾乎所有的故事都圍繞智譜獨特的GLM預訓練架構展開:2022年,智譜和清華合作研發了**雙語千億大模型GLM-130B,把它作為基座**,開始打造大模型平臺及產品矩陣。2023年,智譜動作非常頻繁,從推出對話模型ChatGLM同時開源單卡版模型ChatGLM-6B起,相繼視覺模型Visual-6B、代碼模型代碼模型CodeGeeX2、數學模型MathGLM、多模態模型CogVLM-17B、Agent模型AgentLM系列,並且統統開源。今年8月31日,智譜基於中英雙語對話模型ChatGLM2的生成式AI助手“智譜清言”,成為了首批11家通過備案飛入尋常百姓家的大模型產品。可以說,這幾年來,智譜在大模型領域主要做的事情很明晰,就是一手夯實地基(基座模型),然後在地基上搭建各種模態和功用的建築。 值得一提的是,智譜從雛形時期就能用B端服務能力養活自己,這是這家公司面對“大模型花錢如流水”的公認現實不僅不畏手畏腳,還頻繁研發推出新模型新產品的底氣。當然這不是唯一原因。除了服務能力和與之伴隨的營收能力,智譜還擁有過硬的人才隊伍和技術實力。上面已經提到,智譜脫胎於清華,而**“清華系”已經成為這個領域一種頗具威望的標籤**。究其原因是清華計算機系投身大模型研究較早,有著長期經驗,培育了許多人才——現在市場上叫得上名字的玩家,以智譜為代表,以及如月之暗面、深言科技、一流科技、百川智慧、面壁智慧、銜遠科技、生數科技等,都是清華血脈。他們所發表論文的被引用數、所發佈模型的可驗能力,都是對這個“公認標籤”有力證明。而且據公開資料,智譜是唯一全內資國產自研的大模型企業。這樣的公司底色,讓智譜在“模型安全、數據安全、內容安全”不絕於耳的討論和爭議聲中,有著自己的準備和策略。據悉,為配合國產GPU發展,智譜現在在落地**GLM通用語言模型國產晶元適配計劃**。具體來說,就是和國產算力晶元廠商一起合作做模型演算法適配,在演算法端推理端適配國產晶片,目前可適配的國產晶元已有近10種。 ## **融了這麼多錢,接下來做什麼? ** 上述的成績單和獨特性,或許成為了智譜一路備受看好、脫穎而出的關鍵原因。但因為備受看好,積累了足夠資本的智譜也表明瞭構建更長遠競爭力的決心。在10個月內狂攬25億人民幣融資后,智譜AI官方表態:> 上述融資將用於基座大模型的進一步研發,更好地支撐行業生態,與合作夥伴一同高速發展。核心歸結起來就兩大方面:* 一是做大做強做堅實大模型底座。* 二是拓展生態和朋友圈。既要有深度,也要有廣度。**首先,做大做強大模型底座,“進一步研發”基座大模型。 **目前智譜視為底座的大模型,是發佈於2021年的雙語雙向稠密模型GLM-130B,擁有1300億參數。當時受技術、數據、算力等諸多限制,訓練這個參數量的大模型足夠令人頭禿,但成果很顯著,GLM-130B的部分表現優於GPT-3以及PaLM。不過時至今日,數據、模態增長帶來的需求,昔年1300億參數的龐然大物好像有些不夠看了。量子位得到的最新消息是,**這週五**(10月27日)**,智譜將有新動作——發佈新一代基座大模型。 ** **其次,拓展生態和朋友圈。 **落實到具體行動上,應該繞不開智譜一以貫之的準則:持續開源。這家公司一直是大模型領域最開放的玩家之一,早在前ChatGPT時代,它就和百度(ERNIE2.0)、阿裡(AliceMind)、智源(清源CPM)、瀾舟(孟子大模型)等一起,走透明、開放的態度。現在翻看智譜早期的GLM報告,裡面就有“我們邀請大家加入它的開放社區,推動大規模預訓練模型的發展”的字樣。 現在,這家公司仍在用開源的方式,和開發者、行業使用者交個朋友。這個習慣延續到現在。結合目前的數據,可以更清楚地看待智譜對開源的堅持,收穫了什麼階段性結果:**開發者社區**,ChatGLM-6B上線四周后抱抱臉趨勢榜第一,累計超1000萬下載,GitHub攬星5w+。另一邊,智譜公司官網上羅列著**共建生態的合作夥伴**,“69個國家,1000+個研究機構”。 此外,量子位得到求證,其客戶數量超過1000家,共建開源生態的在200-300家之間。 大模型生態一旦建立,就能更好地整合大模型基礎層、中間層和應用層的資資源,進行優化配置,達到健康交互、協同進化的效果。在這之中,基座大模型憑藉基礎性、通用性,位列大模型生態的核心地位。 想明白這一點,就不難理解智譜致力於拓展生態和朋友圈的優勢和必要性了。 ## **大模型創業,步入分水嶺時刻** 去年十一月底,OpenAI給世界送來了ChatGPT。 緊接著,大模型技術趨勢以前所未有的速度掀起一波又一波的高潮。直觀數據是驚人的,呈現速度也是驚人的。上億的用戶活躍度、十數億的收入、百億的估值...... 大模型不講武德地強勢席捲世界,所有人都在觀望、探索,思考這個人工智慧技術能夠探索多廣闊的邊界,其支撐的產品又能如何發揮技術之力?於是,國外有OpenAI、Anthropic這樣的先驅者,國內也有了智譜AI、MiniMax這類百億獨角獸。珠玉在前,技術和工程方面的部分問題無法快進和跳過,再明星的陣容、再天文數字的融資,只要走大模型的路,就必須親自經歷。挑戰十分嚴峻,但挑戰者前赴後繼,樂在其中。######** △**圖源紅杉今時今日,幾乎一年過去,我們見證了大模型技術的發展,也見證了創新和競爭如何塑造著這個領域。更可以清晰看到的是,**巨頭完成初步卡位,創業公司開始洗牌,第一階段格局初現。 **沒錯,一家公司做不完大模型能力內的所有事,但通用大模型的門票就這麼有限,沒有能力拿到的玩家,開始分流:要麼走向專用,做行業模型; 要麼放棄模型層創業,開始站在別家模型的肩膀上,走向中間層、應用層......大模型創業,正在進入分水嶺時刻。 從今往後,關於大模型創業的融資進展,很可能比起現在會越來越聚集。 動輒數億數十億的資金將繼續聚集到“已經不差錢”公司。行業的馬太效應正在加劇。 資本總量有限,越有價值的公司會被更加好看,最好最多的資源被送到最有潛力的那匹馬手中。資本市場上,貴的公司唯一的缺點就是貴,便宜的公司唯一的優點就是便宜。大模型創業的上半場,即將結束。
4年百億估值,國產大模型創業 TOP 1,清華造
來源:量子位
大模型公司智譜AI,一舉宣佈了年內融資額:25億元人民幣。
如此數額,什麼概念? 刷新了國內大模型創業公司的累計融資額,估值超過百億。
這家成立4年的公司,已經成為國產大模型最具吸金力、最具價值認可的公司。
被看好的公司會獲得更多的資源,沒有證明自我價值的公司則面臨洗牌和無緣下一階段競速。
從創業公司的維度來說,這更像是大模型創業的上半場尾聲,格局分水嶺已現,生態座次開始分明。
**為什麼是智譜? **
在弄清國產大模型融資強者為什麼是智譜之前,我們先溯本求源,知其來處。
在此之前,它大概屬於圈內知名,圈外無名的狀態。
智譜AI,成立於2019年6月,由清華大學計算機系知識工程實驗室(KEG)的技術成功轉化而來。
核心團隊成員幾乎都是清華血脈,其中,CEO張鵬畢業於清華大學計算機系,是清華大學2018創新領軍工程博士。
在KEG實驗室時,團隊主要進行研究如何把機器學習、數據挖掘、知識圖譜等應用到工程實踐中,並且從2017年開始訓練AI模型。
從那時候起,智譜公司上下開始全情投入大語言預訓練模型的研發。 在大模型的道路上,OpenAI選擇了GPT,谷歌選擇了BERT,而智譜選擇了GLM(General Language Model)。
種瓜得瓜,後來幾乎所有的故事都圍繞智譜獨特的GLM預訓練架構展開:
2022年,智譜和清華合作研發了雙語千億大模型GLM-130B,把它作為基座,開始打造大模型平臺及產品矩陣。
2023年,智譜動作非常頻繁,從推出對話模型ChatGLM同時開源單卡版模型ChatGLM-6B起,相繼視覺模型Visual-6B、代碼模型代碼模型CodeGeeX2、數學模型MathGLM、多模態模型CogVLM-17B、Agent模型AgentLM系列,並且統統開源。
今年8月31日,智譜基於中英雙語對話模型ChatGLM2的生成式AI助手“智譜清言”,成為了首批11家通過備案飛入尋常百姓家的大模型產品。
可以說,這幾年來,智譜在大模型領域主要做的事情很明晰,就是一手夯實地基(基座模型),然後在地基上搭建各種模態和功用的建築。
當然這不是唯一原因。
除了服務能力和與之伴隨的營收能力,智譜還擁有過硬的人才隊伍和技術實力。
上面已經提到,智譜脫胎於清華,而**“清華系”已經成為這個領域一種頗具威望的標籤**。
究其原因是清華計算機系投身大模型研究較早,有著長期經驗,培育了許多人才——現在市場上叫得上名字的玩家,以智譜為代表,以及如月之暗面、深言科技、一流科技、百川智慧、面壁智慧、銜遠科技、生數科技等,都是清華血脈。
他們所發表論文的被引用數、所發佈模型的可驗能力,都是對這個“公認標籤”有力證明。
而且據公開資料,智譜是唯一全內資國產自研的大模型企業。
這樣的公司底色,讓智譜在“模型安全、數據安全、內容安全”不絕於耳的討論和爭議聲中,有著自己的準備和策略。
據悉,為配合國產GPU發展,智譜現在在落地GLM通用語言模型國產晶元適配計劃。
具體來說,就是和國產算力晶元廠商一起合作做模型演算法適配,在演算法端推理端適配國產晶片,目前可適配的國產晶元已有近10種。
**融了這麼多錢,接下來做什麼? **
上述的成績單和獨特性,或許成為了智譜一路備受看好、脫穎而出的關鍵原因。
但因為備受看好,積累了足夠資本的智譜也表明瞭構建更長遠競爭力的決心。
在10個月內狂攬25億人民幣融資后,智譜AI官方表態:
核心歸結起來就兩大方面:
既要有深度,也要有廣度。
**首先,做大做強大模型底座,“進一步研發”基座大模型。 **
目前智譜視為底座的大模型,是發佈於2021年的雙語雙向稠密模型GLM-130B,擁有1300億參數。
當時受技術、數據、算力等諸多限制,訓練這個參數量的大模型足夠令人頭禿,但成果很顯著,GLM-130B的部分表現優於GPT-3以及PaLM。
不過時至今日,數據、模態增長帶來的需求,昔年1300億參數的龐然大物好像有些不夠看了。
量子位得到的最新消息是,這週五(10月27日)**,智譜將有新動作——發佈新一代基座大模型。 **
落實到具體行動上,應該繞不開智譜一以貫之的準則:持續開源。
這家公司一直是大模型領域最開放的玩家之一,早在前ChatGPT時代,它就和百度(ERNIE2.0)、阿裡(AliceMind)、智源(清源CPM)、瀾舟(孟子大模型)等一起,走透明、開放的態度。
現在翻看智譜早期的GLM報告,裡面就有“我們邀請大家加入它的開放社區,推動大規模預訓練模型的發展”的字樣。 現在,這家公司仍在用開源的方式,和開發者、行業使用者交個朋友。
這個習慣延續到現在。
結合目前的數據,可以更清楚地看待智譜對開源的堅持,收穫了什麼階段性結果:
開發者社區,ChatGLM-6B上線四周后抱抱臉趨勢榜第一,累計超1000萬下載,GitHub攬星5w+。
另一邊,智譜公司官網上羅列著共建生態的合作夥伴,“69個國家,1000+個研究機構”。 此外,量子位得到求證,其客戶數量超過1000家,共建開源生態的在200-300家之間。
在這之中,基座大模型憑藉基礎性、通用性,位列大模型生態的核心地位。 想明白這一點,就不難理解智譜致力於拓展生態和朋友圈的優勢和必要性了。
大模型創業,步入分水嶺時刻
去年十一月底,OpenAI給世界送來了ChatGPT。 緊接著,大模型技術趨勢以前所未有的速度掀起一波又一波的高潮。
直觀數據是驚人的,呈現速度也是驚人的。
上億的用戶活躍度、十數億的收入、百億的估值...... 大模型不講武德地強勢席捲世界,所有人都在觀望、探索,思考這個人工智慧技術能夠探索多廣闊的邊界,其支撐的產品又能如何發揮技術之力?
於是,國外有OpenAI、Anthropic這樣的先驅者,國內也有了智譜AI、MiniMax這類百億獨角獸。
珠玉在前,技術和工程方面的部分問題無法快進和跳過,再明星的陣容、再天文數字的融資,只要走大模型的路,就必須親自經歷。
挑戰十分嚴峻,但挑戰者前赴後繼,樂在其中。
今時今日,幾乎一年過去,我們見證了大模型技術的發展,也見證了創新和競爭如何塑造著這個領域。
更可以清晰看到的是,**巨頭完成初步卡位,創業公司開始洗牌,第一階段格局初現。 **
沒錯,一家公司做不完大模型能力內的所有事,但通用大模型的門票就這麼有限,沒有能力拿到的玩家,開始分流:要麼走向專用,做行業模型; 要麼放棄模型層創業,開始站在別家模型的肩膀上,走向中間層、應用層......
大模型創業,正在進入分水嶺時刻。
行業的馬太效應正在加劇。 資本總量有限,越有價值的公司會被更加好看,最好最多的資源被送到最有潛力的那匹馬手中。
資本市場上,貴的公司唯一的缺點就是貴,便宜的公司唯一的優點就是便宜。
大模型創業的上半場,即將結束。