💥 Gate廣場活動: #FST创作大赛# 💥
在 Gate廣場 發布 CandyDrop 第71期:CandyDrop x FreeStyle Classic Token (FST) 相關原創內容,即有機會瓜分 3,000 FST 獎勵!
📅 活動時間:2025年8月27日 – 9月2日
📌 參與方式:
發布原創內容,主題需與 FST 或 CandyDrop 活動相關
內容不少於 80 字
帖子添加話題: #FST创作大赛#
附上 CandyDrop 參與截圖
🏆 獎勵設置:
一等獎(1名):1,000 FST
二等獎(3名):500 FST/人
三等獎(5名):200 FST/人
📄 注意事項:
內容必須原創,禁止抄襲或刷量
獲獎者需完成 Gate 廣場身分認證
活動最終解釋權歸 Gate 所有
活動詳情連結: https://www.gate.com/announcements/article/46757
手機里塞大模型,只是開始
原文來源:光子星球
急需找到新飛輪的手機廠商,盯上了大模型。
華為在8月初的開發者大會上宣佈將在 HarmonyOS 4中搭載的AI助手小藝接入大模型,並在8月底邀測; 小米也差不多同一時間開啟了其AI助手小愛接入大模型的邀測。 OPPO與vivo緊隨其後,兩者均在11月開始手機大模型的落地嘗試。
“將大模型塞進手機”於業界並不是新鮮事兒,不談自10月中旬開始密集預熱的vivo,榮米O三家均曾在今年召開的發佈會上透出過相關消息。 業界普遍看法是智慧手機賽道的硬體部分幾乎卷無可卷,而大多跑在雲端的大模型恰是一個遊離於硬體之外的變數。
需要注意的是,端側部署對大模型賽道而言同樣也是行業趨勢。 以ChatGPT為例,作為雲側大模型的典型代表,其訓練與推理都跑在微軟的Azure上,使用者則通過瀏覽器或App獲取結果。 input-output來回之間,不僅存在影響使用體驗的時延,耗能、算力等雲端成本也居高不下。
從實際場景與需求來看,不少需求完全可以通過邊緣設備來滿足,尤其是手機、PC、新能源車等廣泛應用的終端。
於是,大模型的端側部署逐漸成為共識,不僅有手機廠商鉚足了勁訓練模型,PC賽道聯想與晶元賽道的高通等均在前段時間發佈了端側AI的相關解決方案。 尤其是剛剛發佈的高通驍龍8 Gen3以及聯發科天璣9300,其AI性能的提升可以說是手機端大模型的基礎。
行業需求與硬體條件都已被滿足,大模型終於可以進入手機之內。 可令人頗為意外的是,率先掏出「完整產品」的手機廠商竟是vivo。
**vivo大模型成色如何? **
11月1日,vivo召開開發者大會,於會上發佈了自研大模型矩陣“藍心”(BlueLM),包含十億、百億、千億等不同參數規模。 同時還發佈了適配其大模型的自研操作系統OriginOS 4。
面對大模型這塊“應許之地”,vivo的急切幾乎寫在臉上。
據10月26日市場調研機構Canalys公佈的最新數據,vivo出貨量出貨量下滑,排名也出現下跌。 vivo迫切需要大模型以及OriginOS 4來扭轉局勢,率先下場“開卷”並不讓人意外。
而且與大模型相比,本次vivo推出的OriginOS 4的更新跨度略顯寡淡。 在公域討論中,不僅其虛擬顯卡、異構計算空間與輕量化等反覆運算幅度不及預期,vivo用戶中聲量頗高的原子通知等模組也沒有升級。 也就是說,大模型才是本次發佈會的主角。
從業務模式看,vivo本次發佈會展示的路線與此前業內其他玩家相似,以人工智慧助手為載體,採取端側+雲側混合的部署方式,其中作為重頭戲的端側大模型,呈現當地語系化、輕量化的明顯特徵。
這麼做的目的顯而易見,手機這一方小天地所提供的功耗、算力與機房不可同日而語。 只是如何將模型能力與手機深度結合成為手機廠商們迫切需要突破的“konw how”。
對此,vivo給出的解決方案是推出多參數規格模型,其中主要面向文本場景的10億規格與面向自然對話、知識問答長焦的70億規格為端側部署的重頭戲。 在官方介紹中,10億規格單獨面向端側,70億規格設為端雲兩用,自700億起均為雲端部署,這也體現了vivo在端雲協同上“讓上帝的歸上帝,讓凱撒的歸凱撒”的矩陣思路。
這與谷歌在今年5月的 I/O 開發者大會如出一轍,當時谷歌發佈的大模型 PaLM2 有四個參數規格,其中小參數模型可在離線狀態下實現每秒處理20 tokens,適配於終端的離線使用。
如果就此認為vivo是“拾人牙慧”則未免過於嚴苛。 實際上,vivo早在2017年便著手組建內部人工智慧團隊,時至今日,vivo人工智慧研究院已有過千研究人員。
縱使其技術沉澱總體上不如阿裡、百度等第一梯隊,但開源社區的存在也讓稍晚入場的玩家們能迅速趕上大部隊。 而vivo在2018年成立的知識圖譜研究院也能在一定程度上補強其作為手機廠商可能遭遇的訓練數據不足問題。
至於模型能力方面,vivo在預熱時期便交出了一份不錯的答卷。 據悉,BlueLM在中文大模型第三方測評集C-中獲得了“受限訪問模型”類目的第一名。 其官方通告中稱BlueLM是行業內首家7B端側大模型。
但是在測評中斬獲高分卻實際表現不如人意的模型不在少數,更是有業內人士稱這份榜單已經在過去一段時間被“刷脫皮”了,只能代表模型“做題”的能力而無法體現推理、安全、應變等能力。 照此來看,vivo的業務成果顯然還需要更多實際檢驗。
況且,vivo目前展示的雲端模型能力如文生圖、交互等並未跳出大模型賽道窠臼,新意有限。 而且其作為重頭戲的端側模型能力還停留在測試階段,同時端側能力的展現也必然受到手機硬體的限制。
我們瞭解到,多位受邀參與藍心內測的使用者使用的是以X90 Pro為代表的旗艦機,這批機型也是目前vivo釋出的大模型應用公測適配時程表中最為靠前的。
毫無疑問,大模型正在成為手機廠商開闢高端化的第二戰場,同時也是盤活使用者,啟動IoT的重要變數。 儘管如此,vivo依靠大模型增加高端產品價值的打算,還存在諸多變數
歸根結底,大模型的推出既是vivo高端化的新基石,也是其試圖拉動新機與高端產品的一駕馬車。
低端機型自然難以勝任這場高端化的戰爭。 以vivo於本次發佈會前發佈的基礎機型Y100為例,這是上述適配計劃中最晚上線的機型之一,如此類似“背刺”的舉動背後是vivo希望靠高端產品重回王座的“小算盤”。
縱使如此,大模型的推出還是不太能成為vivo高端產品的加分項。
開源社區端側大模型創業者王陽(化名)告訴光子星球,大模型在端側的能力表現在於其NPU(專門為深度神經網路計算而設計的處理器)所帶來的AI性能。 而在vivo既往機型中,並不注重NPU能力,因此老機型大概率難以順暢地跑大模型。
至於即將發佈的,搭載聯發科天璣9300旗艦晶元與新一代AI處理器的新機型vivo X100系列或許能順暢使用模型能力,但在在市面上早已存在文心一言、訊飛星火等大模型應用的情況下,留給手機端的空間沒有想像中那麼大。 相比於能力,或許vivo這次展示的玩法更值得深究。
**讓手機再智慧一些? **
力推微軟成為 OpenAI 天使投資人的微軟CTO Kevin Scott 曾公開表示,模型本身不是產品,而是基礎設施。 言下之意是在訓練精調出模型底座後,產品化的探索才是一眾玩家們“二次創業”的核心。
大模型於手機端的“再產品化”水到渠成,但部署於手機端的大模型,還需要進一步產品化探索。 從目前曝光的資訊看,vivo將通過一款名為小V助手的應用來實現大模型能力,而目前業內主流路線也是將大模型能力嵌入既有的人工智慧助手之上。
智慧手機消費者存在對大模型理解能力的現實需求,無論是被戲稱為“人工智障”的智慧助手還是在容量爆炸下日益臃腫的應用與數據,都需要手機能更懂交互,幫助使用者梳理資訊。 而大模型的加入,本質上便是為手機帶來自然語言理解能力。
未落地實裝的情況下,端側模型可能出現的功耗、散熱、時延等用戶體驗問題可以暫且不談。 在王陽看來,vivo模型落地面臨的首要問題是多款模型配合使用時,如何區分不同模型的能力邊界以及如何調用,“這關乎最終的產品形態以及呈現”。
面對場景泛化且需求複雜的C端,不同需求調用的模型各不相同。 例如端側的10億規格模型與70億規格模型需要針對用戶本地數據學習,試圖“更懂使用者”。 那麼能否通過模型能力以及與之適配的OS,在手機上實現複雜指令是重要指標。
目前來看,BlueLM展示的複雜指令功能頗具亮點。 在新發佈的OriginOS 4之下,小V助手常駐側邊欄的右下角,點擊即可彈出。 不僅操作邏輯相對雲側模型更短,更適配手機使用,同時也可以理解OS內的一些複雜指令,例如智慧搜索相冊、初步完成第三方App指令以及OS內設置等。
值得一提的是,小V助手在功能與路徑上,和vivo既有的Jovi語音存在隔離,兩者相互獨立,這是明顯有別於此前其他廠商提出的端側大模型路徑。
從功能上看,小V助手基本可以做到Jovi語音的全覆蓋,那麼兩者區分的目的很可能是為了便於使用者感受兩者之間的差別。 而且小V助手的產品邏輯形態與微軟全家桶中搭載的Copilot相似,兩種不同的路徑很可能會在未來完成整合。
這也體現出目前的BlueLM還處於試水階段,產品形態難言成熟。
據參與BlueLM內測人士反饋,以vivo旗艦機型使用模型能力,輸入20 tokens以內的純文本生成需求還存在2s~5s的時延,這對於後續實裝而言不算是個好消息——雲側模型的時延並未得到很好的解決。 這一點或許會在搭載晶元廠商最新AI晶元的機型中得到改善,只是對於消費者來說,這並不構成換機的理由。
此外,作為行業內首個手機大模型,vivo的雲側模型能力還面臨許多雲廠商大模型的“圍剿”。
例如vivo宣佈將上線應用商店的對話機器人藍心千詢,1750億的參數規格與當下應用商店中的大模型相比並不顯眼。 雲廠商中的百度已經就近日發佈的文心4.0專業版試水收費,而藍心千詢看起來更多只是vivo大模型生態中不算亮眼的一員,其道路顯然有阻且長。
不得不提的還有vivo作為後來者,技術沉澱的差距也將限制其大模型業務的進一步推進。
軟體方面,vivo大模型已經成為阿裡雲旗下Pai機器學習平臺的宣傳素材,我們甚至可以從「藍心千詢」的命名中找到「通義千問」的影子。 跑在雲上的業務意味著長期成本,這一點在OpenAI上體現得淋漓盡致。 成本視角下,如果vivo希望將BlueLM發展成為長期生態,自建IDC顯然比上雲更利於長期發展。
硬體方面,華為與蘋果兩家頭部廠商早已在現有產品線中集成自研的NPU能力,vivo則還需依賴於晶元廠商。 即使模型訓練與調優方面可以構築一定壁壘,但作為核心的硬體差距仍導致其與頭部廠商拉開了數個身位。
大模型的終端戰事
大模型的加入,讓我們重新認識到智慧手機的本質是一種集成多種能力的智慧終端,且同時身兼硬體與OS兩大入口。 得天獨厚的條件使得手機天然需要與大模型相結合。
那麼其他終端是否也可以接入大模型,就像重做應用一樣重新定義終端的能力邊界?
對於這一問題的探尋可以追溯到深度學習網路爆發之時,而對端側模型可能性探討也源於業內人“老生常談”的時延、能耗、隱私等問題,大模型的爆發成功地讓手機成為裝舊酒的“新瓶”。
實際上,早在本次往手機里塞大模型的熱潮正式開啟前,新能源車攜自動駕駛早已成為大模型的一個終端。 業內也不乏智慧可穿戴設備搭載大模型的暢想,只是手機似乎即將憑藉場景多樣性與網路便利而後發先至。
更進一步說,當手機廠商密集發佈大模型並投入使用后,屆時便是端側模型的一個絕佳的練兵場。 我們也可以自手機大模型的落地情況,探討多種終端搭載大模型的方法論。
畢竟,無論手機上的模型如何出色,短時間內能做到的最佳表現無非是一位使用者生活領域的“秘書”。 其他智慧終端搭載大模型所帶來的想像力無疑更大。
例如目前因移動支付而逐漸退出歷史舞臺的ATM,能否憑藉大模型,讓使用者無需前往銀行排隊辦理深度業務; 亦或是同屬B端場景的智能攝像頭,在醫療領域識別患者基本體征、在工業領域快速質檢、在農業領域智慧灌溉等。 而今憑藉雲側模型未能廣泛打開的B端市場,也可能將迎來端側這一變數。
這也是為什麼vivo會在其生態尚不及華為、小米完善之時,便在本次發佈會上展示了搭載在新款vivo Watch的藍河操作系統(BlueOS)。 作為vivo面向通用人工智慧時代研發的跨端系統,其推出旨在通過手機帶動一系列IoT產品,無疑具備不錯的想像空間。
vivo亦宣佈開源其7B規格模型,並推出了藍心大模型開發套件BlueKit,生態建設的野心昭然欲揭。 或許目前vivo只走到了讓IoT聽得懂指令的階段,但這對於vivo其後的高端化、生態化等戰略相當重要。
手機大模型的能力未知,面臨的挑戰很多,正式發佈與落地之後,勢必為業內帶來更多“開卷”的方向。 更多千奇百怪的落地姿勢,正在等待業界的解鎖。