Prime Intellect開放Lab平台:Agent後訓練做成閉環,按token計費不按GPU時長

robot
摘要生成中

幣界網消息,Prime Intellect宣布其Agent後訓練平台Lab已從beta階段轉為正式版。該平台將評估、強化學習(RL)訓練、適配器部署和推理整合成一條閉環,使用者可以定義任務和評分標準,平台自動驅動模型在任務中反覆試錯、收集獎勵信號,並訓練Lora適配器。訓練按token計費而非按GPU時長,底層基於公司開源的Prime-RL框架。Lab首批支持英偉達、OpenAI、Meta和Qwen的14個模型,參數從1B到70B,涵蓋稠密和MOE架構。Prime Intellect成立於2023年,累計融資超過7000萬美元,A輪由Founders Fund領投,B輪由Radical Ventures領投。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆