Prime Intellect开放Lab平台:Agent后训练做成闭环,按token计费不按GPU时长

robot
摘要生成中

币界网消息,Prime Intellect宣布其Agent后训练平台Lab已从beta阶段转为正式版。该平台将评估、强化学习(RL)训练、适配器部署和推理整合成一条闭环,用户可以定义任务和评分标准,平台自动驱动模型在任务中反复试错、收集奖励信号,并训练Lora适配器。训练按token计费而非按GPU时长,底层基于公司开源的Prime-RL框架。Lab首批支持英伟达、OpenAI、Meta和Qwen的14个模型,参数从1B到70B,覆盖稠密和MOE架构。Prime Intellect成立于2023年,累计融资超7000万美元,A轮由Founders Fund领投,B轮由Radical Ventures领投。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论