看到 @SentientAGI 发布的SERA-Crypto技术报告,感觉开源架构正在重新定义AI Agent的性能边界。



在DMind基准测试中击败Perplexity Finance和Gemini,仅以不到3%的差距落后于Claude 4.5和GPT-5。

在内部加密分析基准测试中排名第一,超越了所有现有AI系统——GPT-5 Medium Reasoning、Grok 4和Perplexity Finance。

—————————————————————————

伝統的なReActシステムの複雑な推論ループは遅延を引き起こし、ツール呼び出しの一貫性に欠け、複数のAPI呼び出しを並行処理できません。

例えば、ユーザーが「Lidoが今後6ヶ月間にstETHのアンカー解除リスクに直面する程度」を尋ねた場合、システムはTVLトラッカー、ステーキングAPI、オンチェーントラフィックプロバイダー、デリバティブデータなど50以上のエンドポイントを調整する必要があります。

SERAは埋め込みマッチングによるルーティング推論を採用しています。

—————————————————————————

SERAアーキテクチャは、各入力クエリを再表現し、埋め込み、その後2つの独立した埋め込みインデックス(ツールインデックスとプロンプトテンプレートインデックス)と比較します。

ツールインデックスには、50以上のエンドポイントの説明が含まれています:マーケットデータAPI、TVLトラッカー、オンチェーントラフィックプロバイダー、デリバティブデータ、ソーシャル感情APIなど。

プロンプトインデックスには、11種類の暗号クエリカテゴリの簡潔な説明と関連テンプレートが含まれています。

ルーティングとプロンプト生成を埋め込み層に移すことで、SERAはReActループを回避し、異なるクエリカテゴリに対して一貫して同じツールを選択し、複数のツール呼び出しを並行して実行し、平均遅延を45秒以下に維持します。

—————————————————————————

完全オープンソースの技術スタックは、アーキテクチャの優位性が計算能力を上回ることを証明しています。

@SentientAGI のオープンソースシステムがコストと遅延の両面でクローズドソースの代替を上回るとき、AIエージェントの形態は質的に変化します。
STETH0.8%
GROK1.5%
GPT-0.07%
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン