携帯電話には大きなモデルが詰め込まれていますが、それはほんの始まりにすぎません

出典: Photon Planet

画像ソース: Unbounded AIによって生成

新しいフライホイールを早急に探す必要がある携帯電話メーカーは、大型モデルに目を向けています。

8月上旬に開催された開発者会議で、HuaweiはHarmonyOS 4のAIアシスタントであるXiaoyiを大規模モデルに統合すると発表し、8月末にテストを依頼しました。 Xiaomiはまた、AIアシスタントXiaoaiの招待テストを開始し、ほぼ同時に大型モデルにアクセスしました。 OPPOとvivoがこれに続き、両社とも11月に大型モデルの携帯電話の実験を開始しました。

「大型モデルを携帯電話に詰め込む」ことは業界では目新しいことではなく、10月中旬から集中的にウォーミングアップしてきたvivoは言うまでもなく、Rongmi O threeは今年開催された記者会見で関連するニュースを明らかにしました。 業界の一般的な見方では、スマートフォントラックのハードウェア部分はほとんど展開不可能であり、クラウドで実行されている大規模なモデルのほとんどは、ハードウェアから解放された変数にすぎません。

デバイス側の展開は、大規模なモデルトラックの業界トレンドでもあることに注意してください。 ChatGPTを例にとると、クラウド側の大規模モデルの代表格として、そのトレーニングと推論はMicrosoftのAzure上で実行され、ユーザーはブラウザやアプリを通じて結果を取得します。 入出力と前後の間には、ユーザーエクスペリエンスに影響を与える遅延だけでなく、エネルギー消費やコンピューティングパワーなどのクラウドコストも発生します。

実際のシナリオやニーズの観点から見ると、エッジデバイス、特に携帯電話、PC、新エネルギー車など広く利用されている端末では、多くのニーズを満たすことができます。

その結果、大型モデルのエンドサイド展開が徐々にコンセンサスとなり、携帯電話メーカーがモデルのトレーニングに力を入れているだけでなく、PCトラックのLenovoとチップトラックのQualcommも、エンドサイドAIの関連ソリューションをしばらく前にリリースしています。 特に、発売されたばかりのQualcomm Snapdragon 8 Gen3とMediaTek Dimensity 9300は、そのAI性能の向上が携帯電話の大型モデルの基礎といえます。

業界のニーズとハードウェアの条件が満たされ、大型モデルがついに携帯電話に参入できるようになりました。 意外なのは、携帯電話メーカーとして初めて「完成品」を出したのが生体内だということです。

**生体内大型モデルの状態は? **

11月1日、vivoは開発者会議を開催し、10億、100億、1000億などの異なるパラメータスケールを含む自社開発の大規模モデルマトリックス「BlueLM」をリリースしました。 同時に、大規模なモデルに適応した自社開発のオペレーティングシステムであるOriginOS 4もリリースしました。

大型模型の「約束の地」を前に、vivoの熱意が顔に刻まれている。

市場調査会社Canalysが10月26日に発表した最新データによると、vivoの出荷台数は減少し、順位も下がった。 vivoは流れを変えるために大型モデルとOriginOS 4を緊急に必要としており、それが最初に「本を開く」ことは驚くべきことではありません。

そして、ラージモデルと比べると、今回vivoが発売したOriginOS 4のアップデートスパンがやや弱いです。 パブリックドメインの議論では、仮想グラフィックスカードの反復、異種コンピューティングスペース、軽量化が期待どおりではないだけでなく、生体ユーザーの間で非常に騒々しいアトミック通知などのモジュールもアップグレードされていません。 言い換えれば、この会議の主役はラージモデルです。

ビジネスモデルの観点から見ると、今回の記者会見でのvivoのルートは、人工知能アシスタントをキャリアとして、デバイス側+クラウド側のハイブリッド展開方式を採用し、メインのプレイであるデバイス側の大規模モデルがローカライゼーションと軽量化の明らかな特徴を提示する、これまでの業界の他のプレーヤーのルートと似ています。

この目的は明らかで、携帯電話の小さな世界が提供する消費電力と計算能力は、コンピューター室のものと同じではありません。 モデル機能と携帯電話の奥深さをいかに組み合わせるかこそが、携帯電話メーカーが早急に突破しなければならない「ノウハウ」となっています。

この点で、vivoの解決策は、マルチパラメータ仕様モデルを立ち上げることであり、そのうち10億の仕様は主にテキストシナリオ用であり、70億の仕様は自然な対話と知識の質問と回答の望遠がデバイス側の展開のハイライトです。 公式の紹介では、10億の仕様はデバイス側に向けられ、70億の仕様はデバイスとクラウドのデュアルパーパスに設定されており、700億からすべてクラウドにデプロイされており、デバイスとクラウドのコラボレーションにおける「神は神に戻り、シーザーはシーザーの神に戻る」というvivoのマトリックスの考えも反映されています。

これは、今年5月にGoogleがI/O開発者会議で発表した4つのパラメータ仕様を持つ大規模モデルPaLM2と同じで、そのうち小型パラメータモデルはオフライン状態で毎秒20トークンを処理でき、端末のオフライン利用に適しています。

vivoが「人の歯をほじっている」と思っているなら、それは厳しすぎます。 実際、vivoは早くも2017年に社内AIチームの設立に着手し、現在、vivo AI Research Instituteには1,000人以上の研究者がいます。

その技術的な沈殿物は一般的にAliやBaiduなどの最初の段階に劣っていますが、オープンソースコミュニティの存在により、少し遅れて市場に参入したプレーヤーは、大軍にすぐに追いつくこともできます。 vivoが2018年に設立したナレッジグラフ研究所も、携帯電話メーカーとして遭遇する可能性のあるトレーニングデータの不足をある程度強化することができます。

モデル能力に関しては、ウォームアップ期間中にvivoから良い解答用紙を手渡されました。 BlueLMは、第三者評価セットC-of Chinese Large Modelの「アクセス制限モデル」のカテゴリーで1位を獲得したと報じられています。 公式発表によると、BlueLMは業界初の7Bデバイス側大型モデル。

しかし、評価では高得点を取ったものの、実態が芳しくないというモデルも少なくなく、業界内では、このリストは過去に「抹消」されたものであり、モデルの「疑問をこなす」能力を表しているだけで、推論力や安全性、適応力を反映していないという声も少なくありません。 この観点から、vivoのビジネス成果には、より実践的なテストが必要であることは明らかです。

さらに、文生図や相互作用などのvivoの現在のクラウドモデル機能は、大規模モデルの罠から飛び出しておらず、目新しさは限られています。 また、主要な役割であるデバイスサイドのモデル機能はまだテスト段階であり、エンドサイドの機能の表示は携帯電話のハードウェアによって必然的に制限されます。

Blue Heartの社内テストに招待されたユーザーの多くは、X90 Proに代表されるフラッグシップフォンを使用しており、これらのモデルは、vivoがリリースする大規模モデルアプリケーションのパブリックベータ適応スケジュールでも最高であることがわかりました。

図を入力して、次のように言ってください

大型機種が携帯電話メーカーがハイエンドを開拓する第2の戦場になりつつあることは間違いないし、ユーザー活性化やIoT活性化のための重要な変数でもある。 それにもかかわらず、大規模なモデルに依存することでハイエンド製品の価値を高めるというvivoの意図には、まだ多くの変数があります

結局のところ、大型モデルの発売は、vivoのハイエンドの新たな礎石であるだけでなく、新しいマシンやハイエンド製品を引っ張っていく試みでもある。

ローエンドモデルは、当然のことながら、このハイエンドの戦争に対処するのは困難です。 この記者会見の前にvivoがリリースしたベーシックモデルY100を例にとると、これは上記の適応計画の最新モデルの1つであり、このような同様の「バックスタブ」の動きの背後には、ハイエンド製品で王座に返り咲きたいというvivoの「小さなそろばん」の希望があります。

それでも、大型モデルの発売は、vivoのハイエンド製品にとってプラスではありません。

デバイス側の大規模モデルのオープンソースコミュニティ起業家であるWang Yang氏(仮名)は、デバイス側の大規模モデルの能力は、NPU(ディープニューラルネットワークコンピューティング用に特別に設計されたプロセッサ)によってもたらされるAIパフォーマンスにあるとPhoton Planetに語った。 しかし、生体内の先行機種ではNPUの能力に注意を払っていなかったため、旧型では大型機種をスムーズに動かすことが難しくなることになりそうです。

今後のリリースについては、MediaTek Dimensity 100フラッグシップチップと新世代のAIプロセッサを搭載した新しいモデルのvivo X9300シリーズは、モデル機能をスムーズに使用できる可能性がありますが、Wenxin YiyanやiFLYTEK Xinghuoなどの大規模なモデルアプリケーションがすでに市場に出回っている場合、携帯電話に残されたスペースは想像ほど大きくありません。 実力と比べると、今回vivoが見せたゲームプレイは、より深く研究する価値があるのかもしれません。

**携帯電話をスマートにしますか? **

MicrosoftをOpenAIのエンジェル投資家に後押ししたMicrosoftのCTOであるKevin Scott氏は、モデル自体が製品ではなくインフラであると公言しています。 つまり、トレーニングによってモデルベースが微調整された後、製品化の探求は、多くのプレーヤーの「第2の起業家精神」の中核となるということです。

携帯電話に搭載される大型モデルの「再製品化」は当然ですが、携帯電話に展開される大型モデルには、さらなる製品化が必要です。 これまでに公開された情報から判断すると、vivoはXiao V assistantと呼ばれるアプリケーションを通じて大規模モデル機能を実現し、現在の業界の主流ルートは、既存の人工知能アシスタントに大規模モデル機能を埋め込むことです。

スマートフォンユーザーは、冗談めかして「人工知的障害」と呼ばれるスマートアシスタントであろうと、容量の爆発的な増加によるアプリケーションやデータの肥大化であろうと、大規模なモデルを理解する能力を本当に必要としています。 大規模なモデルの追加は、基本的に携帯電話に自然言語理解機能をもたらすためです。

実装されていない場合、デバイス側のモデルで発生する可能性のある消費電力、熱放散、遅延などのユーザーエクスペリエンスの問題は、当面無視できます。 Wang Yang氏の見解では、vivoモデルが直面する主な問題は、異なるモデルの能力境界をどのように区別するか、および複数のモデルが一緒に使用される場合にそれらをどのように呼び出すかであり、「これは最終製品の形態とプレゼンテーションに関連しています」。

一般化されたシナリオと複雑な要件を持つ C 側に直面して、異なる要件によって呼び出されるモデルは異なります。 例えば、デバイス側の10億仕様モデルや70億仕様モデルは、「ユーザーをよりよく理解する」ために、ユーザーのローカルデータから学習する必要があります。 したがって、モデルの能力とそれに適応したOSを使用して、携帯電話に複雑な命令を実装できるかどうかは重要な指標です。

これまでのところ、BlueLMによって実証された複雑なコマンド関数は非常にハイライトです。 新しくリリースされたOriginOS 4では、Vアシスタントはサイドバーの右下隅にあり、クリックするとポップアップできます。 携帯電話での利用に適したクラウドサイドモデルよりも操作ロジックが短いだけでなく、アルバムのインテリジェント検索、サードパーティアプリコマンドの事前補完、OS内設定など、OS内の複雑な命令もあります。

特筆すべきは、小型のVアシスタントは、機能や経路の面でvivoの既存のJovi音声から分離されており、この2つが互いに独立しており、これまで他社が提案してきたデバイス側の大型モデル経路とは明らかに異なる点です。

機能的な観点から見ると、小型のVアシスタントは基本的にJoviの声をフルカバーできるため、この2つを区別する目的は、ユーザーが2つの違いを感じやすくすることになりそうです。 さらに、小型のVアシスタントの製品ロジックは、Microsoftのファミリーバケットに搭載されているCopilotのロジックと似ており、将来的には2つの異なるパスが統合される可能性があります。

これは、現在のBlueLMがまだテスト段階にあり、製品形態が成熟しているとは言い難いことも反映しています。

BlueLM内部テストに参加した人からのフィードバックによると、vivoのフラッグシップモデルのモデル機能では、20トークン以内のプレーンテキスト生成要件に2s~5sの遅延があり、その後の実装にとって良いニュースではありません-クラウド側モデルの遅延は十分に解決されていません。 これは、チップメーカーの最新のAIチップを搭載したモデルでは改善される可能性がありますが、消費者にとっては、これは携帯電話を変更する理由にはなりません。

さらに、業界初の携帯電話モデルとして、vivoのクラウド側モデル機能は、多くのクラウドベンダーの大規模モデルの「包囲」にも直面しています。

例えば、vivoは会話型ロボット「Lanxin Qianxun」をアプリストアで発売すると発表しましたが、1750億個のパラメータ仕様は、現在のアプリストアにある大型モデルと比べると目立たないものです。 クラウドベンダーの中では、Baiduは最近リリースされたWenxin 4.0プロフェッショナルバージョンをすでに有料化してテストを行っていますが、Lanxin Qianxunはvivoの大規模モデルエコシステムの中ではあまり目立たないメンバーのようで、その道のりは明らかに妨害的で長いです。

なお、vivoは後発であり、技術の差も大型モデル事業のさらなる進出を阻むことになる。

ソフトウェア面では、vivo大規模モデルはAlibaba Cloudの機械学習プラットフォーム「Pai」の販促資料となっており、「Blue Heart Qianwen」の名前から「Tongyi Qianwen」の影さえ見出すことができます。 クラウド上での実行は長期的なコストを意味し、これはOpenAIに最も鮮やかに反映されています。 コストの観点から見ると、vivoがBlueLMを長期的なエコシステムに発展させたいのであれば、クラウド移行よりも自社開発のIDCの方が長期的な開発に適していることは明らかです。

ハードウェアに関しては、大手メーカーであるHuaweiとAppleは、すでに自社開発のNPU機能を既存の製品ラインに統合していますが、vivoは依然としてチップメーカーに依存する必要があります。 モデルのトレーニングとチューニングには一定の障壁が構築できますが、コアとしてのハードウェアのギャップは、依然として大手メーカーとのいくつかのポジションにつながります。

ラージモデルターミナルバトル

大型モデルが加わったことで、スマートフォンの本質は複数の機能を統合したスマート端末であり、ハードウェアとOSの両方の入り口を備えていることを再認識させられます。 この独特な条件により、携帯電話が大型モデルと組み合わされるのは自然なことです。

では、他の端末も大きなモデルに接続して、アプリケーションをやり直すのと同じように、端末の機能境界を再定義することはできるのでしょうか?

この問題の探求は、深層学習ネットワークの流行にまでさかのぼることができ、エンドサイドモデルの可能性の議論は、遅延、エネルギー消費、プライバシー、および業界におけるその他の問題という「決まり文句」の問題にも起因しています。

実際、大型車を携帯電話に詰め込むブームが本格化するずっと前から、自動運転を搭載した新エネルギー車はすでに大型車の端末になっていました。 スマートウェアラブル機器には大型モデルが搭載されているという業界想像に事欠きませんが、シーンの多様化やネットワークの利便性から、携帯電話が先手になりそうです。

さらに、携帯電話メーカーが大型機種を集中的に発売し、実用化すれば、エンドサイドモデルの格好の育成の場となる。 また、携帯電話の大型モデルの上陸から大型モデルを搭載したさまざまな端末の方法論についても議論できます。

結局のところ、電話のモデルがどんなに優れていても、短期間で達成できる最高のパフォーマンスは、ユーザーの生活の分野での「秘書」にすぎません。 他のスマート端末の大型モデルがもたらす想像力は間違いなく大きいです。

たとえば、モバイル決済により歴史的な段階から徐々に撤退しているATMは、大規模なモデルに依存して、ユーザーが銀行をスキップして詳細なビジネスのために列に並ぶことができます。 また、医療分野では患者の基本的な兆候、産業分野では迅速な品質検査、農業分野ではインテリジェントな灌漑を識別するBエンドシナリオに属するスマートカメラでもあります。 さて、クラウドサイドモデルに頼って広く開かれてこなかったBエンド市場も、エンドサイドの変数の到来を告げるかもしれません。

これは、vivoがこの記者会見で新しいvivo Watchを搭載したBlue Riverオペレーティングシステム(BlueOS)を展示する理由でもありますが、その生態学はHuaweiやXiaomiほど完璧ではありません。 一般的な人工知能の時代に向けてvivoが開発したクロスターミナルシステムとして、その発売は、間違いなく優れた想像力を持つ携帯電話を介して一連のIoT製品を駆動することを目的としています。

vivoはまた、7B仕様モデルのオープンソースを発表し、エコロジカルな建設に対する明確な野心であるBlueKit開発キットを発表しました。 おそらく現時点では、vivoはIoTに指示を理解させる段階にしか達していませんが、これはvivoの将来のハイエンド、エコロジカル、その他の戦略にとって非常に重要です。

携帯電話モデルの機能は未知数であり、多くの課題があり、正式リリースと上陸の後、それは業界により多くの「オープンボリューム」の方向性をもたらすに違いありません。 より奇妙な着陸姿勢が業界によって解き放たれるのを待っています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)