AIアシスタントの究極の形態?なぜ投資家はこの「あなたの画面を覗き見る」AI製品に1100万ドルを投資したのか?

執筆者:Leo

今のAIアシスタントは実はかなり「馬鹿」だと気づきましたか?ChatGPTやClaudeを開くたびに、背景情報を再度説明しなければならない。「私はあるプロジェクトを進めている……」「私たちのチームは先日会議を開き、……」「先週メールを送った内容は……」といった具合です。わずか五分でプロンプトを作成して、やっと使える回答を得る。これはおかしい。AIは仕事を簡単にするためのはずなのに、逆に負担を増やしているのでは?

最近、Littlebirdという製品を体験しました。これは、Lotus Studioがリードした1100万ドルのシードラウンド資金調達を完了したばかりです。この製品を通じて、AIアシスタントは一体どのようなものになるべきか、改めて考えさせられました。情報を「投げ込む」ツールではなく、あなたの仕事や生活を理解した上でサポートしてくれる助手のような存在です。本当のアシスタントのように、毎回背景やチーム状況、進行状況を最初から説明する必要はありません。

Littlebirdの創設者Alexander Greenは、資金調達発表時にこう言いました。「コンピュータを使う感覚はますます対抗のようになってきている」と。パソコンを開くたびに、ドーパミンと恐怖の二重刺激を感じる。パソコンは「思考の自転車」であるべきなのに、インターネットのビジネスモデルはすべてを再接続させてしまった。もし製品が無料なら、それはあなたが「商品」であり、あなたの注意を奪うことが目的になる。自転車は逆に私たちを蹴り始めている。この比喩は非常に的確です。私たちは本来、ツールをコントロールすべきなのに、今やツールにコントロールされている。

なぜAIアシスタントはいつも「忘れる」のか

半年以上、ChatGPTからClaude、Notion AI、さまざまなAIライティングアシスタントまで、多くのAIツールを使ってきました。どれも強力ですが、共通の問題があります。それは、私が誰で何をしているのか、何を気にしているのかを全く理解していないことです。会話はまるで初対面のようで、自己紹介や背景説明、コンテキストの提供を何度も繰り返さなければなりません。

具体例を挙げましょう。先週、私は複数部署と連携して製品発表会の準備をしていました。デザインチームとビジュアル案について会議し、市場チームと広報戦略を決め、技術チームとデモの技術詳細を議論しました。これらの会議のメモはバラバラで、Notionにあったり、メールにあったり、口頭だけだったりします。AIにこれらを整理させたいとき、何をすればいいか?すべての情報をコピー&ペーストして、長いプロンプトを書き、会議の内容や決定事項を詳細に説明しなければなりません。準備だけで20分もかかりました。

さらにひどいのは、翌日に修正したいときです。AIは昨日の会話を覚えていないし、覚えていても、昨日の午後にCEOと新しい方向性について話したことを知らない。こうした体験は、AIアシスタントは私を助けるのではなく、むしろ負担を増やしていると感じさせます。もともとの仕事に加え、「教える」時間も必要になるのです。

Littlebirdの創設チームは、この問題について重要な洞察を持っています。AIモデル自体は非常に強力だが、その有用性を制限しているのは、ユーザーデータの不足だと。大規模言語モデルはあなたのことを何も知らない。これが根本的に実用性を制限しているのです。この見解はシンプルに聞こえますが、核心を突いています。私たちはモデルをより賢くしようと議論してきましたが、もっと基本的な問題、すなわち「モデルにユーザーを理解させる」ことを忘れていたのです。

現在、市場にはコンテキスト問題を解決しようとするAIツールが多くあります。ドキュメント検索に特化したもの、会議記録に特化したもの、メール整理に特化したものなど。しかし、これらのツールには共通の制約があります。それは、あなたが積極的に提供した情報だけを見ていることです。ドキュメントをアップロードしたり、Gmailへのアクセスを許可したり、会議中に会議記録機能をオンにしたり。これらはすべて、ユーザーの設定やメンテナンス作業を必要とします。さらに重要なのは、これらのツールはあなたの仕事の全体像を見ていないことです。会議の内容は知っていても、その後のSlackでの議論や、ブラウザで調べた競合情報はわからない。

Littlebirdの違い:スクリーンリーディング技術

Littlebirdは全く異なるアプローチを採用しています。彼らはこれを「スクリーンリーディング(画面読み取り)」と呼びます。この技術は、人間のアシスタントの働き方を思い起こさせます。本当に優れたアシスタントは、何が起きているかを逐一伝える必要はなく、あなたの作業を観察し、重要なことを記憶し、必要なときに教えてくれる。Littlebirdはまさにこれを実現しています。

具体的には、LittlebirdはMacのデスクトップアプリで、あなたの画面上のすべてのテキストを継続的に読み取ります。注意点は、「読み取る」ことであって、「スクリーンショットを撮る」わけではありません。この違いは非常に重要です。以前にはRewind(後にLimitlessに改名され、Metaに買収)やMicrosoftのRecallといった類似製品もありましたが、これらは画面を絶えずキャプチャして保存するものでした。この方法にはいくつかの問題があります。データ量が膨大になる、画像ファイルは大きい、プライバシーの観点からも問題がある。なぜなら、スクリーンショットは視覚情報をすべてキャプチャし、検索も難しくなるからです。

Littlebirdの方法はより賢明です。複雑なスクリーンリーディング技術を用いて、すべてのアプリ内のテキスト内容を理解します。面倒な設定は不要です。誰が何を言ったのか、いつ言ったのかを追跡し、あなたのプロジェクトの進行状況を詳細に把握します。こうして、あなたの生活や仕事の豊かな理解を構築します。誰があなたにとって重要か、どんなプロジェクトを進めているか、今週や今年気にしていることは何か。Green創設者はインタビューで、「この方法はデータを軽量化し、侵入性も低くなる」と語っています。

私がこの設計を特に評価する点は、ソフトウェアの本質を尊重していることです。画面に表示される内容はもともとテキストや構造化データです。なぜそれを画像に変換してから再びテキストに戻す必要があるのか?直接構造化された内容を読み取る方が効率的で正確です。プライバシーの観点からも、テキストデータは視覚データよりも敏感性が低い。パスワードはアスタリスクで隠され、クレジットカード番号もマスクされるが、スクリーンショットはこれらの視覚情報もすべて保存してしまう。

Littlebirdは、パスワードマネージャーやWebフォームの敏感なフィールド(パスワードやクレジットカード情報)を自動的に無視します。ユーザーが特定のアプリを除外する設定も可能です。これにより、ユーザーは自分の情報をコントロールできます。たとえば、プライベートチャットや財務ソフトなど、特定のアプリの内容を見られたくない場合は、簡単に除外設定ができるのです。

受動的に画面内容を読むだけでなく、Littlebirdは他のアプリとも積極的に連携可能です。GmailやGoogleカレンダー、Appleカレンダー、Remindersなどと接続できます。これにより、あなたの仕事や生活の全体像をより深く理解します。画面上の情報だけでなく、スケジュールやToDoリスト、メールのやり取りも把握します。

全コンテキストAIがもたらすもの

AIがあなたの全体的なコンテキストを持つようになると、体験は根本的に変わります。Littlebirdが提供するいくつかのシナリオを見て、これは単なる漸進的な改良ではなく、新しいインタラクションの形だと気づきました。

最も基本的な機能は質問に答えることです。しかし、他のAIツールと違い、Littlebirdの回答はあなたの仕事の深い理解に基づいています。「今日は何をしたか?」「どのメールが重要か?」といった質問です。数日使ううちに、これらのプリセットされたプロンプトはますますあなたに合わせてパーソナライズされていきます。面白いのは、AIがあなたの関心や働き方を学び始める点です。

Green創設者は、自身の体験を共有しています。毎日「今週何が重要か」「何に集中すべきか」と質問し、驚くほど深く考えさせられる回答を得ていると。専門的なアドバイスや指針を得たり、自分の技術知識の穴を埋めたり、夕食の計画に使ったりもしています。これらのシナリオは多岐にわたりますが、共通点は、AIがあなたの生活を深く理解していることです。

また、Littlebirdには会議記録機能も内蔵されており、システム音声をバックグラウンドでキャプチャし、会議の文字起こしや議事録、アクションアイテムを作成します。これは新しいことではなく、市場には多くの会議記録ツールがありますが、Littlebirdの特長は、会議とあなたの他の作業のコンテキストと連携できる点です。

特に興味深いのは、「会議準備(Prep for meeting)」機能です。会議の詳細ビューを開くと、Littlebirdがその会議の準備をしてくれます。過去の会議のコンテキストや関連メール、会社の歴史情報を考慮し、詳細な情報を提供します。さらにRedditなどの情報源からも情報を取得し、特定の製品や会社に対するユーザの意見を教えてくれる。たとえばクライアントと会議をするとき、Littlebirdは「前回何を話したか」「最近のメールや動向」「そのクライアントの最新情報」「ユーザのフィードバック」などを自動整理してくれる。まるで優秀なアシスタントが会議前の準備をしてくれるようです。

もう一つ、「ルーチン(Routines)」という機能も便利です。定期的なリマインダーやレポートを作成するための詳細なプロンプトを設定でき、毎日、毎週、毎月の定期作業を自動化します。たとえば、日次レポートや週次活動報告、昨日の振り返りなど。自分でカスタムのルーチンも作成可能です。これにより、定期的な振り返りや整理をAIが代行してくれるのです。

Littlebirdの内部調査によると、こうした全コンテキストAIの実用性は非常に高いと証明されています。84%のユーザーが週に少なくとも半日分の時間を節約し、80%が日常業務のストレスを軽減したと回答しています。時間の節約は理解できますが、ストレス軽減の方がより深い意味を持ちます。多くの仕事の不安は、重要な情報を見逃すことや忘れること、迅速に対応できないことから生じます。AIがこれらを追跡してくれるとわかれば、自然と不安は減るのです。

プライバシーとコントロールのバランス

画面上のすべての内容を継続的に読み取るLittlebirdの仕組みを知ったとき、最初に思ったのは「これは安全なのか?プライバシーは大丈夫か?」ということです。この懸念は非常に妥当です。もしアプリがあなたのデジタルワークデイを丸ごと観察するなら、信頼が何よりも重要です。

Littlebirdの設計理念は、「デフォルトでプライベート、安全、ユーザがコントロールできる」ことです。技術的には、いくつかの対策を講じています。すべてのデータはAES-256で暗号化して保存し、通信にはTLS 1.3を使用。ユーザーデータは一切、AIモデルの訓練には使われません。これらは基本的なセキュリティ対策ですが、こうした製品には非常に重要です。

さらに、ユーザーのコントロールも徹底しています。いつでもデータ収集を停止できる、特定のアプリやウェブサイトを除外できる、データを一括削除できる。こうした設計により、ユーザーは自分の情報を常に管理できます。特に敏感な内容を扱う場合は、一時的に停止したり、特定のアプリをブラックリストに入れたりできるのです。

Greenはインタビューで、クラウドストレージを選んだ理由についても説明しています。高性能なモデルを動かすには、ローカルでは不可能なためです。これは興味深いトレードオフです。ローカル保存は安全性が高いですが、データはデバイスから出ません。一方、クラウド保存はより強力なAIを使える反面、セキュリティリスクも伴います。Littlebirdは後者を選びつつも、強力な暗号化と厳格なプライバシーポリシーでリスクを抑えています。

また、SOC 2認証を取得し、GDPRやCCPAの規制に完全準拠している点も注目です。これらの認証やコンプライアンスは、特にスタートアップにとっては大きな証明です。安全性とプライバシーを最優先に設計していることの証です。

もう一つ重要なポイントは、Littlebirdは視覚情報を一切保存せず、テキストだけを保存していることです。これにより、データの軽量化と侵入性の低減が実現しています。Greenは、「RecallやRewindが難しいのは、スクリーンショットのデータ量が多すぎるからだ」とも述べています。スクリーンショットは、個人の写真や動画などの視覚的な情報もすべて保存してしまいますが、テキスト記録はあくまで記述された内容だけです。

この設計は、より大きな問いを投げかけます。私たちはAIにどの程度まで理解させたいのか?完全な透明性は最大の便利さをもたらす一方、最大のリスクも伴います。Littlebirdのアプローチは、ユーザー自身がその境界を決められることです。すべてを見せることも、制限することもできる。この柔軟性は非常に重要です。人やシナリオによって、プライバシーの要求は異なるからです。

AI製品にとって何を意味するのか

Littlebirdの物語は、私にAI製品のあり方を再考させました。私の見解では、この製品はいくつかの重要な理念を体現しています。すべてのAI開発者が考えるべきポイントです。

第一は、コンテキストの重要性です。Lenny Rachitskyはこう言っています。「AIの良し悪しは、その持つコンテキスト次第だ。そして、AIはあなたの一日のことをあまり理解していない」と。これは、現在のAI製品の核心的な問題を突いています。私たちはモデルやアルゴリズムの改善に注力してきましたが、基本的な事実を見落としている。どんなに賢いAIでも、ユーザーの具体的な状況を理解していなければ、役に立つ答えは出せません。

これを踏まえ、以前のAI製品の誤解も思い出します。多くのチームは、RAG(検索強化生成)システムを構築し、AIにさまざまなデータソースにアクセスさせようとしました。これは間違いではありませんが、方法が間違っている可能性もあります。ユーザーに文書をアップロードさせたり、さまざまなアプリへのアクセスを許可したりするのではなく、AIにユーザーの作業を観察させる方が効果的です。Littlebirdのスクリーンリーディング技術は、受動的ながらも包括的なコンテキスト収集の方法であり、能動的で散発的な接続よりも優れています。

第二のポイントは、キラー(決定打)となるユースケースを見つけることの重要性です。Rachitskyは、Long-term success of Littlebirdについて、「それは絶対に必要なシナリオを見つけることだ」と述べています。多くの人はすでに自分にとって不可欠なシナリオを見つけており、チームもそれに注力しています。これは非常に実践的な考え方です。AI製品を作るチームは、「万能」なツールを目指しがちですが、結果的に何も極められないこともあります。

Rachitskyはまた、面白い製品開発の哲学も共有しています。「人々があなたの製品をどう使うかを本当に知るのは、リリースしてみて初めてだ。戦略は早めにリリースし、使い方を見て、そこに投資を集中させることだ」と。これは従来のソフトウェア開発の考え方と大きく異なります。従来は計画、設計、改善を重ねてからリリースしますが、AI製品は継続的な実験のようなもので、能力の境界が曖昧だからです。ユーザーは予想外の使い方を見つけることも多い。

投資家のフィードバックからも、さまざまなシナリオが見えてきます。DocSendの共同創業者兼CEOのRuss Heddlestonは、「このツールを使って自社のマーケティングサイトを書き直した」と述べています。会議、メール、Notionなどのコンテキストを活用しています。GoogleやFacebookの元プロダクト責任者Gokul Rajaramは、「この製品は記憶や検索、再解釈の摩擦を解消した」と。Rachitskyは、「このツールは生産性や幸福感を高める」とも。

これらのシナリオは多岐にわたります。マーケティング文案の作成から個人の生産性向上まで、すべての根底には「AIがユーザーのコンテキストを深く理解している」ことがあります。これは、Littlebirdの仮説の正しさを裏付けています。AIがあなたの背景を理解すれば、自然と適したシナリオが生まれる。事前にすべての機能を計画しなくても良いのです。

第三の示唆は、製品のポジショニングの微妙さです。Littlebirdは自らを「静かなコンピュータの未来」と位置付けています。この表現は詩的ですが、的確でもあります。今の多くのAI製品は、あなたの注意を引こうと通知やリマインダーを出し続けます。しかし、Littlebirdの理念は、バックグラウンドで静かに働き、必要なときだけ現れることです。この「静かさ」は、全コンテキストAIの必然的な特徴かもしれません。もしAIがあなたを深く理解しているなら、頻繁に中断して情報を求める必要はなく、静かに学習し準備できるのです。

現在のビジネスモデルは無料ですが、高度な機能は月額20ドルからのサブスクリプションです。妥当な価格だと思います。毎週半日分の時間を節約できるなら、20ドルは十分に価値のある投資です。ただ、今後の展開次第では、企業向けやチームコラボレーションの機能も進化していくでしょう。

未来についての私の考え

Littlebirdのコンセプトを体験して、より大きな問いを持ちました。未来のAIアシスタントはどうあるべきか?

私は、「ツール型AI」から「パートナー型AI」への移行を感じています。ツール型AIは、今のChatGPTのように、必要なときに開き、使い終わったら閉じる。毎回新しいスタートです。一方、パートナー型AIは、Littlebirdのように、常にそばにいて、あなたの仕事や生活を理解し、積極的に助けてくれる。これは能力の差ではなく、関係性の違いです。

この変化は、いくつかの面白い変化をもたらします。たとえば、さまざまなAIツールを使い分ける必要がなくなるかもしれません。今はライティングアシスタント、コーディングアシスタント、データ分析アシスタント、会議アシスタントなど、多種多様なAIがありますが、もし一つのAIがあなたのすべてを理解していれば、シナリオに応じて一貫したサポートを提供できるでしょう。

もう一つは、プロンプトエンジニアリングの重要性が低下する可能性です。今は良いプロンプトの書き方を学び、十分なコンテキストを与え、AIに望む答えを引き出す努力をしています。しかし、AIがすでに十分なコンテキストを持っているなら、単に意図を伝えるだけで済むかもしれません。人間のアシスタントと話すのと同じ感覚です。背景を詳細に説明しなくても、彼女はすでに知っている。

ただし、この全コンテキストAIには新たな課題もあります。一つは心理的な適応です。AIが継続的にあなたの作業を観察していると知ると、理性的には安全だとわかっていても、感情的には違和感を覚えることも。まるで同僚がずっとあなたの画面を見ているような感覚です。こうした新しい関係に慣れるには時間が必要です。

もう一つは依存性です。AIにすべてを記憶させ、整理させ、会議の準備まで任せると、自分の記憶力や組織力は衰えるのではないか?これはGPSが方向感覚に与える影響に似ています。多くの人はナビゲーションに頼りきりで、自力で道を見つける能力が低下しています。AIアシスタントも同じ効果をもたらすかもしれません。

業界の観点から見ると、Littlebirdは新たな製品カテゴリーの出現を示しています。それは、「会議記録ツール」や「ドキュメント検索ツール」ではなく、「全コンテキストAIアシスタント」です。このカテゴリーの特徴は、継続的に観察し、包括的に理解し、積極的にサービスを提供すること。今後、多くの企業がこの分野に参入し、競争は次のような軸で展開されるでしょう:誰のコンテキスト収集がより包括的か、誰のAI理解がより正確か、誰のプライバシー保護がより信頼できるか。

Littlebirdの1100万ドルの資金調達は始まりにすぎません。投資者には、プロダクト、デザイン、コンテンツの著名人も含まれています。これらの投資者は資金だけでなく、実際に重度のユーザーでもあり、フィードバックやシナリオ提供も行います。こうした投資者の構成は、絶え間ない改善とシナリオ発見を必要とするAI製品にとって、資金以上の価値をもたらす可能性があります。

今後の展望に私は期待しています。Littlebirdは、Windowsや他のプラットフォームに拡大するのか?企業向けのバージョンはどうなるのか?チームコラボレーションの機能は?そして何より、「これなしでは仕事ができない」と思わせる決定的なユースケースを見つけられるのか。

Greenは資金調達の際にこう言いました。「本当にあなたを理解するAIを作れるのか?できると信じている。見せたい」と。これは約束であり、挑戦でもあります。Littlebirdはまだ初期段階で、継続的な研究プロジェクトです。すべての詳細を正確に捉えるわけではなく、時には休暇中の同僚や、すでに完了したプロジェクトを見逃すこともあります。でも、その理解の深さには驚かされるでしょう。

私は、全コンテキストAIこそが未来だと信じています。技術の華麗さではなく、これこそがAIの本来あるべき姿だからです。AIの約束は、私たちをより効率的に、集中させ、創造性を高めることにあります。しかし、AI自体が大量の人手による入力やメンテナンスを必要とするなら、その約束は破られることになります。私たちの理解と適応に基づいてこそ、AIは「思考の自転車」となり、より速く遠くへと私たちを運んでくれるのです。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン