Khoản đầu tư của Giám đốc điều hành OpenAI Sam Altman vào phần cứng AI thực sự đầu tiên trong lịch sử loài người, AI Pin, là sản phẩm phần cứng hot nhất thế giới trong hai ngày qua. Nếu bạn vẫn chưa biết về sản phẩm này, bạn có thể xem video này để tìm hiểu.
Công ty đứng sau nó, Humane, được thành lập bởi Imran Chaudhri, một cựu nhà thiết kế danh dự của Apple, và Bethany Bongiorno, cựu giám đốc hệ thống của Apple, người đã tham gia vào việc phát triển iPhone ban đầu, và thậm chí cả nguyên mẫu với bánh xe cuộn mà Steve Jobs đã chế giễu khi iPhone được phát hành lần đầu tiên. Ông đã rất không hài lòng khi rời Apple đến nỗi ông đã gửi một email cho toàn bộ nhân viên và viết một bài thơ trước khi quyết định rời đi: "Đáng buồn thay, dòng sông khô cạn, và đó là khi bạn tìm kiếm một cái mới". Sau đó, Apple sa thải ông.
Cổ đông lớn nhất đằng sau Humane là Sam Altman, và với tư cách là AI Pin, "phần mềm" của nó là GPT-4. Thông báo của nó trùng với hội nghị nhà phát triển của OpenAI, nơi đã tàn sát một loạt các công ty khởi nghiệp AI, và Sam Altman là người cha lớn của nó, và cuộc thảo luận ngay lập tức xoay quanh "liệu đó có phải là iPhone mới hay không".
Tuy nhiên, nếu bạn nhìn kỹ hơn vào AI Pin, bạn sẽ thấy rằng ý nghĩa của nó không phải là đen trắng - nó là một kẻ giết iPhone hoặc nó chỉ là sự cường điệu hoàn toàn, và nó không phải là. Trên thực tế, nó là sản phẩm thử nghiệm đầu tiên của ý tưởng "phần cứng mới" trong kỷ nguyên AI. Theo lời của đồng nghiệp Luo Yihang của tôi, đó là "một plug-in cứng cho ChatGPT".
Những người được Jobs bảo trợ biết mật khẩu của Jobs: phương pháp tương tác cực kỳ triệt để, và trải nghiệm người dùng cực kỳ bảo thủ và hạn chế, giống như iPhone hồi đó.
Mánh lới quảng cáo lớn nhất của AI Pin là nó không có màn hình, điều này thay đổi cách nó tương tác trong một cú ngã. Bạn chỉ có thể sử dụng nó hầu hết thời gian thông qua ngôn ngữ tự nhiên, và nhiều hơn một chút thông qua cử chỉ. Điều này hoàn toàn được tùy chỉnh dựa trên khả năng của ChatGPT, bởi vì một trong những cuộc cách mạng lớn nhất trong LLM (mô hình ngôn ngữ lớn) là thúc đẩy sự phổ biến của LUI (giao diện người dùng ngôn ngữ) và chân AI này gần như là một trò chơi để sử dụng LUI đến mức cực đoan.
Điều này cũng xác định rằng nó là một đối tượng thử nghiệm. Gần đây, người phụ trách một sản phẩm ứng dụng cấp quốc gia với hàng trăm triệu người dùng ở Trung Quốc nói với tôi rằng họ đã sử dụng LUI để chuyển đổi sản phẩm rất kỹ lưỡng và rất nhiều mã cơ bản đã được viết lại, nhưng ông tin rằng LUI không phải là một bản nâng cấp thay thế đơn giản, mà là một lựa chọn song song mang lại những khả năng mới. Cuối cùng, LUI sẽ kết hợp GUI (Gesture User Interface) để tạo ra các sản phẩm phần cứng thuộc kỷ nguyên AI.
Đó là những gì AI Pin làm. Một số chức năng được gọi bằng ngôn ngữ tự nhiên, và một số được gọi bằng cử chỉ đơn giản, đó cũng là một điểm thú vị để thế giới bên ngoài thốt lên, sau khi đọc Demo của nó, tôi nghĩ đây thực sự là "phần cứng" của AI Agent. Một mô hình lớn có một thực thể Pin, ghim nó vào ngực của bạn và bling-bling blind, hoặc đơn giản là biến nó thành một mặt dây chuyền như một công ty khởi nghiệp phần cứng AI khác, Rewind. Điều này có thể biến thành một xu hướng.
Nhưng AI Pin, về ngoại hình và chức năng, nghe có vẻ hơi giống Misfit, sản phẩm đã tạo ra "trâm cài thông minh" cách đây 10 năm? Vào thời điểm đó, có rất nhiều "thiết bị đeo được" có gân gà như vậy, và Google Glass, phổ biến và biến mất nhanh hơn. Liệu endgame của AI Pin có giống với trò chơi của họ không?
Câu trả lời cho điều này quay trở lại với sự hiểu biết về "trí thông minh". 10 năm trước, cho dù đó là Google Glass, Misfit hay nhiều loại vòng đeo tay thông minh và đồng hồ thông minh, không phải tất cả chúng đều là "phần cứng chậm phát triển trí tuệ"? Ít nhất một điều bạn phải tin là với GPT-4 là "phần mềm", AI Pin thực sự đã mở ra một giai đoạn mới của phần cứng "thông minh". Khả năng cốt lõi của nó nằm ở việc sử dụng tương tác ngôn ngữ và tương tác hành động để gọi các tác nhân AI. Hoặc đơn giản, bạn chỉ nghĩ về Ghim AI như một tác nhân AI treo trên ngực để làm mù mắt người khác.
Bản chất của AI Agent là sự kết hợp giữa các ứng dụng và chức năng AI với các mô hình ngôn ngữ lớn làm khả năng cốt lõi dựa trên nhu cầu tùy chỉnh của cá nhân hoặc tổ chức và nó có mức độ cá nhân hóa cao và định hướng kịch bản: gõ vào ghim trên ngực bạn, thì thầm vài từ với nó, mở lòng bàn tay của bạn, xem một chuỗi các ký tự có màu sắc rực rỡ, cho bạn biết cách được đề xuất để giải quyết vấn đề, cho bạn biết dữ liệu của bên kia là chìa khóa hoặc trực tiếp đặt thực đơn nhà hàng bằng tay kia cho bạn. Điều đó thông minh hơn rất nhiều so với những chiếc vòng đeo tay đồng hồ đó. Tất nhiên, điều này cũng cho thấy rằng không giống như phần cứng theo nghĩa truyền thống, bản thân AI Pin sẽ không phải là một phần cứng đa năng, mà là một "plug-in cứng" để nhận ra AI tùy chỉnh.
Vì nó là một "plug-in cứng", tự nhiên có một hệ thống hoàn toàn mới đằng sau nó. Hệ thống mới này không còn dựa trên một phần cứng, mà dựa trên một mô hình ngôn ngữ lớn. Nhìn lại iPhone - đó là iPhone và sau đó là App Store, đến nỗi Apple vẫn là một công ty phần cứng về doanh thu ngày nay. Vậy điều gì sẽ xảy ra nếu có một "App Store" mạnh mẽ trước tiên? OpenAI và AI Pin đang thực hiện một kịch bản ngược như vậy.
Mọi người đều biết rằng mọi người chú ý đến AI Pin vì OpenAI và ChatGPT đằng sau nó, và những người sáng lập AI Pin tự biết điều đó. Cũng giống như các nhà phát triển phần mềm sẵn sàng bị Apple đánh thuế vì họ phụ thuộc vào phần cứng của Apple cho thu nhập của họ, AI Pin đã nhường chỗ cho doanh thu đăng ký vào ngày đầu tiên - phương pháp định giá của Humane: đó là giá phần cứng cố định và "phí đăng ký" hàng tháng - một "thuế" trả cho OpenAI bằng cách gọi các khả năng của GPT-4. Điều này có khác gì logic của các plugin của ChatGPT không?
OpenAI tin rằng bản chất của các mô hình ngôn ngữ lớn là máy nén kiến thức tốt nhất của thế giới. Tuy nhiên, máy nén không thể trực tiếp giải quyết từng vấn đề cụ thể cho từng người, vì vậy cần có plug-in, vì vậy ý tưởng về AI Agent xuất hiện. Ngày nay, thế hệ phần cứng mới cũng đang được định hình bởi ý tưởng này khi theo đuổi "AI bản địa": dựa trên mô hình ngôn ngữ lớn cơ bản, tập trung vào một "bộ não" có thể nén mô hình cơ bản và đào tạo nó bằng dữ liệu cá nhân, được bổ sung bởi các trình cắm cứng khác nhau - cuối cùng mọi người đều có một tác nhân AI được cá nhân hóa.
AI Pin muốn làm điều này một cách tích cực trong một bước. Chỉ là bạn càng muốn làm điều đó trong một bước trong các thí nghiệm ban đầu, bạn càng dễ dàng trở thành bia đỡ đạn. Nó kết nối plug-in trực tiếp với đế, điều này mang lại rất nhiều vấn đề. Một trong những điều bị chỉ trích nhiều nhất là quyền riêng tư. Nếu có một "an toàn" trung gian cục bộ với nhiều sức mạnh tính toán hơn, trình cắm có thể tập trung nhiều hơn vào các tác vụ của chính nó và mô hình cơ bản có thể tổng quát hơn, sau đó nó có thể giải quyết nhiều vấn đề hơn.
Cách đây không lâu, tôi đã gặp Dan Siroker, Giám đốc điều hành của Rewind, một công ty khởi nghiệp nổi tiếng tương tự như Humane ở Thung lũng Silicon, người đã chứng minh khả năng làm cho Rewind có sẵn ngoại tuyến trên máy tính, điều này sẽ an toàn và cá nhân hơn (Rewind cũng triệt để hơn Humane, sản phẩm của nó ghi lại mọi chuyển động của người dùng suốt ngày đêm và nhạy cảm hơn với các vấn đề riêng tư), và theo ý kiến của anh ấy, "bộ não" giữa mô hình cơ sở và trình cắm Nó vẫn cần phải được chịu đựng bởi điện thoại di động và máy tính, nhưng những gì cần thiết là một điện thoại di động mới và máy tính mới được xác định bởi khả năng của các ngôn ngữ lớn. Theo nghĩa này, chúng tôi vẫn khá mong đợi Nvidia và Lenovo sẽ biến máy tính thành "AIPC", và Qualcomm sẽ giúp vivo và Xiaomi nhồi nhét các mẫu lớn vào điện thoại di động.
Kết luận về cơ bản là ở đó: AI Pin là một "plug-in cứng" ghim ChatGPT vào ngực của bạn, loại bỏ màn hình cảm ứng và cho phép kết hợp giao diện tương tác ngôn ngữ và giao diện tương tác cử chỉ. Đó là một AI Agent di động, với cơ sở phần cứng kết nối trực tiếp với đám mây, khá tích cực, triệt để hơn Google Glass hồi đó, có nghĩa là nó giống như một thử nghiệm, nhưng mọi người cần nó.
Chỉ những nỗ lực triệt để mới có thể khơi dậy trí tưởng tượng. Đây là lý do tại sao mọi người rất hào hứng với AI Pin. Mọi người coi nó như một "plug-in Ultraman", nghĩa là một phần mở rộng của ChatGPT trong thế giới phần cứng, mở ra một kỷ nguyên phần cứng mới có thể. Nó làm tôi nhớ lại một thời gian cách đây 15 năm.
Vào tháng 6 năm 2008, tại San Francisco, WWDC của Apple, App Store đã chính thức được phát hành vào thời điểm đó. Phát biểu trên sân khấu, Steve Jobs nói: "Bạn có thể phát triển và xuất bản các ứng dụng như chính Apple". Sau đó, một số nhà phát triển đầu tiên của Apple đã lên sân khấu. Một trong những cậu bé áo hồng đã thu hút sự chú ý của Jobs. Jobs gọi cậu bé áo hồng vào căn phòng tối của mình, và chàng trai 24 tuổi bỏ học Stanford rất lo lắng và phấn khích, sau đó nhớ lại rằng "tất cả những gì anh ta có thể thấy là hai ống kính tròn của Jobs phản chiếu ánh sáng." Khi đó, anh đã trình diễn ứng dụng của mình trên sân khấu, bày tỏ lòng biết ơn đến Apple: "Đây là sự khởi đầu của một kỷ nguyên di động mới".
Cậu bé áo hồng là Sam Altman.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Ghim AI phổ biến là một plug-in cho ChatGPT được ghim vào ngực của bạn
Nguồn gốc: Vị trí dựa trên silicon
Khoản đầu tư của Giám đốc điều hành OpenAI Sam Altman vào phần cứng AI thực sự đầu tiên trong lịch sử loài người, AI Pin, là sản phẩm phần cứng hot nhất thế giới trong hai ngày qua. Nếu bạn vẫn chưa biết về sản phẩm này, bạn có thể xem video này để tìm hiểu.
Công ty đứng sau nó, Humane, được thành lập bởi Imran Chaudhri, một cựu nhà thiết kế danh dự của Apple, và Bethany Bongiorno, cựu giám đốc hệ thống của Apple, người đã tham gia vào việc phát triển iPhone ban đầu, và thậm chí cả nguyên mẫu với bánh xe cuộn mà Steve Jobs đã chế giễu khi iPhone được phát hành lần đầu tiên. Ông đã rất không hài lòng khi rời Apple đến nỗi ông đã gửi một email cho toàn bộ nhân viên và viết một bài thơ trước khi quyết định rời đi: "Đáng buồn thay, dòng sông khô cạn, và đó là khi bạn tìm kiếm một cái mới". Sau đó, Apple sa thải ông.
Cổ đông lớn nhất đằng sau Humane là Sam Altman, và với tư cách là AI Pin, "phần mềm" của nó là GPT-4. Thông báo của nó trùng với hội nghị nhà phát triển của OpenAI, nơi đã tàn sát một loạt các công ty khởi nghiệp AI, và Sam Altman là người cha lớn của nó, và cuộc thảo luận ngay lập tức xoay quanh "liệu đó có phải là iPhone mới hay không".
Tuy nhiên, nếu bạn nhìn kỹ hơn vào AI Pin, bạn sẽ thấy rằng ý nghĩa của nó không phải là đen trắng - nó là một kẻ giết iPhone hoặc nó chỉ là sự cường điệu hoàn toàn, và nó không phải là. Trên thực tế, nó là sản phẩm thử nghiệm đầu tiên của ý tưởng "phần cứng mới" trong kỷ nguyên AI. Theo lời của đồng nghiệp Luo Yihang của tôi, đó là "một plug-in cứng cho ChatGPT".
Những người được Jobs bảo trợ biết mật khẩu của Jobs: phương pháp tương tác cực kỳ triệt để, và trải nghiệm người dùng cực kỳ bảo thủ và hạn chế, giống như iPhone hồi đó.
Điều này cũng xác định rằng nó là một đối tượng thử nghiệm. Gần đây, người phụ trách một sản phẩm ứng dụng cấp quốc gia với hàng trăm triệu người dùng ở Trung Quốc nói với tôi rằng họ đã sử dụng LUI để chuyển đổi sản phẩm rất kỹ lưỡng và rất nhiều mã cơ bản đã được viết lại, nhưng ông tin rằng LUI không phải là một bản nâng cấp thay thế đơn giản, mà là một lựa chọn song song mang lại những khả năng mới. Cuối cùng, LUI sẽ kết hợp GUI (Gesture User Interface) để tạo ra các sản phẩm phần cứng thuộc kỷ nguyên AI.
Đó là những gì AI Pin làm. Một số chức năng được gọi bằng ngôn ngữ tự nhiên, và một số được gọi bằng cử chỉ đơn giản, đó cũng là một điểm thú vị để thế giới bên ngoài thốt lên, sau khi đọc Demo của nó, tôi nghĩ đây thực sự là "phần cứng" của AI Agent. Một mô hình lớn có một thực thể Pin, ghim nó vào ngực của bạn và bling-bling blind, hoặc đơn giản là biến nó thành một mặt dây chuyền như một công ty khởi nghiệp phần cứng AI khác, Rewind. Điều này có thể biến thành một xu hướng.
Nhưng AI Pin, về ngoại hình và chức năng, nghe có vẻ hơi giống Misfit, sản phẩm đã tạo ra "trâm cài thông minh" cách đây 10 năm? Vào thời điểm đó, có rất nhiều "thiết bị đeo được" có gân gà như vậy, và Google Glass, phổ biến và biến mất nhanh hơn. Liệu endgame của AI Pin có giống với trò chơi của họ không?
Câu trả lời cho điều này quay trở lại với sự hiểu biết về "trí thông minh". 10 năm trước, cho dù đó là Google Glass, Misfit hay nhiều loại vòng đeo tay thông minh và đồng hồ thông minh, không phải tất cả chúng đều là "phần cứng chậm phát triển trí tuệ"? Ít nhất một điều bạn phải tin là với GPT-4 là "phần mềm", AI Pin thực sự đã mở ra một giai đoạn mới của phần cứng "thông minh". Khả năng cốt lõi của nó nằm ở việc sử dụng tương tác ngôn ngữ và tương tác hành động để gọi các tác nhân AI. Hoặc đơn giản, bạn chỉ nghĩ về Ghim AI như một tác nhân AI treo trên ngực để làm mù mắt người khác.
Bản chất của AI Agent là sự kết hợp giữa các ứng dụng và chức năng AI với các mô hình ngôn ngữ lớn làm khả năng cốt lõi dựa trên nhu cầu tùy chỉnh của cá nhân hoặc tổ chức và nó có mức độ cá nhân hóa cao và định hướng kịch bản: gõ vào ghim trên ngực bạn, thì thầm vài từ với nó, mở lòng bàn tay của bạn, xem một chuỗi các ký tự có màu sắc rực rỡ, cho bạn biết cách được đề xuất để giải quyết vấn đề, cho bạn biết dữ liệu của bên kia là chìa khóa hoặc trực tiếp đặt thực đơn nhà hàng bằng tay kia cho bạn. Điều đó thông minh hơn rất nhiều so với những chiếc vòng đeo tay đồng hồ đó. Tất nhiên, điều này cũng cho thấy rằng không giống như phần cứng theo nghĩa truyền thống, bản thân AI Pin sẽ không phải là một phần cứng đa năng, mà là một "plug-in cứng" để nhận ra AI tùy chỉnh.
Vì nó là một "plug-in cứng", tự nhiên có một hệ thống hoàn toàn mới đằng sau nó. Hệ thống mới này không còn dựa trên một phần cứng, mà dựa trên một mô hình ngôn ngữ lớn. Nhìn lại iPhone - đó là iPhone và sau đó là App Store, đến nỗi Apple vẫn là một công ty phần cứng về doanh thu ngày nay. Vậy điều gì sẽ xảy ra nếu có một "App Store" mạnh mẽ trước tiên? OpenAI và AI Pin đang thực hiện một kịch bản ngược như vậy.
Mọi người đều biết rằng mọi người chú ý đến AI Pin vì OpenAI và ChatGPT đằng sau nó, và những người sáng lập AI Pin tự biết điều đó. Cũng giống như các nhà phát triển phần mềm sẵn sàng bị Apple đánh thuế vì họ phụ thuộc vào phần cứng của Apple cho thu nhập của họ, AI Pin đã nhường chỗ cho doanh thu đăng ký vào ngày đầu tiên - phương pháp định giá của Humane: đó là giá phần cứng cố định và "phí đăng ký" hàng tháng - một "thuế" trả cho OpenAI bằng cách gọi các khả năng của GPT-4. Điều này có khác gì logic của các plugin của ChatGPT không?
OpenAI tin rằng bản chất của các mô hình ngôn ngữ lớn là máy nén kiến thức tốt nhất của thế giới. Tuy nhiên, máy nén không thể trực tiếp giải quyết từng vấn đề cụ thể cho từng người, vì vậy cần có plug-in, vì vậy ý tưởng về AI Agent xuất hiện. Ngày nay, thế hệ phần cứng mới cũng đang được định hình bởi ý tưởng này khi theo đuổi "AI bản địa": dựa trên mô hình ngôn ngữ lớn cơ bản, tập trung vào một "bộ não" có thể nén mô hình cơ bản và đào tạo nó bằng dữ liệu cá nhân, được bổ sung bởi các trình cắm cứng khác nhau - cuối cùng mọi người đều có một tác nhân AI được cá nhân hóa.
AI Pin muốn làm điều này một cách tích cực trong một bước. Chỉ là bạn càng muốn làm điều đó trong một bước trong các thí nghiệm ban đầu, bạn càng dễ dàng trở thành bia đỡ đạn. Nó kết nối plug-in trực tiếp với đế, điều này mang lại rất nhiều vấn đề. Một trong những điều bị chỉ trích nhiều nhất là quyền riêng tư. Nếu có một "an toàn" trung gian cục bộ với nhiều sức mạnh tính toán hơn, trình cắm có thể tập trung nhiều hơn vào các tác vụ của chính nó và mô hình cơ bản có thể tổng quát hơn, sau đó nó có thể giải quyết nhiều vấn đề hơn.
Cách đây không lâu, tôi đã gặp Dan Siroker, Giám đốc điều hành của Rewind, một công ty khởi nghiệp nổi tiếng tương tự như Humane ở Thung lũng Silicon, người đã chứng minh khả năng làm cho Rewind có sẵn ngoại tuyến trên máy tính, điều này sẽ an toàn và cá nhân hơn (Rewind cũng triệt để hơn Humane, sản phẩm của nó ghi lại mọi chuyển động của người dùng suốt ngày đêm và nhạy cảm hơn với các vấn đề riêng tư), và theo ý kiến của anh ấy, "bộ não" giữa mô hình cơ sở và trình cắm Nó vẫn cần phải được chịu đựng bởi điện thoại di động và máy tính, nhưng những gì cần thiết là một điện thoại di động mới và máy tính mới được xác định bởi khả năng của các ngôn ngữ lớn. Theo nghĩa này, chúng tôi vẫn khá mong đợi Nvidia và Lenovo sẽ biến máy tính thành "AIPC", và Qualcomm sẽ giúp vivo và Xiaomi nhồi nhét các mẫu lớn vào điện thoại di động.
Kết luận về cơ bản là ở đó: AI Pin là một "plug-in cứng" ghim ChatGPT vào ngực của bạn, loại bỏ màn hình cảm ứng và cho phép kết hợp giao diện tương tác ngôn ngữ và giao diện tương tác cử chỉ. Đó là một AI Agent di động, với cơ sở phần cứng kết nối trực tiếp với đám mây, khá tích cực, triệt để hơn Google Glass hồi đó, có nghĩa là nó giống như một thử nghiệm, nhưng mọi người cần nó.
Chỉ những nỗ lực triệt để mới có thể khơi dậy trí tưởng tượng. Đây là lý do tại sao mọi người rất hào hứng với AI Pin. Mọi người coi nó như một "plug-in Ultraman", nghĩa là một phần mở rộng của ChatGPT trong thế giới phần cứng, mở ra một kỷ nguyên phần cứng mới có thể. Nó làm tôi nhớ lại một thời gian cách đây 15 năm.
Vào tháng 6 năm 2008, tại San Francisco, WWDC của Apple, App Store đã chính thức được phát hành vào thời điểm đó. Phát biểu trên sân khấu, Steve Jobs nói: "Bạn có thể phát triển và xuất bản các ứng dụng như chính Apple". Sau đó, một số nhà phát triển đầu tiên của Apple đã lên sân khấu. Một trong những cậu bé áo hồng đã thu hút sự chú ý của Jobs. Jobs gọi cậu bé áo hồng vào căn phòng tối của mình, và chàng trai 24 tuổi bỏ học Stanford rất lo lắng và phấn khích, sau đó nhớ lại rằng "tất cả những gì anh ta có thể thấy là hai ống kính tròn của Jobs phản chiếu ánh sáng." Khi đó, anh đã trình diễn ứng dụng của mình trên sân khấu, bày tỏ lòng biết ơn đến Apple: "Đây là sự khởi đầu của một kỷ nguyên di động mới".