Hướng dẫn về AI: Sơ lược về các khái niệm chính và những người chơi hàng đầu trong lĩnh vực AI

Nguồn: TechCrunch

Biên soạn: Babbitt

Nguồn hình ảnh: Được tạo bởi công cụ Unbounded AI

Trí tuệ nhân tạo (AI) dường như có mặt ở mọi ngóc ngách của cuộc sống hiện đại, từ âm nhạc và phương tiện truyền thông đến kinh doanh và năng suất, thậm chí cả hẹn hò. Có rất nhiều thứ thật khó để theo kịp. Bài viết này sẽ đề cập đến mọi thứ, từ những phát triển lớn mới nhất về AI cho đến các thuật ngữ và công ty bạn cần biết để luôn cập nhật tình hình trong lĩnh vực đang chuyển động nhanh này.

Đầu tiên, trí tuệ nhân tạo là gì?

Trí tuệ nhân tạo, còn được gọi là học máy, là một hệ thống phần mềm dựa trên mạng thần kinh, một kỹ thuật thực sự đã được tiên phong từ nhiều thập kỷ trước nhưng gần đây đã phát triển mạnh mẽ nhờ các tài nguyên máy tính mới mạnh mẽ. Hiện tại, AI đã đạt được khả năng nhận dạng hình ảnh và giọng nói hiệu quả, cũng như khả năng tạo ra hình ảnh và lời nói tổng hợp. Các nhà nghiên cứu đang làm việc để tạo ra trí tuệ nhân tạo có khả năng duyệt web, đặt vé, điều chỉnh công thức nấu ăn, v.v.

Nhưng nếu bạn lo lắng về sự gia tăng của máy móc theo kiểu Ma trận — đừng lo lắng. Chúng ta sẽ nói về điều đó sau!

Hướng dẫn về AI này bao gồm hai phần chính:

  • Đầu tiên, những khái niệm cơ bản nhất bạn cần hiểu và những khái niệm quan trọng gần đây nhất.
  • Sau đó, phác thảo những người chơi chính trong AI và tại sao họ lại quan trọng.

AI 101

Tín dụng hình ảnh: Andrii Shyp/Getty Images

Một trong những điều điên rồ về AI là mặc dù các khái niệm cốt lõi của nó đã có từ hơn 50 năm trước, nhưng cho đến gần đây, thậm chí rất ít người hiểu biết về công nghệ quen thuộc với các khái niệm của nó. Vì vậy, đừng lo lắng nếu bạn cảm thấy lạc lõng -- mọi người đều như vậy.

Hãy làm rõ một điều ngay từ đầu: Mặc dù được gọi là "trí tuệ nhân tạo", thuật ngữ này có một chút sai lệch. Hiện tại không có định nghĩa thống nhất về trí thông minh, nhưng những gì các hệ thống này làm chắc chắn gần với máy tính hơn là bộ não, ngoại trừ đầu vào và đầu ra của máy tính này linh hoạt hơn. AI có thể giống như một "Dừa nhân tạo" - đó là trí thông minh bắt chước.

Sau đây là những thuật ngữ cơ bản mà bạn sẽ tìm thấy trong bất kỳ cuộc thảo luận nào về AI.

Mạng thần kinh

Bộ não của chúng ta phần lớn được tạo thành từ các tế bào được kết nối với nhau gọi là tế bào thần kinh kết nối với nhau để tạo thành các mạng phức tạp thực hiện các tác vụ và lưu trữ thông tin. Mọi người đã cố gắng tạo lại hệ thống tuyệt vời này trong phần mềm từ những năm 1960, nhưng sức mạnh xử lý cần thiết không được phổ biến rộng rãi cho đến 15-20 năm trước, khi GPU cho phép các mạng thần kinh được xác định bằng số phát triển.

Về cơ bản, chúng chỉ là nhiều điểm và đường: các điểm là dữ liệu và các đường là mối quan hệ thống kê giữa các giá trị đó. Giống như trong não bộ, điều này có thể tạo ra một hệ thống đa chức năng nhanh chóng nhận đầu vào, chuyển nó qua mạng và tạo ra đầu ra. Hệ thống này được gọi là một mô hình.

Người mẫu

Một mô hình là bộ sưu tập mã thực sự nhận đầu vào và trả về đầu ra. Sự giống nhau về thuật ngữ đối với các mô hình thống kê hoặc các hệ thống mô hình hóa mô phỏng các quá trình tự nhiên phức tạp không phải là ngẫu nhiên. Trong AI, một mô hình có thể đề cập đến một hệ thống hoàn chỉnh như ChatGPT hoặc hầu hết mọi cấu trúc AI hoặc máy học, bất kể nó làm gì hoặc tạo ra gì. Các mô hình có nhiều kích cỡ khác nhau, nghĩa là chúng chiếm bao nhiêu dung lượng lưu trữ và bao nhiêu sức mạnh tính toán mà chúng cần để chạy. Và tất cả phụ thuộc vào cách người mẫu được đào tạo.

xe lửa

Để tạo một mô hình AI, các mạng thần kinh tạo thành nền tảng của hệ thống được tiếp xúc với một loạt thông tin được gọi là tập dữ liệu hoặc kho văn bản. Khi làm như vậy, các mạng rộng lớn này tạo ra một biểu diễn thống kê về dữ liệu đó. Quá trình đào tạo này đòi hỏi nhiều tính toán nhất, có nghĩa là phải mất hàng tuần hoặc hàng tháng trên các máy tính lớn, mạnh mẽ. Lý do cho điều này không chỉ là mạng phức tạp mà bộ dữ liệu có thể rất lớn: hàng tỷ từ hoặc hình ảnh phải được phân tích và biểu diễn trong các mô hình thống kê khổng lồ. Mặt khác, một khi một mô hình được đào tạo, nó có thể được sử dụng với quy mô nhỏ hơn và ít đòi hỏi hơn, một quá trình được gọi là suy luận.

Tín dụng hình ảnh: Google

Sự suy luận

Khi mô hình thực sự hoạt động, chúng tôi gọi nó là suy luận, và ý nghĩa truyền thống của từ này là rất nhiều: đưa ra một kết luận bằng cách lập luận về các bằng chứng có sẵn. Tất nhiên, đây không chính xác là "suy luận", nhưng kết nối theo thống kê các điểm trong dữ liệu mà nó nhập vào, thực sự dự đoán điểm tiếp theo. Ví dụ: nói "hoàn thành chuỗi sau: đỏ, cam, vàng...", nó sẽ thấy rằng những từ này tương ứng với phần đầu của danh sách mà nó nhập, tức là màu sắc của cầu vồng và ngoại suy mục tiếp theo cho đến khi nó có sản xuất phần còn lại của phần danh sách.

Suy luận thường ít tốn kém hơn nhiều về mặt tính toán so với đào tạo: hãy nghĩ về nó giống như duyệt danh mục thẻ hơn là lắp ráp nó. Các mô hình lớn vẫn phải chạy trên siêu máy tính và GPU, nhưng các mô hình nhỏ hơn có thể chạy trên điện thoại thông minh hoặc các thiết bị đơn giản hơn.

Trí tuệ nhân tạo sáng tạo

Mọi người đang nói về AI tổng quát, một thuật ngữ rộng chỉ đơn giản đề cập đến các mô hình AI tạo ra đầu ra thô như hình ảnh hoặc văn bản. Một số AI tóm tắt, một số sắp xếp lại, một số nhận dạng, v.v.—nhưng những AI thực sự tạo ra thứ gì đó (việc nó có "tạo ra" hay không còn gây tranh cãi) đang đặc biệt phổ biến hiện nay. Hãy nhớ rằng, chỉ vì AI đã tạo ra thứ gì đó, không có nghĩa là nó đúng hoặc thậm chí là nó phản ánh thực tế! Chỉ là nó không tồn tại cho đến khi bạn yêu cầu nó, giống như một câu chuyện hay một bức tranh.

Từ nóng ngay bây giờ

Ngoài những điều cơ bản, đây là những thuật ngữ AI phù hợp nhất cho giữa năm 2023.

Mô hình ngôn ngữ lớn (LLM)

Các mô hình ngôn ngữ quy mô lớn là dạng trí tuệ nhân tạo có ảnh hưởng và được sử dụng rộng rãi nhất hiện nay. Các mô hình ngôn ngữ quy mô lớn được đào tạo trên hầu hết tất cả các văn bản tạo nên trang web và hầu hết các tài liệu bằng tiếng Anh. Nhập tất cả những điều này dẫn đến một mô hình cơ sở khổng lồ (đọc tiếp). Các LLM có thể trò chuyện và trả lời các câu hỏi bằng ngôn ngữ tự nhiên và bắt chước các tài liệu bằng văn bản thuộc nhiều phong cách và thể loại khác nhau, bằng chứng là các công cụ như ChatGPT, Claude và LLaMa.

Mặc dù các mô hình này chắc chắn rất ấn tượng, nhưng cần lưu ý rằng chúng vẫn là các công cụ nhận dạng mẫu và khi trả lời một câu hỏi, chúng đang cố gắng hoàn thành mẫu mà nó đã xác định, cho dù mẫu đó có phản ánh thực tế hay không. Các LLM thường ảo tưởng về câu trả lời của họ, như chúng ta sẽ sớm đề cập.

Nếu bạn muốn biết thêm về LLM và ChatGPT, hãy nhấp vào đây.

Mô hình Nền tảng

Đào tạo một mô hình khổng lồ từ đầu trên một tập dữ liệu khổng lồ rất tốn kém và phức tạp, vì vậy bạn không muốn làm nhiều hơn những gì bạn phải làm. Các mô hình cơ sở là các mô hình lớn từ đầu yêu cầu siêu máy tính chạy, nhưng thường bằng cách giảm số lượng tham số, chúng có thể được giảm xuống các thùng chứa nhỏ hơn. Bạn có thể coi đây là tổng số điểm mà mô hình phải xử lý, có thể lên tới hàng triệu, hàng tỷ hoặc thậm chí hàng nghìn tỷ ngày nay.

tinh chỉnh

Một mô hình cơ sở như GPT-4 là thông minh, nhưng nó cũng là một mô hình chung theo thiết kế - nó hấp thụ mọi thứ từ Dickens đến Wittgenstein cho đến các quy tắc của Ngục tối và Rồng, nhưng nếu bạn muốn nó dựa trên Sơ yếu lý lịch của mình, hãy viết một lá thư xin việc, những Vô dụng. May mắn thay, có thể tinh chỉnh mô hình bằng cách thực hiện một số khóa đào tạo bổ sung về mô hình bằng cách sử dụng bộ dữ liệu chuyên dụng. Ví dụ, có vài nghìn đơn xin việc. Điều này giúp mô hình hiểu rõ hơn về cách trợ giúp người dùng trong miền đó mà không loại bỏ kiến thức chung mà nó thu thập được từ phần còn lại của dữ liệu huấn luyện.

Học tăng cường từ phản hồi của con người (RLHF), là một loại tinh chỉnh đặc biệt mà bạn sẽ nghe nói đến rất nhiều — nó sử dụng dữ liệu từ những người tương tác với LLM để cải thiện kỹ năng giao tiếp của họ.

Khuếch tán

*Từ một bài báo về các kỹ thuật khuếch tán sau nâng cao, bạn có thể xem cách tái tạo hình ảnh từ dữ liệu rất nhiễu. *

Việc tạo hình ảnh có thể được thực hiện theo một số cách, nhưng cho đến nay, thành công nhất là khuếch tán, kỹ thuật cốt lõi của Khuếch tán ổn định, Midjourney và các AI thế hệ phổ biến khác. Mô hình khuếch tán được đào tạo bằng cách hiển thị cho nó những hình ảnh bị giảm dần bằng cách thêm nhiễu kỹ thuật số cho đến khi không còn gì của hình ảnh gốc. Bằng cách quan sát điều này, mô hình khuếch tán cũng học cách thực hiện quá trình ngược lại, dần dần thêm chi tiết vào nhiễu thuần túy để tạo thành một hình ảnh được xác định tùy ý. Chúng tôi đã bắt đầu tiến xa hơn thế trong lĩnh vực đồ họa, nhưng công nghệ này vẫn ổn định và tương đối dễ hiểu, vì vậy nó sẽ mai một khá nhanh.

Ảo giác

Ban đầu, đây là vấn đề về một số hình ảnh trong quá trình đào tạo chuyển sang đầu ra không liên quan, ví dụ: các tòa nhà dường như được làm bằng chó do hình ảnh chó quá phổ biến trong tập huấn luyện. AI hiện được cho là ảo giác vì nó không có đủ dữ liệu hoặc xung đột dữ liệu trong tập huấn luyện của nó, nó chỉ bịa ra mọi thứ.

Một AI được yêu cầu tạo ra tác phẩm nghệ thuật gốc hoặc thậm chí phái sinh là ảo giác. Ví dụ, một LLM có thể được yêu cầu viết một bài thơ tình theo phong cách của Yogi Berra, và nó sẽ vui vẻ làm như vậy—mặc dù điều đó không tồn tại trong bộ dữ liệu của nó. Nhưng đó có thể là một vấn đề khi cần phải có câu trả lời thực tế; mô hình sẽ tự tin đưa ra câu trả lời nửa thực, nửa ảo. Hiện tại, không có cách nào dễ dàng để biết cái nào ngoài việc tự mình kiểm tra, vì bản thân mô hình không thực sự biết đâu là "đúng" hay "sai", nó chỉ cố gắng hoàn thành một mẫu tốt nhất có thể.

AGI hoặc Trí tuệ nhân tạo mạnh mẽ

Trí tuệ nhân tạo chung (AGI), hay Trí tuệ nhân tạo mạnh mẽ, không thực sự là một khái niệm được định nghĩa rõ ràng, nhưng lời giải thích đơn giản nhất là đó là một trí thông minh đủ mạnh để không chỉ làm những gì con người làm mà còn giống như chúng ta Học hỏi và cải thiện bản thân bạn. Một số người lo lắng rằng chu kỳ học tập, tích hợp những ý tưởng này, sau đó học hỏi và phát triển nhanh hơn sẽ là một chu kỳ tự tồn tại dẫn đến một hệ thống siêu thông minh không thể bị hạn chế hoặc kiểm soát. Một số thậm chí còn đề xuất trì hoãn hoặc hạn chế các nghiên cứu để ngăn chặn khả năng này.

Đó là một suy nghĩ khủng khiếp. Và những bộ phim như Ma trận và Kẻ hủy diệt đã khám phá điều gì có thể xảy ra nếu trí tuệ nhân tạo vượt khỏi tầm kiểm soát và cố gắng tiêu diệt hoặc nô dịch loài người. Nhưng những câu chuyện này không có cơ sở trong thực tế. Sự xuất hiện của trí thông minh mà chúng ta thấy trong những thứ như ChatGPT rất ấn tượng, nhưng có rất ít điểm chung với lý luận trừu tượng và hoạt động đa lĩnh vực năng động mà chúng ta liên kết với trí thông minh "thực".

Mặc dù dự đoán những phát triển trong tương lai là gần như không thể, nhưng có thể hữu ích khi tưởng tượng AGI giống như du hành vũ trụ giữa các vì sao: tất cả chúng ta đều hiểu khái niệm này và dường như đang hướng tới nó, nhưng đồng thời, chúng ta vẫn còn một chặng đường dài để đạt được Nó. Cũng giống như AGI, không ai có thể làm điều đó một cách tình cờ do cần có nguồn lực khổng lồ và tiến bộ khoa học cơ bản!

Thật thú vị khi nghĩ về AGI, nhưng không cần phải gây rắc rối bởi vì, như các nhà bình luận đã chỉ ra, bất chấp những hạn chế của nó, AI đã đặt ra một mối đe dọa thực sự và đáng kể ngày nay. Không ai muốn Skynet, nhưng bạn không cần một siêu trí tuệ được trang bị vũ khí hạt nhân để gây thiệt hại thực sự: Ngày nay mọi người đang mất việc làm và bị lừa đảo. Nếu chúng tôi không thể giải quyết những vấn đề này, liệu chúng tôi có cơ hội nào để chống lại T-1000?

Người chơi hàng đầu về Trí tuệ nhân tạo

OpenAI

Tín dụng hình ảnh: Leon Neal/Getty Images

Nếu có một cái tên quen thuộc trong AI, thì đó là OpenAI. OpenAI, như tên cho thấy, là một tổ chức có ý định tiến hành nghiên cứu và ít nhiều công bố kết quả. Kể từ đó, nó đã được tái cấu trúc thành một công ty vì lợi nhuận truyền thống hơn, cung cấp quyền truy cập vào các mô hình ngôn ngữ nâng cao như ChatGPT thông qua API và ứng dụng. Nó được dẫn dắt bởi Sam Altman, một tỷ phú công nghệ, người đã gióng lên hồi chuông cảnh báo về những rủi ro có thể xảy ra của trí tuệ nhân tạo. OpenAI là công ty hàng đầu được công nhận trong lĩnh vực LLM, nhưng cũng tiến hành nghiên cứu trong các lĩnh vực khác.

Microsoft

Như bạn có thể mong đợi, Microsoft đã thực hiện khá nhiều nghiên cứu về AI, nhưng giống như các công ty khác, ít nhiều đã thất bại trong việc biến các thử nghiệm của mình thành các sản phẩm chính. Bước đi thông minh nhất của nó là đầu tư sớm vào OpenAI, dẫn đến mối quan hệ đối tác lâu dài độc quyền với công ty hiện cung cấp năng lượng cho các đại lý đàm thoại Bing của họ. Mặc dù đóng góp của chính nó nhỏ hơn và ít áp dụng trực tiếp hơn, nhưng công ty có cơ chế nghiên cứu đáng kể.

Google

Được biết đến với những bức ảnh chụp mặt trăng, Google bằng cách nào đó đã bỏ lỡ cơ hội dành cho AI, mặc dù các nhà nghiên cứu của họ đã phát minh ra công nghệ trực tiếp dẫn đến sự bùng nổ AI ngày nay: Transformers. Giờ đây, nó đang cố gắng phát triển LLM của riêng mình và các đại lý khác, nhưng rõ ràng nó đang bắt kịp sau khi dành phần lớn thập kỷ qua để thúc đẩy khái niệm lỗi thời về "trợ lý ảo" AI. Giám đốc điều hành Sundar Pichai đã nhiều lần nói rằng công ty luôn đứng sau AI về tìm kiếm và năng suất.

Nhân loại

Sau khi OpenAI rời bỏ tính cởi mở, Dario và Daniela Amodei rời bỏ nó để bắt đầu Anthropic, với ý định đảm nhận vai trò của một tổ chức nghiên cứu AI cởi mở và cân nhắc về mặt đạo đức. Với lượng tiền mặt họ có trong tay, họ là đối thủ nặng ký của OpenAI, ngay cả khi các mô hình của họ (như Claude) chưa phổ biến hoặc nổi tiếng.

Tín dụng hình ảnh: Bryce Durbin/TechCrunch

Sự ổn định

Gây tranh cãi nhưng không thể tránh khỏi, Ổn định đại diện cho thể loại mã nguồn mở triển khai AI "bất cứ điều gì bạn muốn" thu thập mọi thứ trên internet và cung cấp miễn phí các mô hình AI tổng quát mà nó đào tạo, miễn là bạn sở hữu phần cứng để chạy nó. Điều này rất phù hợp với triết lý "thông tin muốn được tự do", nhưng cũng đẩy nhanh các dự án đáng ngờ về mặt đạo đức như tạo hình ảnh khiêu dâm và sử dụng tài sản trí tuệ mà không có sự đồng ý (đôi khi đồng thời).

Elon Musk

Musk cũng không ngoại lệ, thẳng thắn nói về những lo ngại của anh ấy về AI chạy trốn và một số trái nho chua sau những đóng góp ban đầu của anh ấy cho OpenAI đã đi theo hướng mà anh ấy không thích. Mặc dù Musk không phải là một chuyên gia về chủ đề này, nhưng như thường lệ, những trò hề và bình luận của anh ấy đã gây được nhiều tiếng vang (anh ấy là người ký vào bức thư "tạm dừng AI" đã nói ở trên) và anh ấy đang cố gắng xây dựng sự hiện diện nghiên cứu của riêng mình.

Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate.io
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)