Cointime

Download App
iOS & Android

Khung tác nhân AI có phải là mảnh ghép cuối cùng không? Làm thế nào để giải thích "lưỡng tính sóng-hạt" của khung?

Tác giả: Kevin, Nhà nghiên cứu tại BlockBooster

Là một mảnh ghép quan trọng cho sự phát triển của ngành, khung Tác nhân AI có thể chứa tiềm năng kép trong việc thúc đẩy triển khai công nghệ và trưởng thành sinh thái. Các framework được thảo luận sôi nổi trên thị trường bao gồm: Eliza, Rig, Swarms, ZerePy, v.v. Các framework này thu hút các nhà phát triển và tạo dựng danh tiếng thông qua Github Repo. Các framework này được phát hành dưới dạng đồng tiền “thư viện”, tương tự như việc ánh sáng có đặc tính của cả sóng và hạt. Framework Agent có đặc điểm của ngoại tác nghiêm trọng và Memecoin cùng một lúc. Bài viết này sẽ tập trung giải thích “tính đối ngẫu sóng-hạt” của khung và tại sao khung Tác nhân có thể trở thành góc cuối cùng.

Kể từ khi GOAT ra đời, tác động của câu chuyện về Đặc vụ trên thị trường ngày càng tăng. Giống như một bậc thầy Kung Fu, với nắm tay trái "Memecoin" và lòng bàn tay phải "Hy vọng ngành", bạn sẽ luôn bị đánh bại trong một trong những chiêu thức. . Trên thực tế, các kịch bản ứng dụng của Tác nhân AI không được phân biệt chặt chẽ và ranh giới giữa các nền tảng, khung và ứng dụng cụ thể bị xóa mờ, nhưng chúng vẫn có thể được phân loại đại khái theo sở thích của mã thông báo hoặc giao thức. Tuy nhiên, theo sở thích phát triển của token hoặc giao thức, chúng vẫn có thể được chia thành các loại sau:

  • Launchpad: Nền tảng tóc tài sản. Giao thức ảo và clanker trên chuỗi Base, Dasha trên chuỗi Solana.
  • Ứng dụng AI Agent: Miễn phí giữa Agent và Memecoin, có các tính năng vượt trội trong cấu hình bộ nhớ bộ nhớ như GOAT, aixbt, v.v. Các ứng dụng này thường có đầu ra một chiều và điều kiện đầu vào rất hạn chế.
  • Công cụ AI Agent: Griffin của chuỗi Solana và AI Spectre của chuỗi cơ sở. griffain có thể phát triển từ chế độ đọc và viết sang chế độ đọc, viết và hành động; Spectre AI là một công cụ RAG và tìm kiếm trên chuỗi.
  • Khung Tác nhân AI: Đối với nền tảng khung, bản thân Tác nhân là một tài sản, vì vậy khung Tác nhân là nền tảng phát hành tài sản của Đại lý và Launchpad của Đại lý. Các dự án tiêu biểu hiện nay bao gồm ai16, Zerebro, ARC và Swarms, đã được thảo luận sôi nổi trong hai ngày qua.
  • Các hướng nhỏ khác: Agent Simmi toàn diện; Chế độ giao thức AgentFi giả mạo; Agent Seraph giả mạo;

Thảo luận sâu hơn về khung Tác nhân, chúng ta có thể thấy rằng nó có đủ các yếu tố bên ngoài. Không giống như các chuỗi và giao thức công khai lớn, các nhà phát triển chỉ có thể chọn từ các môi trường ngôn ngữ phát triển khác nhau và tổng số nhà phát triển trong ngành chưa cho thấy mức tăng trưởng tương ứng về giá trị thị trường. Github Repo là nơi các nhà phát triển Web2 và Web3 xây dựng sự đồng thuận. Cộng đồng nhà phát triển được thành lập ở đây hấp dẫn và có ảnh hưởng hơn đối với các nhà phát triển Web2 so với gói "plug and play" được phát triển bởi bất kỳ giao thức nào.

Bốn khung được đề cập trong bài viết này đều là nguồn mở: khung Eliza của ai16z đã nhận được 6200 sao; khung ZerePy của Zerebro đã nhận được 191 sao; khung RIG của ARC đã nhận được 1700 sao; khung Swarms' đã nhận được 2100 sao. Hiện tại, Eliza framework được sử dụng rộng rãi trong nhiều ứng dụng Agent khác nhau và là framework có phạm vi phủ sóng rộng nhất. Mức độ phát triển của ZerePy không cao, hướng phát triển chủ yếu là X, chưa hỗ trợ LLM cục bộ và bộ nhớ tích hợp. RIG tương đối khó phát triển nhưng nó có thể giúp các nhà phát triển tự do tối ưu hóa hiệu suất một cách tối đa. Swarms không có trường hợp sử dụng nào khác ngoài nhóm ra mắt MC, nhưng Swarms có thể tích hợp các khung khác nhau và có nhiều chỗ cho trí tưởng tượng.

Ngoài ra, trong cách phân loại trên, Agent engine và framework được tách rời nhau, có thể gây nhầm lẫn. Nhưng tôi nghĩ có sự khác biệt giữa hai điều này. Đầu tiên, tại sao lại là động cơ? Sự tương đồng giữa Lenovo và các công cụ tìm kiếm trong đời thực là tương đối nhất quán. Khác với các ứng dụng Agent đồng nhất, hiệu suất của Agent engine cao hơn nó, nhưng đồng thời nó là một hộp đen được đóng gói hoàn toàn có thể điều chỉnh thông qua giao diện API. Người dùng có thể trải nghiệm hiệu suất của Agent engine dưới dạng fork, nhưng họ không thể có được bức tranh đầy đủ và quyền tự do tùy chỉnh như framework cơ bản. Công cụ của mỗi người dùng giống như tạo một hình ảnh trên Tác nhân được điều chỉnh và tương tác với hình ảnh đó. Framework về cơ bản là thích ứng với chuỗi, vì mục tiêu cuối cùng của việc tạo khung Agent trong Agent là tích hợp với chuỗi tương ứng, cách xác định phương thức tương tác dữ liệu, cách xác định phương thức xác minh dữ liệu, cách xác định khối quy mô và cách cân bằng giữa sự đồng thuận và Hiệu suất, đây là những điều mà các khuôn khổ cần xem xét. Và còn động cơ thì sao? Bạn chỉ cần tinh chỉnh hoàn toàn mô hình và thiết lập mối quan hệ giữa tương tác dữ liệu và bộ nhớ theo một hướng nhất định. Hiệu suất là tiêu chí đánh giá duy nhất, còn framework thì không.

Trong vòng đời của một tác nhân thực hiện đầu vào và đầu ra, cần có ba phần. Đầu tiên, mô hình cơ bản xác định chiều sâu và cách suy nghĩ, sau đó bộ nhớ là nơi tùy chỉnh. Sau khi mô hình cơ bản có đầu ra, nó được sửa đổi dựa trên bộ nhớ và cuối cùng thao tác đầu ra được hoàn thành trên các máy khách khác nhau.

Nguồn: @SuhailKakar

Để chứng minh khung Agent có “lưỡng tính sóng-hạt”, “sóng” mang đặc điểm của “Memecoin”, thể hiện văn hóa cộng đồng và hoạt động của nhà phát triển, nhấn mạnh đến sức hấp dẫn và khả năng giao tiếp của “hạt” đại diện cho “ngành công nghiệp”; kỳ vọng" Các tính năng thể hiện hiệu suất cơ bản, trường hợp sử dụng thực tế và chiều sâu kỹ thuật. Tôi sẽ minh họa các hướng dẫn phát triển từ hai khía cạnh bằng cách kết hợp ba khung làm ví dụ:

  1. Thiết lập môi trường

Nguồn: @SuhailKakar

2. Cài đặt Eliza

Nguồn: @SuhailKakar

3. Tệp cấu hình

Nguồn: @SuhailKakar

4. Đặt tính cách đại lý

Nguồn: @SuhailKakar

Khung của Eliza tương đối dễ sử dụng. Nó dựa trên TypeScript, một ngôn ngữ mà hầu hết các nhà phát triển Web và Web3 đều quen thuộc. Khung này ngắn gọn và không quá trừu tượng, cho phép các nhà phát triển dễ dàng thêm các chức năng họ muốn. Qua bước 3, bạn có thể thấy rằng Eliza có thể được tích hợp với nhiều máy khách và bạn có thể hiểu nó như một trình biên dịch để tích hợp nhiều máy khách. Eliza hỗ trợ các nền tảng như DC, TG và

Do sự đơn giản của framework và sự phong phú của giao diện, Eliza đã hạ thấp đáng kể ngưỡng truy cập và đạt được các tiêu chuẩn giao diện tương đối thống nhất.

1.Fork thư viện ZerePy

Nguồn: https://replit.com/@blormdev/ZerePy?v=1

2. Cấu hình X và GPT

Nguồn: https://replit.com/@blormdev/ZerePy?v=1

3.Đặt tính cách đại lý

3.Đặt tính cách đại lý

Nguồn: https://replit.com/@blormdev/ZerePy?v=1

Lấy việc xây dựng Tác nhân RAG (Thế hệ nâng cao truy xuất) làm ví dụ:

1. Cấu hình môi trường và khóa OpenAI

Nguồn: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

2. Thiết lập ứng dụng khách OpenAI và sử dụng Chunking để xử lý PDF

Nguồn: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

3. Thiết lập cấu trúc và nhúng tài liệu

Nguồn: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

4. Tạo bộ lưu trữ vector và tác nhân RAG

Nguồn: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

Rig (ARC) là một khung xây dựng hệ thống AI dựa trên ngôn ngữ Rust dành cho các công cụ xử lý công việc LLM. Nói cách khác, ARC là một "hộp công cụ" công cụ AI cung cấp các lệnh gọi AI và tối ưu hóa hiệu suất. lưu trữ dữ liệu, xử lý ngoại lệ và các dịch vụ hỗ trợ nền khác.

Điều mà Rig muốn giải quyết là vấn đề “gọi” để giúp các nhà phát triển lựa chọn LLM tốt hơn, tối ưu hóa lời nhắc tốt hơn, quản lý mã thông báo hiệu quả hơn và cách xử lý xử lý đồng thời, quản lý tài nguyên, giảm độ trễ, v.v. Trọng tâm của nó là AI​ ​Mô hình LLM Cách "tận dụng tốt" khi cộng tác với hệ thống AI Agent.

Rig là một thư viện Rust mã nguồn mở được thiết kế để đơn giản hóa việc phát triển các ứng dụng dựa trên LLM (bao gồm cả RAG Agent). Bởi vì Rig cởi mở hơn nên nó có yêu cầu cao hơn đối với các nhà phát triển và hiểu biết cao hơn về Rust và Agent. Hướng dẫn ở đây là quy trình cấu hình RAG Agent cơ bản nhất giúp tăng cường LLM bằng cách kết hợp LLM với việc truy xuất kiến ​​thức bên ngoài. Trong các DEMO khác trên trang web chính thức, bạn có thể thấy Rig có các đặc điểm sau:

  • Giao diện LLM hợp nhất: hỗ trợ API nhất quán của các nhà cung cấp LLM khác nhau để đơn giản hóa việc tích hợp.
  • Quy trình làm việc trừu tượng: Các thành phần mô-đun dựng sẵn cho phép Rig đảm nhận việc thiết kế các hệ thống AI phức tạp.
  • Lưu trữ vectơ tích hợp: hỗ trợ tích hợp cho lưu trữ danh mục, mang lại hiệu suất hiệu quả trong các tác nhân tìm kiếm tương tự như RAG Agent.
  • Nhúng linh hoạt: Cung cấp API dễ sử dụng để xử lý nhúng, giảm bớt khó khăn trong việc hiểu ngữ nghĩa khi phát triển các tác nhân tìm kiếm tương tự như RAG Agent.

Có thể thấy rằng so với Eliza, Rig cung cấp cho các nhà phát triển thêm không gian để tối ưu hóa hiệu suất, giúp các nhà phát triển gỡ lỗi các lệnh gọi LLM và Agent cũng như tối ưu hóa cộng tác tốt hơn. Rig sử dụng hiệu suất do Rust điều khiển, tận dụng khả năng trừu tượng hóa không tốn chi phí của Rust và các hoạt động LLM an toàn bộ nhớ, hiệu suất cao, độ trễ thấp. Nó có thể cung cấp mức độ tự do phong phú hơn ở cấp độ cơ bản.

Swarms nhằm mục đích cung cấp một khung điều phối đa tác nhân cấp sản xuất cấp doanh nghiệp. Trang web chính thức cung cấp hàng chục quy trình công việc và kiến ​​trúc nối tiếp và song song của tác nhân. Đây là một phần nhỏ trong số đó.

Quy trình làm việc tuần tự

Swarms nhằm mục đích cung cấp một khung điều phối đa tác nhân cấp sản xuất cấp doanh nghiệp. Trang web chính thức cung cấp hàng chục quy trình công việc và kiến ​​trúc nối tiếp và song song của tác nhân. Đây là một phần nhỏ trong số đó.

Quy trình làm việc tuần tự

Nguồn: https://docs.swarms.world

Kiến trúc Sequential Swarm xử lý các tác vụ theo trình tự tuyến tính. Mỗi Tác nhân hoàn thành nhiệm vụ của mình trước khi chuyển kết quả cho Tác nhân tiếp theo trong chuỗi. Kiến trúc này đảm bảo xử lý có trật tự và hữu ích khi các tác vụ có sự phụ thuộc.

Trường hợp sử dụng:

  • Mỗi bước trong quy trình làm việc phụ thuộc vào bước trước đó, chẳng hạn như dây chuyền lắp ráp hoặc xử lý dữ liệu tuần tự.
  • Các kịch bản yêu cầu tuân thủ nghiêm ngặt thứ tự thao tác.

Kiến trúc phân cấp:

Nguồn: https://docs.swarms.world

Để đạt được sự kiểm soát từ trên xuống, Đại lý cấp trên sẽ điều phối các nhiệm vụ giữa các Đại lý cấp dưới. Các tác nhân thực hiện đồng thời các nhiệm vụ và sau đó đưa kết quả của chúng trở lại vòng lặp để tổng hợp lần cuối. Điều này rất hữu ích cho các nhiệm vụ có tính song song cao.

Kiến trúc định dạng bảng tính:

Nguồn: https://docs.swarms.world

Kiến trúc bầy đàn quy mô lớn để quản lý nhiều tác nhân làm việc đồng thời. Hàng nghìn tác nhân có thể được quản lý đồng thời, mỗi tác nhân chạy trên một luồng riêng. Đó là lý tưởng để giám sát đầu ra đại lý quy mô lớn.

Swarms không chỉ là một khung Tác nhân mà còn tương thích với các khung Eliza, ZerePy và Rig nêu trên. Nó sử dụng các ý tưởng mô-đun để tối đa hóa hiệu suất của Tác nhân trong các quy trình và kiến ​​trúc khác nhau nhằm giải quyết các vấn đề tương ứng. Khái niệm về Swarms và sự tiến bộ của cộng đồng nhà phát triển đều ổn.

  1. Eliza: Dễ sử dụng nhất, phù hợp cho người mới bắt đầu và tạo mẫu nhanh, đặc biệt phù hợp cho tương tác AI trên nền tảng truyền thông xã hội. Khung này đơn giản, dễ tích hợp và sửa đổi nhanh chóng, đồng thời phù hợp với các tình huống không yêu cầu tối ưu hóa hiệu suất quá mức.
  2. ZerePy: Triển khai bằng một cú nhấp chuột, phù hợp để phát triển nhanh chóng các ứng dụng AI Agent cho Web3 và nền tảng xã hội. Thích hợp cho các ứng dụng AI nhẹ, với khung đơn giản và cấu hình linh hoạt, phù hợp cho việc xây dựng và lặp lại nhanh chóng.
  3. Rig: tập trung vào tối ưu hóa hiệu suất, đặc biệt thực hiện tốt các tác vụ có tính đồng thời và hiệu suất cao, phù hợp với các nhà phát triển yêu cầu kiểm soát và tối ưu hóa chi tiết. Framework này tương đối phức tạp và đòi hỏi một lượng kiến ​​thức nhất định về Rust, khiến nó phù hợp với những nhà phát triển có kinh nghiệm hơn.
  4. Swarms: Thích hợp cho các ứng dụng cấp doanh nghiệp, hỗ trợ cộng tác nhiều Agent và quản lý tác vụ phức tạp. Khung này linh hoạt, hỗ trợ xử lý song song hàng loạt và cung cấp nhiều cấu hình kiến ​​trúc, nhưng do tính phức tạp của nó, nó có thể yêu cầu nền tảng kỹ thuật mạnh hơn để ứng dụng hiệu quả.

Nhìn chung, Eliza và ZerePy có ưu điểm là dễ sử dụng và phát triển nhanh, trong khi Rig và Swarms phù hợp hơn với các nhà phát triển chuyên nghiệp hoặc ứng dụng doanh nghiệp yêu cầu hiệu suất cao và xử lý quy mô lớn.

Đây là lý do tại sao khung Agent có tính năng "hy vọng trong ngành". Khung trên vẫn đang ở giai đoạn đầu và ưu tiên hàng đầu là nắm bắt lợi thế của người đi đầu và thiết lập một cộng đồng nhà phát triển tích cực. Hiệu suất của chính khung và liệu nó có tụt hậu so với các ứng dụng Web2 phổ biến hay không không phải là mâu thuẫn chính. Cuối cùng, chỉ những framework có lượng nhà phát triển đổ vào liên tục mới có thể giành chiến thắng, bởi vì ngành Web3 luôn cần thu hút sự chú ý của thị trường cho dù hiệu suất của framework có mạnh đến đâu và các nguyên tắc cơ bản vững chắc đến đâu, nếu khó bắt đầu và không. người ta quan tâm đến nó, nó sẽ đặt xe trước con ngựa. Với tiền đề rằng bản thân khuôn khổ này có thể thu hút các nhà phát triển, các khuôn khổ có mô hình kinh tế mã thông báo hoàn chỉnh và trưởng thành hơn sẽ nổi bật.

Khung Agent có tính năng "Memecoin", rất dễ hiểu. Không có mã thông báo khung nào được đề cập ở trên có thiết kế kinh tế mã thông báo hợp lý. Mã thông báo không có trường hợp sử dụng hoặc trường hợp sử dụng rất đơn lẻ. Không có mô hình kinh doanh đã được chứng minh và không có bánh đà mã thông báo hiệu quả. không có mối liên hệ nào giữa nó và các mã thông báo. Sự kết hợp hữu cơ hoàn chỉnh, sự tăng trưởng của giá mã thông báo khó có được sự hỗ trợ cơ bản ngoại trừ FOMO và không có đủ hào để đảm bảo tăng trưởng giá trị ổn định và lâu dài. Đồng thời, bản thân khuôn khổ nêu trên có vẻ tương đối thô và giá trị thực tế của nó không khớp với giá trị thị trường hiện tại nên nó có đặc điểm mạnh mẽ của "Memecoin".

Điều đáng chú ý là “tính đối ngẫu sóng-hạt” của khung Tác nhân không phải là một thiếu sót và không thể hiểu nôm na là chai nước vơi một nửa, không phải là Memecoin thuần túy hay trường hợp sử dụng mã thông báo. Như tôi đã đề cập trong bài viết trước của mình: Tác nhân nhẹ được che phủ bởi tấm màn Memecoin mơ hồ, văn hóa cộng đồng và các nguyên tắc cơ bản sẽ không còn mâu thuẫn, và một con đường phát triển tài sản mới đang dần xuất hiện mặc dù Tác nhân có bong bóng và những điều không chắc chắn trong giai đoạn đầu của; framework, nhưng không thể bỏ qua tiềm năng thu hút các nhà phát triển và thúc đẩy triển khai ứng dụng của nó. Trong tương lai, một khuôn khổ với mô hình kinh tế mã thông báo hoàn chỉnh và hệ sinh thái nhà phát triển mạnh mẽ có thể trở thành trụ cột chính của con đường này.

Giới thiệu về BlockBooster: BlockBooster là một studio đầu tư mạo hiểm Web3 châu Á được hỗ trợ bởi OKX Ventures và các tổ chức hàng đầu khác, cam kết trở thành đối tác đáng tin cậy cho các doanh nhân xuất sắc. Thông qua đầu tư chiến lược và ươm tạo chuyên sâu, chúng tôi kết nối các dự án Web3 với thế giới thực và giúp các dự án khởi nghiệp chất lượng cao phát triển.

Tuyên bố miễn trừ trách nhiệm: Bài viết/blog này chỉ mang tính chất tham khảo và thể hiện quan điểm cá nhân của tác giả chứ không thể hiện quan điểm của BlockBooster. Bài viết này không nhằm mục đích cung cấp: (i) lời khuyên đầu tư hoặc khuyến nghị đầu tư; (ii) lời đề nghị hoặc chào mời mua, bán hoặc nắm giữ tài sản kỹ thuật số hoặc (iii) tư vấn về tài chính, kế toán, pháp lý hoặc thuế; Việc nắm giữ các tài sản kỹ thuật số, bao gồm stablecoin và NFT, cực kỳ rủi ro, có biến động giá lớn và thậm chí có thể trở nên vô giá trị. Bạn nên cân nhắc cẩn thận xem việc giao dịch hoặc nắm giữ tài sản kỹ thuật số có phù hợp với mình hay không dựa trên tình hình tài chính của chính bạn. Vui lòng tham khảo ý kiến ​​cố vấn pháp lý, thuế hoặc đầu tư nếu bạn có thắc mắc về tình huống cụ thể của mình. Thông tin được cung cấp ở đây (bao gồm dữ liệu và số liệu thống kê thị trường, nếu có) chỉ được cung cấp cho mục đích thông tin chung. Sự cẩn trọng hợp lý đã được thực hiện khi chuẩn bị những dữ liệu và biểu đồ này, nhưng không thể chấp nhận trách nhiệm pháp lý đối với bất kỳ sai sót hoặc thiếu sót thực tế nào được thể hiện trong đó.

Các bình luận

Tất cả bình luận

Recommended for you