Giá cổ phiếu Nvidia đạt đỉnh mới, những tiến bộ của mô hình đa phương thức đã làm sâu sắc thêm rào cản kỹ thuật của Web2 AI. Từ căn chỉnh ngữ nghĩa đến hiểu biết thị giác, từ nhúng chiều cao đến hợp nhất đặc trưng, các mô hình phức tạp đang tích hợp các cách diễn đạt của nhiều phương thức với tốc độ chưa từng có, xây dựng một đỉnh cao AI ngày càng khép kín. Thị trường chứng khoán Mỹ cũng đã thể hiện sự lạc quan bằng hành động thực tế, bất kể là cổ phiếu liên quan đến tiền điện tử hay cổ phiếu AI, đều đã có một đợt tăng giá nhỏ.
Tuy nhiên, cơn sốt này dường như không liên quan đến lĩnh vực tiền điện tử. Những nỗ lực gần đây trong Web3 AI, đặc biệt là trong việc khám phá hướng Agent, có sự sai lệch lớn về định hướng. Việc cố gắng lắp ráp một hệ thống mô-đun đa phương thức theo kiểu Web2 bằng cấu trúc phi tập trung thực chất là một sự không phù hợp cả về công nghệ lẫn tư duy. Trong bối cảnh sự kết hợp mô-đun cực kỳ mạnh mẽ, phân bố đặc trưng không ổn định cao và nhu cầu tính toán ngày càng tập trung, mô-đun đa phương thức khó có thể đứng vững trong môi trường Web3.
Tương lai của Web3 AI không nằm ở việc bắt chước, mà nằm ở sự đi vòng chiến lược. Từ việc căn chỉnh ngữ nghĩa trong không gian cao chiều, đến nút thắt thông tin trong cơ chế chú ý, và đến việc căn chỉnh đặc trưng dưới sức mạnh tính toán dị thể, Web3 AI cần phải áp dụng chiến lược chiến thuật "nông thôn bao vây thành phố".
Web3 AI dựa trên mô hình đa phương thức phẳng, khó khăn trong việc căn chỉnh ngữ nghĩa dẫn đến hiệu suất kém
Trong hệ thống đa phương thức của Web2 AI hiện đại, "căn chỉnh ngữ nghĩa" đề cập đến việc ánh xạ thông tin từ các phương thức khác nhau vào cùng một không gian ngữ nghĩa, giúp mô hình hiểu và so sánh những tín hiệu có hình thức khác nhau này. Chỉ khi đạt được không gian nhúng nhiều chiều, việc chia quy trình làm việc thành các mô-đun mới có ý nghĩa trong việc giảm chi phí và nâng cao hiệu quả. Tuy nhiên, giao thức Web3 Agent không thể đạt được không gian nhúng nhiều chiều, vì mô-đun hóa thực sự chỉ là một ảo giác trong Web3 AI.
Web3 AI yêu cầu thực hiện không gian nhiều chiều, tương đương với việc yêu cầu giao thức Agent tự phát triển tất cả các giao diện API liên quan, điều này đi ngược lại với mục đích mô-đun của nó. Kiến trúc nhiều chiều yêu cầu đào tạo thống nhất từ đầu đến cuối hoặc tối ưu hóa hợp tác, trong khi tư duy "mô-đun là plugin" của Web3 Agent lại càng làm gia tăng sự phân mảnh.
Để hiện thực hóa một tác nhân thông minh toàn chuỗi có rào cản ngành, cần phải có mô hình hợp tác từ đầu đến cuối, nhúng thống nhất giữa các mô-đun, cũng như kỹ thuật hệ thống để đào tạo và triển khai hợp tác, nhưng hiện tại thị trường không có những điểm đau như vậy, do đó cũng không có nhu cầu thị trường tương ứng.
Trong không gian chiều thấp, cơ chế chú ý khó có thể thiết kế chính xác.
Mô hình đa phương thức ở mức cao cần thiết kế cơ chế chú ý chính xác. Điều kiện tiên quyết để cơ chế chú ý hoạt động là đa phương thức phải có độ cao chiều, trong không gian chiều cao, cơ chế chú ý chính xác có thể tìm thấy phần cốt lõi nhất trong không gian chiều cao khổng lồ trong thời gian ngắn nhất.
Việc lập lịch chú ý thống nhất trong Web3 AI dựa trên mô-đun là rất khó khăn. Đầu tiên, cơ chế chú ý phụ thuộc vào không gian Query-Key-Value thống nhất, trong khi các API độc lập trả về dữ liệu với định dạng và phân bố khác nhau, không có lớp nhúng thống nhất. Thứ hai, chú ý đa đầu cho phép chú ý đồng thời đến các nguồn thông tin khác nhau cùng một lúc, trong khi các API độc lập thường gọi tuyến tính, thiếu khả năng song song và trọng số động đa đường. Cuối cùng, cơ chế chú ý thực sự sẽ phân bổ trọng số cho mỗi yếu tố dựa trên ngữ cảnh tổng thể, trong khi trong mô hình API, các mô-đun chỉ có thể nhìn thấy ngữ cảnh độc lập của chúng khi được gọi.
Mô-đun hóa kiểu rời rạc dẫn đến việc kết hợp đặc trưng chỉ dừng lại ở việc ghép tĩnh nông.
Sát nhập đặc trưng là việc kết hợp các vectơ đặc trưng thu được từ các chế độ khác nhau sau khi xử lý dựa trên sự căn chỉnh và chú ý, để sử dụng trực tiếp cho các nhiệm vụ hạ nguồn. Web3 AI dĩ nhiên chỉ dừng lại ở giai đoạn kết nối đơn giản nhất, vì điều kiện tiên quyết cho sự sát nhập đặc trưng động là không gian nhiều chiều và cơ chế chú ý tinh vi.
AI Web2 có xu hướng đào tạo liên kết từ đầu đến cuối, trong khi AI Web3 thường sử dụng cách ghép nối các mô-đun rời rạc. AI Web2 có khả năng tính toán điểm quan trọng của các đặc trưng theo ngữ cảnh theo thời gian thực và điều chỉnh chiến lược hợp nhất một cách động, trong khi AI Web3 thường cố định trọng số trước hoặc sử dụng các quy tắc đơn giản để xác định xem có hợp nhất hay không.
Web2 AI ánh xạ tất cả các đặc điểm của nhiều mô thức vào không gian cao chiều hàng nghìn chiều, quá trình hòa trộn bao gồm nhiều thao tác tương tác bậc cao. Ngược lại, đầu ra của các Agent trong Web3 AI thường chỉ chứa một vài trường hoặc chỉ số quan trọng, độ chiều của đặc điểm rất thấp, khó diễn đạt các mối liên hệ phức tạp giữa các mô thức.
Rào cản trong ngành AI đang ngày càng sâu sắc, nhưng những điểm đau vẫn chưa xuất hiện
Hệ thống đa mô hình AI Web2 là một dự án kỹ thuật cực kỳ lớn, cần một lượng dữ liệu khổng lồ, sức mạnh tính toán mạnh mẽ, thuật toán tiên tiến và nhân tài xuất sắc. Công việc hệ thống toàn diện và toàn ngăn này tạo ra rào cản ngành cực kỳ mạnh mẽ, đồng thời hình thành năng lực cạnh tranh cốt lõi của một số đội ngũ dẫn đầu.
Web3 AI hoặc bất kỳ dự án tiền điện tử nào nhằm mục tiêu phù hợp với thị trường sản phẩm đều cần áp dụng chiến thuật "nông thôn vây thành phố". Nên thử nghiệm quy mô nhỏ ở các tình huống biên, đảm bảo nền tảng vững chắc trước khi chờ đợi sự xuất hiện của các tình huống cốt lõi. Cốt lõi của Web3 AI nằm ở sự phi tập trung, con đường tiến hóa của nó thể hiện qua khả năng song song cao, liên kết thấp và tính tương thích với khả năng tính toán dị thể.
Hiện tại, rào cản của Web2 AI chỉ mới bắt đầu hình thành, đây là giai đoạn đầu trong cuộc cạnh tranh giữa các doanh nghiệp hàng đầu. Chỉ khi nào lợi ích của Web2 AI gần như biến mất, những điểm đau mà nó để lại mới là cơ hội để Web3 AI tham gia. Trước đó, chúng ta cần cẩn thận phân biệt các giao thức có tiềm năng "nông thôn bao vây thành phố", chú ý xem chúng có thể liên tục lặp lại trong các tình huống nhỏ hay không, và liệu chúng có đủ linh hoạt để thích ứng với các tình huống khác nhau hay không. Nếu giao thức quá phụ thuộc vào cơ sở hạ tầng, kiến trúc mạng lớn, thì khả năng bị loại bỏ sẽ rất cao.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
26 thích
Phần thưởng
26
10
Đăng lại
Chia sẻ
Bình luận
0/400
HashBandit
· 16giờ trước
giống như các dàn khai thác của tôi vào năm 2017... tất cả sức mạnh tính toán đó mà vẫn bị rekt smh
Xem bản gốcTrả lời0
MemeKingNFT
· 08-18 13:04
Thắng lớn rồi lại là sự xung đột dữ liệu, on-chain Đại Lục vẫn chìm nổi. Kiên nhẫn chờ đợi thủy triều lên xuống.
Xem bản gốcTrả lời0
TooScaredToSell
· 08-17 23:54
nvda đang tăng thì nhìn lên là đúng
Xem bản gốcTrả lời0
AirdropFatigue
· 08-16 07:50
a16z nói được làm được
Xem bản gốcTrả lời0
airdrop_whisperer
· 08-16 07:46
web2没戏了兄弟们 nhập một vị thế
Xem bản gốcTrả lời0
RektRecovery
· 08-16 07:44
đã gọi sự sụp đổ kiến trúc này cách đây vài tháng... web3 + ai = gấp đôi bề mặt tấn công, không có logic thật lòng mà nói
Khó khăn trong phát triển Web3 AI: Sự phù hợp ngữ nghĩa cao chiều và cơ chế chú ý trở thành vấn đề.
Hướng phát triển và thách thức của Web3 AI
Giá cổ phiếu Nvidia đạt đỉnh mới, những tiến bộ của mô hình đa phương thức đã làm sâu sắc thêm rào cản kỹ thuật của Web2 AI. Từ căn chỉnh ngữ nghĩa đến hiểu biết thị giác, từ nhúng chiều cao đến hợp nhất đặc trưng, các mô hình phức tạp đang tích hợp các cách diễn đạt của nhiều phương thức với tốc độ chưa từng có, xây dựng một đỉnh cao AI ngày càng khép kín. Thị trường chứng khoán Mỹ cũng đã thể hiện sự lạc quan bằng hành động thực tế, bất kể là cổ phiếu liên quan đến tiền điện tử hay cổ phiếu AI, đều đã có một đợt tăng giá nhỏ.
Tuy nhiên, cơn sốt này dường như không liên quan đến lĩnh vực tiền điện tử. Những nỗ lực gần đây trong Web3 AI, đặc biệt là trong việc khám phá hướng Agent, có sự sai lệch lớn về định hướng. Việc cố gắng lắp ráp một hệ thống mô-đun đa phương thức theo kiểu Web2 bằng cấu trúc phi tập trung thực chất là một sự không phù hợp cả về công nghệ lẫn tư duy. Trong bối cảnh sự kết hợp mô-đun cực kỳ mạnh mẽ, phân bố đặc trưng không ổn định cao và nhu cầu tính toán ngày càng tập trung, mô-đun đa phương thức khó có thể đứng vững trong môi trường Web3.
Tương lai của Web3 AI không nằm ở việc bắt chước, mà nằm ở sự đi vòng chiến lược. Từ việc căn chỉnh ngữ nghĩa trong không gian cao chiều, đến nút thắt thông tin trong cơ chế chú ý, và đến việc căn chỉnh đặc trưng dưới sức mạnh tính toán dị thể, Web3 AI cần phải áp dụng chiến lược chiến thuật "nông thôn bao vây thành phố".
Web3 AI dựa trên mô hình đa phương thức phẳng, khó khăn trong việc căn chỉnh ngữ nghĩa dẫn đến hiệu suất kém
Trong hệ thống đa phương thức của Web2 AI hiện đại, "căn chỉnh ngữ nghĩa" đề cập đến việc ánh xạ thông tin từ các phương thức khác nhau vào cùng một không gian ngữ nghĩa, giúp mô hình hiểu và so sánh những tín hiệu có hình thức khác nhau này. Chỉ khi đạt được không gian nhúng nhiều chiều, việc chia quy trình làm việc thành các mô-đun mới có ý nghĩa trong việc giảm chi phí và nâng cao hiệu quả. Tuy nhiên, giao thức Web3 Agent không thể đạt được không gian nhúng nhiều chiều, vì mô-đun hóa thực sự chỉ là một ảo giác trong Web3 AI.
Web3 AI yêu cầu thực hiện không gian nhiều chiều, tương đương với việc yêu cầu giao thức Agent tự phát triển tất cả các giao diện API liên quan, điều này đi ngược lại với mục đích mô-đun của nó. Kiến trúc nhiều chiều yêu cầu đào tạo thống nhất từ đầu đến cuối hoặc tối ưu hóa hợp tác, trong khi tư duy "mô-đun là plugin" của Web3 Agent lại càng làm gia tăng sự phân mảnh.
Để hiện thực hóa một tác nhân thông minh toàn chuỗi có rào cản ngành, cần phải có mô hình hợp tác từ đầu đến cuối, nhúng thống nhất giữa các mô-đun, cũng như kỹ thuật hệ thống để đào tạo và triển khai hợp tác, nhưng hiện tại thị trường không có những điểm đau như vậy, do đó cũng không có nhu cầu thị trường tương ứng.
Trong không gian chiều thấp, cơ chế chú ý khó có thể thiết kế chính xác.
Mô hình đa phương thức ở mức cao cần thiết kế cơ chế chú ý chính xác. Điều kiện tiên quyết để cơ chế chú ý hoạt động là đa phương thức phải có độ cao chiều, trong không gian chiều cao, cơ chế chú ý chính xác có thể tìm thấy phần cốt lõi nhất trong không gian chiều cao khổng lồ trong thời gian ngắn nhất.
Việc lập lịch chú ý thống nhất trong Web3 AI dựa trên mô-đun là rất khó khăn. Đầu tiên, cơ chế chú ý phụ thuộc vào không gian Query-Key-Value thống nhất, trong khi các API độc lập trả về dữ liệu với định dạng và phân bố khác nhau, không có lớp nhúng thống nhất. Thứ hai, chú ý đa đầu cho phép chú ý đồng thời đến các nguồn thông tin khác nhau cùng một lúc, trong khi các API độc lập thường gọi tuyến tính, thiếu khả năng song song và trọng số động đa đường. Cuối cùng, cơ chế chú ý thực sự sẽ phân bổ trọng số cho mỗi yếu tố dựa trên ngữ cảnh tổng thể, trong khi trong mô hình API, các mô-đun chỉ có thể nhìn thấy ngữ cảnh độc lập của chúng khi được gọi.
Mô-đun hóa kiểu rời rạc dẫn đến việc kết hợp đặc trưng chỉ dừng lại ở việc ghép tĩnh nông.
Sát nhập đặc trưng là việc kết hợp các vectơ đặc trưng thu được từ các chế độ khác nhau sau khi xử lý dựa trên sự căn chỉnh và chú ý, để sử dụng trực tiếp cho các nhiệm vụ hạ nguồn. Web3 AI dĩ nhiên chỉ dừng lại ở giai đoạn kết nối đơn giản nhất, vì điều kiện tiên quyết cho sự sát nhập đặc trưng động là không gian nhiều chiều và cơ chế chú ý tinh vi.
AI Web2 có xu hướng đào tạo liên kết từ đầu đến cuối, trong khi AI Web3 thường sử dụng cách ghép nối các mô-đun rời rạc. AI Web2 có khả năng tính toán điểm quan trọng của các đặc trưng theo ngữ cảnh theo thời gian thực và điều chỉnh chiến lược hợp nhất một cách động, trong khi AI Web3 thường cố định trọng số trước hoặc sử dụng các quy tắc đơn giản để xác định xem có hợp nhất hay không.
Web2 AI ánh xạ tất cả các đặc điểm của nhiều mô thức vào không gian cao chiều hàng nghìn chiều, quá trình hòa trộn bao gồm nhiều thao tác tương tác bậc cao. Ngược lại, đầu ra của các Agent trong Web3 AI thường chỉ chứa một vài trường hoặc chỉ số quan trọng, độ chiều của đặc điểm rất thấp, khó diễn đạt các mối liên hệ phức tạp giữa các mô thức.
Rào cản trong ngành AI đang ngày càng sâu sắc, nhưng những điểm đau vẫn chưa xuất hiện
Hệ thống đa mô hình AI Web2 là một dự án kỹ thuật cực kỳ lớn, cần một lượng dữ liệu khổng lồ, sức mạnh tính toán mạnh mẽ, thuật toán tiên tiến và nhân tài xuất sắc. Công việc hệ thống toàn diện và toàn ngăn này tạo ra rào cản ngành cực kỳ mạnh mẽ, đồng thời hình thành năng lực cạnh tranh cốt lõi của một số đội ngũ dẫn đầu.
Web3 AI hoặc bất kỳ dự án tiền điện tử nào nhằm mục tiêu phù hợp với thị trường sản phẩm đều cần áp dụng chiến thuật "nông thôn vây thành phố". Nên thử nghiệm quy mô nhỏ ở các tình huống biên, đảm bảo nền tảng vững chắc trước khi chờ đợi sự xuất hiện của các tình huống cốt lõi. Cốt lõi của Web3 AI nằm ở sự phi tập trung, con đường tiến hóa của nó thể hiện qua khả năng song song cao, liên kết thấp và tính tương thích với khả năng tính toán dị thể.
Hiện tại, rào cản của Web2 AI chỉ mới bắt đầu hình thành, đây là giai đoạn đầu trong cuộc cạnh tranh giữa các doanh nghiệp hàng đầu. Chỉ khi nào lợi ích của Web2 AI gần như biến mất, những điểm đau mà nó để lại mới là cơ hội để Web3 AI tham gia. Trước đó, chúng ta cần cẩn thận phân biệt các giao thức có tiềm năng "nông thôn bao vây thành phố", chú ý xem chúng có thể liên tục lặp lại trong các tình huống nhỏ hay không, và liệu chúng có đủ linh hoạt để thích ứng với các tình huống khác nhau hay không. Nếu giao thức quá phụ thuộc vào cơ sở hạ tầng, kiến trúc mạng lớn, thì khả năng bị loại bỏ sẽ rất cao.