2025-12-05 07:14:19

Vào đầu tháng 12 năm ngoái, Quỹ OpenAGI đã thực hiện một động thái lớn—ra mắt mô hình nền tảng có tên Lux. Thứ này khá thú vị, được quảng bá là giải pháp mã nguồn mở đầu tiên giúp AI học cách “nhấp chuột, gõ phím như con người”.

Nói đơn giản, trước đây AI dù thông minh đến đâu cũng phải dựa vào API để làm việc, còn giờ đây Lux có thể thao tác trực tiếp trên giao diện phần mềm. Họ đã thử nghiệm trên 300 kịch bản tác vụ hàng ngày và kết quả khá ấn tượng: đạt 83,6% trên Online-Mind2Web, một tiêu chuẩn phổ biến trong ngành.

So sánh mới thấy giá trị—CUA của một ông lớn tìm kiếm đạt 69%, Operator của một công ty chatbot là 61,3%, thậm chí một hãng nổi bật về trợ lý AI như Claude Sonnet cũng không vượt qua điểm số này.

Con đường mã nguồn mở thực sự có gì đó đặc biệt, ít nhất đã giúp nhiều nhà phát triển tiếp cận ngưỡng cửa của hướng đi “AI tự động thao tác máy tính”.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

8 thích

Phần thưởng
8
6
Đăng lại
Retweed

Bình luận

0/400

LiquidatedTwice

· 3giờ trước

Vãi, dữ liệu của Lux này thật hay giả vậy, 83.6% đè bẹp Claude luôn à? Hơi khó tin nhỉ.

Xem bản gốcTrả lời0

PuzzledScholar

· 3giờ trước

83.6% con số này hơi đáng sợ đấy, cảm giác AI thực sự bắt đầu "tự làm việc" rồi --- Mã nguồn mở đúng là tin vui cho người dùng, trước đây mấy thứ này đều bị các ông lớn khóa chặt --- Khoan đã, Lux có thể trực tiếp thao tác giao diện? Thế thì nghề của tôi sống kiểu gì đây --- Claude Sonnet bị đánh bại rồi, thế này thì ngại thật --- Kết quả kiểm tra từ 300 kịch bản nhiệm vụ có tin được không, tôi cứ thấy có gì đó không minh bạch --- Đúng là vẫn phải xem các giải pháp mã nguồn mở, AI thương mại càng ngày càng phi lý --- Bấm chuột gõ phím nghe thì đơn giản, nhưng thực sự làm được như này vẫn là đỉnh --- Cái này mà hoàn thiện thì nhiều công việc lặp đi lặp lại sẽ biến mất luôn nhỉ

Xem bản gốcTrả lời0

SmartContractRebel

· 3giờ trước

83,6% con số này đúng là quá kinh khủng, đánh bại trực tiếp các giải pháp đóng nguồn của các ông lớn luôn Bản mã nguồn mở mà lại vượt qua được Claude, điều này nói lên điều gì? Có lẽ các ông lớn chỉ đang làm cho có thôi haha Điều thực sự khiến mình tò mò là 300 kịch bản nhiệm vụ này có đủ thực tế không... Cảm giác vẫn cần thời gian kiểm chứng Nói thật, mấy thứ AI tự động thao tác máy tính như này mà phổ biến thì bọn mình làm công ăn lương chắc thất nghiệp mất Lux là cái tên đặt khá ổn, nghe đã thấy "sáng", ám chỉ mã nguồn mở sẽ cứu rỗi thế giới à Lần này quỹ thật sự không nói quá, dữ liệu đã rõ ràng, còn đáng tin hơn cả slide PPT ở hội nghị ra mắt chính thức Cảm giác các bài benchmark AI năm 2024 sắp thành trò cười rồi, Lux xuất hiện phát là đảo ngược luôn bảng xếp hạng

Xem bản gốcTrả lời0

CommunityWorker

· 3giờ trước

83,6% trực tiếp đè bẹp các đối thủ khác, mã nguồn mở thực sự mạnh đến vậy sao, sao tôi cảm thấy hơi ảo nhỉ

Xem bản gốcTrả lời0

SandwichVictim

· 3giờ trước

83,6% con số này thật sự quá đỉnh, trực tiếp áp đảo Gemini và Claude, mô hình mã nguồn mở bắt đầu lật ngược thế cờ rồi? --- Đây thật sự là chiến thắng của cộng đồng mã nguồn mở, cuối cùng cũng có người làm được việc này rồi --- Khoan đã, có thể thao tác trực tiếp trên giao diện chẳng phải là tiến hóa tối thượng của RPA sao, nếu điều này được triển khai rộng rãi thì hơi đáng sợ đấy --- Còn mạnh hơn cả Claude Sonnet? Sao tôi thấy nhận định này hơi thổi phồng nhỉ --- Mã nguồn mở muôn năm, đã đến lúc phá vỡ thế độc quyền của các ông lớn rồi --- Chỉ cần nhấp chuột, gõ bàn phím... nếu thực sự áp dụng, nhiều vị trí công việc chắc phải run sợ đấy

Xem bản gốcTrả lời0

alpha_leaker