Công ty trí tuệ nhân tạo xAI của Musk đã công bố ra mắt mẫu AI đa phương thức đầu tiên Grok-1.5V. Ngoài khả năng xử lý văn bản mạnh mẽ, Grok còn có thể xử lý nhiều loại thông tin trực quan, bao gồm tài liệu, biểu đồ, ảnh chụp màn hình, ảnh, v.v. Trong các bài kiểm tra điểm chuẩn ở nhiều lĩnh vực, hiệu suất của Grok-1.5V có thể so sánh với các mẫu đa phương thức tiên tiến hiện có. Đặc biệt trong bài kiểm tra điểm chuẩn RealWorldQA mới do xAI đưa ra, Grok đã vượt qua các mô hình tương tự về khả năng hiểu biết không gian trong thế giới thực. Bộ dữ liệu RealWorldQA chứa hơn 700 hình ảnh và được thiết kế để đánh giá sự hiểu biết cơ bản của các mô hình đa phương thức về thế giới vật lý. Grok-1.5 sẽ sớm có sẵn cho những người thử nghiệm sớm và người dùng hiện tại.
Tất cả bình luận