Công nghệ

Deepseek bị lật – Công nghệ

Bởi

May 6, 2025

Mô hình KI với tên QWEN3 từ Alibaba đã vượt quá R1 trong các thử nghiệm LiveBench, trong đó chức năng mô hình OpenSource bao gồm lập trình, toán học và phân tích dữ liệu được đánh giá.

Qwen3, công nghệ mới từ Alibaba bắt đầu. Ảnh: SCMP.

Theo các thử nghiệm tiêu chuẩn mới nhất của AI, mô hình QWEN3 mới được phát hành cho trí tuệ nhân tạo từ Alibaba Deepseekeeks R1 đã vượt quá mô hình nguồn mở cao nhất thế giới.

Cụ thể, dữ liệu từ LiveBench, một cơ sở độc lập để phân loại các mô hình quy mô lớn (LLM), công nghệ nền cho những người tạo ra các ca sinh như Chatt cho thấy QWEN3 R1 đã vượt quá các thử nghiệm.

Đánh giá các chức năng của các mô hình Open -Source -Ki, bao gồm lập trình, toán học, phân tích dữ liệu và hướng dẫn ngôn ngữ.

Một loạt các mô hình AI có tên QWEN3 đã được Alibaba xuất bản vào ngày 28 tháng 4. Công ty tuyên bố rằng bot trò chuyện này có thể so sánh trong một số trường hợp, ngay cả những mô hình tốt nhất hiện nay từ OpenAI hoặc Google.

Với kích thước lên tới 235 tỷ thông số, QWEN3 có hiệu quả hoạt động của DeepSeek-V2 và Openai GPT-4, có khoảng 236 tỷ hoặc 175 tỷ thông số. Người dùng sẽ sớm có thể tải xuống với giấy phép mở để phát triển Ai -maumung và GitHub ngay khi loạt bài này được phát hành.

Công ty cho biết bộ sưu tập QWEN3 bao gồm các mô hình lai, điều đó có nghĩa là nó có thể phản ứng linh hoạt để giải quyết các vấn đề phức tạp hơn hoặc nhanh chóng theo các yêu cầu đơn giản. Cụ thể, khả năng tranh luận giúp mô hình kiểm tra chính nó, độ chính xác của thông tin, nhưng nhận được độ trễ cao.

Thiết kế này giúp người dùng dễ dàng phân phối ngân sách phù hợp cho từng nhiệm vụ cụ thể. Ngoài ra, mô hình này cũng học hỏi từ nhiều từ cạnh tranh trên khắp thế giới.

Kiến trúc “Hỗn hợp các chuyên gia” (MOE) giống như Deepseek. Qwen3 có thể tối ưu hóa hiệu suất tính toán, nhưng chỉ sử dụng chi phí đào tạo. Đây là một phương pháp để phân phối nhiệm vụ thành nhiều công việc riêng biệt và chỉ đề xuất một lượng dữ liệu chuyên sâu.

Theo nhóm phát triển, QWEN3 hỗ trợ lên tới 119 ngôn ngữ và được đào tạo trong một bản ghi dữ liệu gần 36.000 tỷ mã thông báo, tương ứng với 27.000 tỷ từ. Ngày đào tạo đến từ nhiều nguồn như sách giáo khoa, câu hỏi – câu trả lời, mã lập trình hoặc người đã tạo ra cho chính mình, …

Mặc dù đứng đầu bảng xếp hạng nguồn mở, bài kiểm tra mở rộng LiveBench cho thấy QWEN3 vẫn đứng sau các mô hình nguồn AI hàng đầu của thế giới. Nổi bật nhất là O3 bởi Openaai, Google Gemini Pro 2.5 và Claude 3.7 bởi Anthropic.

Mô hình nâng cao nhất của Microsoft hiện đang được hỗ trợ. O3-mini cao là tên tốt nhất của cấp bậc tổng thể của các mô hình AI trên thế giới.

Ấn phẩm học thuật từ chối luật bản quyền của Chatgpt

Có một làn sóng lo ngại về thực tế là AI có thể có hại với các khiếm khuyết hoặc thậm chí sản xuất cho các tài liệu học thuật. Springer-nature, một ấn phẩm của gần 3.000 tạp chí, đã cập nhật các hướng dẫn của mình và tuyên bố rằng TATGPT không thể được liệt kê như một tác giả. Nhiều đơn vị xuất bản khác đã tạo ra các bản cập nhật tương tự.

Kế hoạch lớn của Openai đã sụp đổ

Openai, công ty đứng sau Chatbot Chatt, hủy bỏ việc chuyển đổi mô hình kinh doanh, đang theo đuổi lợi nhuận, một công ty trở thành một lợi thế công cộng.

22 giờ trước

Deepseek bị lật – Công nghệ

Kế hoạch lớn của Openai đã sụp đổ

PHỔ BIẾN NHẤT

Gemini 2.0 – Đột phá AI mới nhất của Google

Hé lộ hình ảnh trong dinh Tổng thống Syria al-Assad

Nghiên cứu đầu tư xây dựng trung tâm hành chính

Đóng cửa nhiều địa điểm kinh doanh “nhạy cảm” ở trung tâm TP.HCM –...

Ô tô bị mất người lái, gặp một số xe máy ở BAC Ninh