OpenAI công bố o3, một mô hình lập luận tiên tiến. Và lý do bỏ qua mô hình o2.

Jan 09, 2025

OpenAI, công ty sáng tạo ra ChatGPT, vừa phát hành o3, phiên bản kế nhiệm của o1, mô hình lập luận tiên tiến mà họ tuyên bố là đang tiến gần đến AGI(Artificial general intelligence) hay AI trí thông minh như con người. Đi kèm là o3-mini lý tưởng để tùy chỉnh cho các công việc cụ thể. Nhưng thật không may, tính năng này vẫn chưa khả dụng cho người dùng nói chung. Bản xem trước o3-mini chỉ dành cho các nhà nghiên cứu bảo mật đã đăng ký. Còn o3 chưa có sẵn để thử nghiệm. OpenAI có kế hoạch phát hành o3-mini vào cuối tháng 1 và sau đó là o3.

Nhiều người có thể thắc mắc rằng OpenAI vừa mới phát hành o1 vào đầu năm trước và phát hành o3. Khi nào thì o2 sẽ được phát hành? Lý do là công ty đã bỏ qua mô hình o2 vì tên của nó giống với O2- một nhà cung cấp dịch vụ viễn thông của Anh. Ngoài ra, không ai nghĩ rằng o3 sẽ được phát hành vào thời điểm này. Tính đến tuần này, Giám đốc điều hành của OpenAI, Sam Altman đã tiết lộ rằng trước khi phát hành mô hình lập luận mới, ông muốn thấy khuôn khổ thử nghiệm của chính phủ Hoa Kỳ trước để kiểm tra và tránh những rủi ro do mô hình này gây ra.

Mô hình o3 đã vượt qua bài kiểm tra ARC-AGI đánh giá trí thông minh của AI. Nó có thể kiểm tra Low-compute scenarios với số điểm là 75,7% và High-compute với số điểm là 87,5%, tương đương với tiêu chí hiệu suất của con người là 85%. Ngoài ra, nó đã làm bải kiểm tra Kỳ thi Toán mời của Hoa Kỳ năm 2024 (2024 American Invitational Mathematics Exam) với số điểm là 96,7%, chỉ với một lỗi, đạt 87,7% trong kỳ thi GPQA Diamond đại học về sinh học, vật lý và hóa học, và kiểm tra Frontier Math benchmark bởi EpochAI đã giải quyết được 258,2% số bài toán, với không có mô hình nào đạt điểm hơn 2%.

OpenAI tiết lộ rằng mô hình o3-mini vượt trội hơn o1 trong chuẩn Codeforces benchmark. Ngoài ra, o3 còn có tính năng Adaptive thinking time, có thể điều chỉnh thời gian suy nghĩ theo tình huống. Với tốc độ xử lý cả chậm và nhanh, trung bình và cao, trong đó cài đặt xử lý cao hơn mang lại kết quả tốt hơn.

Việc OpenAI công bố mô hình lập luận o3 mới của mình diễn ra khi các công ty AI khác đã phát hành các mô hình lập luận thế hệ đầu tiên của họ. Vào tháng 11/2024, công ty AI Trung Quốc DeepSeek đã phát hành mô hình lập luận DeepSeek-R1 và Alibaba đã phát hành mô hình Qwen. Còn Google cũng đã phát hành Gemini 2.0 Flash Thinking Experimental.

You need to login in order to like this post: click here