OpenAI vừa giới thiệu GPT-4o mini, mô hình trí tuệ nhân tạo (AI) nhỏ gọn mới nhất của mình. OpenAI cho biết GPT-4o mini rẻ hơn và nhanh hơn các mô hình AI hiện đại nhất hiện nay, và đang bắt đầu có sẵn cho các nhà phát triển và người dùng thông qua ứng dụng web và di động ChatGPT, và dự kiến sẽ có sẵn cho người dùng doanh nghiệp vào tuần tới.
Theo OpenAI, GPT-4o mini vượt trội hơn các mô hình AI nhỏ hàng đầu hiện nay về các tác vụ liên quan đến văn bản và thị giác. Khi các mô hình AI nhỏ được cải thiện, chúng trở nên phổ biến hơn với các nhà phát triển do tốc độ và hiệu quả về chi phí so với các mô hình lớn hơn, chẳng hạn như GPT-4 Omni hoặc Claude 3.5 Sonnet. Chúng là lựa chọn hữu ích cho các tác vụ đơn giản, khối lượng lớn mà các nhà phát triển có thể yêu cầu mô hình AI thực hiện nhiều lần.
GPT-4o mini sẽ thay thế GPT-3.5 Turbo trở thành mô hình nhỏ nhất do OpenAI cung cấp. Theo OpenAI, GPT-4o mini đạt 82% trên MMLU, một chuẩn mực đo lường khả năng suy luận, so với 79% của Gemini 1.5 Flash và 75% của Claude 3 Haiku (dữ liệu từ Artificial Analysis). Trên MGSM, một thước đo khả năng toán học, GPT-4o mini đạt 87%, so với 78% của Flash và 72% của Haiku.
Ngoài ra, OpenAI cho biết chi phí vận hành GPT-4o mini tiết kiệm hơn đáng kể so với các mẫu máy tiên phong trước đó và rẻ hơn 60% so với GPT-3.5 Turbo. Hiện tại, GPT-4o mini hỗ trợ xử lý văn bản và hình ảnh trong API, trong tương lai, OpenAI cho biết mẫu máy này sẽ hỗ trợ khả năng xử lý video và âm thanh.
“Để AI có thể hỗ trợ mọi ngóc ngách trên thế giới, chúng ta cần làm cho các mô hình dễ tiếp cận hơn nhiều”, Olivier Godement, Giám đốc API sản phẩm của OpenAI, cho biết trong một cuộc phỏng vấn với TechCrunch. “Tôi nghĩ GPT-4o mini là một bước tiến thực sự lớn theo hướng đó”.
Đối với các nhà phát triển xây dựng trên API của OpenAI, GPT-4o mini có giá 15 xu cho 1 triệu token đầu vào và 60 xu cho 1 triệu token đầu ra. Mô hình có cửa sổ ngữ cảnh là 128.000 token, gần bằng độ dài của một cuốn sách và được cập nhật dữ liệu đến tháng 10 năm 2023.
OpenAI chưa tiết lộ kích thước chính xác của GPT-4o mini, nhưng cho biết nó có thể so sánh với các mô hình AI nhỏ khác như Llama 3 8b, Claude Haiku và Gemini 1.5 Flash. Tuy nhiên, dựa trên các thử nghiệm trước khi ra mắt trên LMSYS.org, một nền tảng thi chatbot, OpenAI tuyên bố GPT-4o mini nhanh hơn, tiết kiệm chi phí hơn và thông minh hơn các mô hình nhỏ hàng đầu. Các thử nghiệm độc lập ban đầu dường như xác nhận điều này.
“So với các mẫu tương đương, GPT-4o mini rất nhanh, với tốc độ đầu ra trung bình là 202 token mỗi giây”George Cameron, người đồng sáng lập Artificial Analysis, cho biết trong email gửi tới TechCrunch. “Nhanh hơn gấp đôi so với GPT-4o và GPT-3.5 Turbo, khiến đây trở thành lựa chọn hấp dẫn cho các trường hợp sử dụng nhạy cảm với tốc độ, bao gồm nhiều ứng dụng tiêu dùng và các phương pháp mới để sử dụng mô hình ngôn ngữ lớn (LLM).”
Link nguồn: https://cafef.vn/openai-ra-mat-gpt-4-mini-mo-hinh-gon-nhe-thay-the-cho-gpt-35-188240719134853572.chn