Hôm nay, OpenAI chính thức giới thiệu GPT-4.5, phiên bản AI mới nhất của họ. Đây là một bản nâng cấp từ GPT-4o, với khả năng xử lý mạnh mẽ hơn, kiến thức mở rộng hơn và ngôn ngữ tự nhiên hơn. Dù không phải là một bước nhảy vọt mang tính cách mạng, GPT-4.5 vẫn là mô hình lớn nhất mà OpenAI từng tạo ra, giúp cải thiện đáng kể khả năng viết lách, tư vấn và giải quyết vấn đề.
GPT-4.5 có gì mới so với GPT-4o?
Các bài kiểm tra benchmark cho thấy GPT-4.5 có hiệu suất cao hơn so với GPT-4o, nhưng không quá cách biệt. Một số điểm đáng chú ý:
- Khả năng trả lời câu hỏi chính xác hơn: Trên bài kiểm tra SimpleQA, GPT-4.5 đạt 62,5%, cao hơn nhiều so với 38,2% của GPT-4o.
- Giảm tỷ lệ “ảo giác” (hallucination): GPT-4.5 ít mắc lỗi bịa đặt thông tin hơn các phiên bản trước, giúp nội dung đáng tin cậy hơn.
- Hiệu suất lập trình tốt hơn: Trên bài kiểm tra SWE-bench, GPT-4.5 đạt 38%, cao hơn 2-7% so với GPT-4o.
GPT-4.5 và khả năng hỗ trợ lập trình viên
OpenAI đã phát triển một bài kiểm tra mới mang tên SWE-Lancer, giúp đo lường hiệu quả của AI trong các công việc kỹ thuật phần mềm thực tế, bao gồm phát triển tính năng, thiết kế và sửa lỗi.
GPT-4.5 có thể giải quyết 20% nhiệm vụ của kỹ sư phần mềm cấp cơ bản (IC SWE).
Đối với các nhiệm vụ quản lý kỹ sư phần mềm (SWE Manager), mô hình này đạt 44%, một cải thiện nhẹ so với phiên bản trước.
Điều này cho thấy GPT-4.5 đã có những tiến bộ trong việc hỗ trợ lập trình, nhưng vẫn chưa đủ để thay thế con người trong các công việc phức tạp.
Độ an toàn của GPT-4.5
Nhóm Preparedness Team của OpenAI đã đánh giá GPT-4.5 ở mức rủi ro trung bình. Nó có mức độ tự chủ thấp, ít tiềm ẩn nguy cơ mất kiểm soát, đồng thời có độ an toàn cao về bảo mật thông tin.
GPT-4.5 đã có mặt trên ChatGPT và API
Hiện tại, GPT-4.5 đã có sẵn cho người dùng ChatGPT Pro trên web, ứng dụng di động và máy tính. Các tính năng hỗ trợ bao gồm:
- Tìm kiếm thông tin nhanh và chính xác hơn
- Phân tích tệp tin, hình ảnh
- Tích hợp Canvas để làm việc với nội dung trực quan
Trong thời gian tới, OpenAI sẽ bổ sung chế độ giọng nói (Voice Mode), video và chia sẻ màn hình cho mô hình này.
Tuần sau, GPT-4.5 sẽ chính thức có mặt trên ChatGPT Plus và Teams, đồng thời các nhà phát triển cũng có thể sử dụng thông qua API với các tính năng quan trọng như Function Calling, Structured Outputs, Streaming và System Messages.
GPT-4.5 có đáng để mong đợi?
Dù không phải là một bước nhảy vọt đột phá, GPT-4.5 vẫn là một bản nâng cấp đáng giá với nhiều cải tiến về độ chính xác, hiệu suất và khả năng sử dụng. Với khả năng hỗ trợ trên nhiều nền tảng, đây sẽ là một công cụ mạnh mẽ cho cả người dùng cá nhân và doanh nghiệp.
Anh em đã sẵn sàng trải nghiệm GPT-4.5 chưa? Hãy chia sẻ cảm nhận của mình nhé!