OpenAI ra mắt GPT-4o: cải thiện khả năng xử lý văn bản, âm thanh và hình ảnh

GPT 4o

(vfo.vn) OpenAI đã ra mắt GPT-4o (“o”: “omni”) – mô hình ngôn ngữ lớn đa phương thức (LLM) mới nhất của hãng có những cải tiến lớn trong việc tạo (xử lý) nội dung văn bản, giọng nói và hình ảnh để mang lại sự tương tác tự nhiên hơn giữa người dùng và AI.​

GPT-4o.jpg

OpenAI tuyên bố mô hình AI mới của họ có thể phản hồi với âm thanh đầu vào chỉ trong 232 mili giây (ms) và phản hồi văn bản nhanh hơn đáng kể trong các lời nhắc không phải tiếng Anh với sự hỗ trợ cho hơn 50 ngôn ngữ. OpenAI có thể chuyển đổi giọng nói giống robot hơn. GPT-4o cũng có thể phản hồi theo thời gian thực và quan sát môi trường xung quanh thông qua camera trên thiết bị của người dùng. GPT-4o có thể dịch hơn 50 ngôn ngữ theo thời gian thực. GPT-4o có thể hoạt động như một trợ lý trợ năng cho người khiếm thị.​

OpenAI đã giới thiệu các tính năng của GPT-4o trong buổi phát trực tiếp (livestream). Quý độc giả có thể xem tất cả bản demo các tính năng GPT-4o mới trên kênh YouTube của OpenAI, cụ thể video dưới đây.​

Bài viết này chỉ cung cấp thông tin ngắn gọn về GPT-4o. Nếu cần tham khảo thông tin toàn bộ bài tin tức “OpenAI đã ra mắt GPT-4o”, quý độc giả có thể truy cập trang web: openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free​

 

Mục nhập này đã được đăng trong Blog. Đánh dấu trang permalink.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Contact Me on Zalo
Tư Vấn Miễn Phí