OpenAI đã tổ chức sự kiện Spring Update trực tiếp vào ngày 13/5/2024, mang đến những cập nhật “kỳ diệu” cho ChatGPT, bao gồm mô hình GPT-4o mới cho cả phiên bản miễn phí và trả phí, một trợ lý giọng nói tự nhiên và cảm xúc cùng với khả năng thị giác. Mặc dù vẫn còn nhiều điều chưa được tiết lộ như mô hình GPT-5 thế hệ tiếp theo hay việc phát hành mô hình AI video Sora và Voice Engine, nhưng những gì đã được giới thiệu cũng đủ để khiến cộng đồng đam mê trí tuệ nhân tạo phấn khích.
GPT-4o - Mô hình đa phương thức mới của ChatGPT
Điểm nhấn của sự kiện chính là việc ra mắt GPT-4o, một mô hình đa phương thức hoàn toàn mới, có khả năng tiếp nhận và xử lý giọng nói, hình ảnh và video, đồng thời đưa ra phản hồi bằng giọng nói hoặc văn bản. Mô hình này sẽ cung cấp năng lượng cho cả phiên bản miễn phí và trả phí của ChatGPT, mang lại trải nghiệm tương tác tự nhiên và hiệu quả hơn cho người dùng.
GPT-4o giúp ChatGPT học hỏi và ghi nhớ thông tin từ các cuộc trò chuyện trước đó, giúp cuộc trao đổi trở nên thông minh và hiệu quả hơn, tốc độ phản hồi của ChatGPT – 4o cũng nhanh hơn ChatGPT 3.5
Xem chi tiết video demo tại: https://openai.com/index/hello-gpt-4o/
Trợ lý giọng nói cảm xúc và thông minh
Một trong những nâng cấp ấn tượng nhất của GPT-4o là khả năng xử lý giọng nói trực tiếp (live speech), cho phép trợ lý ảo lắng nghe và phản hồi một cách tự nhiên, thậm chí có thể nhận biết cảm xúc của người dùng. Giọng nói của trợ lý cũng có thể thay đổi linh hoạt, từ giọng máy móc, giọng hát cho đến giọng kịch tính, mở ra tiềm năng ứng dụng trong nhiều lĩnh vực như chăm sóc khách hàng, hỗ trợ kỹ thuật và giải trí. Sam Altman, CEO của OpenAI, chia sẻ rằng chế độ giọng nói (và video) mới là giao diện máy tính tốt nhất mà ông từng sử dụng, giống như AI trong phim, và ông vẫn hơi ngạc nhiên khi nó trở thành hiện thực.
(Nguồn: OpenAI)
"Đôi mắt thần" của ChatGPT với khả năng thị giác và phân tích cảm xúc
Giờ đây, ChatGPT có thể “nhìn thấy” thế giới thông qua camera của điện thoại, phân tích hình ảnh, biểu đồ và thậm chí phát hiện cảm xúc của người dùng thông qua khuôn mặt. Khả năng thị giác này cũng cho phép ChatGPT hỗ trợ người dùng giải quyết các bài toán, phân tích mã code và đưa ra phản hồi dựa trên những gì nó quan sát được, mở ra nhiều tiềm năng ứng dụng mới trong giáo dục, lập trình và phân tích dữ liệu.
(Nguồn: OpenAI)
ChatGPT Voice - Công cụ dịch thuật trực tiếp đa ngôn ngữ
Với khả năng chuyển đổi giữa các ngôn ngữ một cách nhanh chóng và chính xác, ChatGPT Voice hứa hẹn sẽ trở thành một công cụ dịch thuật trực tiếp đắc lực cho những người thường xuyên đi du lịch hoặc làm việc trong môi trường đa ngôn ngữ. Tính năng này sẽ giúp xóa bỏ rào cản ngôn ngữ, thúc đẩy giao tiếp và hợp tác quốc tế.
(Nguồn: OpenAI)
Người dùng phiên bản miễn phí được trải nghiệm nhiều tính năng hơn
OpenAI đã quyết định mang những tính năng cao cấp trước đây chỉ dành cho phiên bản trả phí đến với người dùng miễn phí, bao gồm việc truy cập vào chatbot tùy chỉnh (GPTs) và sử dụng dữ liệu, mã code cũng như công cụ thị giác mà không bị giới hạn. Sam Altman tự hào chia sẻ rằng một phần quan trọng trong sứ mệnh của OpenAI là đưa các công cụ AI mạnh mẽ vào tay mọi người một cách miễn phí hoặc với mức giá tuyệt vời. Điều này sẽ thúc đẩy sự sáng tạo và đổi mới, cho phép cá nhân và doanh nghiệp tận dụng sức mạnh của trí tuệ nhân tạo để tạo ra các trợ lý ảo phù hợp với nhu cầu riêng.
ChatGPT Desktop - Trải nghiệm ChatGPT trên máy tính với giao diện mới
Ứng dụng ChatGPT dành cho máy tính (ChatGPT Desktop) cũng đã được giới thiệu với giao diện được làm mới và tích hợp chế độ Voice, trước đây chỉ có trên điện thoại di động. Ứng dụng này sẽ giúp người dùng dễ dàng truy cập và sử dụng ChatGPT mọi lúc, mọi nơi, mang lại trải nghiệm liền mạch và tiện lợi hơn.
Tuy nhiên với phiên bản sử dụng miễn phí thì vẫn còn hạn chế một số tính năng và sẽ được OpenAI tích hợp vào ChatGPT trong một vài tháng tới. Người dùng trả phí sẽ có quyền truy cập vào số lượng tin nhắn lớn hơn với mô hình GPT-4o mới nhất.
Dự kiến tương lai đầy hứa hẹn với những bất ngờ từ OpenAI
Sự kiện Spring Update của OpenAI đánh dấu một bước tiến quan trọng trong việc đưa trí tuệ nhân tạo đến gần hơn với đại chúng, mở ra nhiều cơ hội và tiềm năng ứng dụng mới trong tương lai. Sam Altman chia sẻ rằng ban đầu, OpenAI nghĩ rằng họ sẽ tạo ra AI và sử dụng nó để mang lại đủ loại lợi ích cho thế giới. Tuy nhiên, giờ đây có vẻ như họ sẽ tạo ra AI và sau đó mọi người sẽ sử dụng nó để tạo ra đủ loại điều tuyệt vời mà tất cả chúng ta đều được hưởng lợi.
OpenAI cho biết GPT-4o sẽ được tích hợp vào ChatGPT trong những tháng tới. Người dùng miễn phí sẽ có một số lượng tương tác giới hạn với mô hình GPT-4o mới trước khi ChatGPT tự động chuyển về sử dụng mô hình GPT-3.5 cũ. Trong khi đó, người dùng trả phí sẽ có quyền truy cập vào số lượng tin nhắn lớn hơn với mô hình GPT-4o mới nhất.
Sam Altman cũng hé lộ về tương lai thú vị khi OpenAI thêm các tính năng cá nhân hóa (tùy chọn), quyền truy cập vào thông tin của người dùng, khả năng thực hiện các hành động thay mặt người dùng và hơn thế nữa, giúp chúng ta có thể sử dụng máy tính để làm nhiều việc hơn bao giờ hết.
Xem thêm:
-
- Demo ra mắt tính năng ChatGPT 4o của OpenAI
- Tích hợp ChatGPT vào các giải pháp Công nghệ Digitech Solutions
- Tri thức Doanh nghiệp là gì? Ứng dụng mô hình DIKW xây dựng Tri thức Doanh nghiệp
- Nhận diện khuôn mặt bằng AI (Face Recognition)
- Nhận diện và xử lý hình ảnh bằng AI (Face Detection & Image Processing)
- Đếm số người bằng AI (People Counting)
- Nhận diện đối tượng bằng AI (Object Detection)
- Đếm sản phẩm bằng AI (Product Counting)
- Nhận diện ký tự, xử lý hình ảnh văn bản bằng AI
- AI trong phân tích & dự đoán
- Ứng dụng mô hình DIKW xây dựng tri thức Doanh nghiệp cho ChatbotAI
HÃY ĐÁNH GIÁ 5 SAO NẾU BẠN THẤY BÀI ĐỌC HỮU ÍCH
Xếp hạng trung bìnhh 0 / 5. Phiếu bầu 0
Author