Khoa học & Công nghệ

ChatGPT đã có thể nhìn, nghe, nói và duyệt web

Công ty OpenAI vừa công bố bản cập nhật mới cho công cụ trí tuệ nhân tạo ChatGPT với nâng cấp mới nhất đáng chú ý là tính năng duyệt web, phá bỏ giới hạn dữ liệu trước đây là trước tháng 9 năm 2021. Cũng hồi đầu tuần này, ChatGPT đã được công bố có thêm tính năng trò chuyện bằng giọng nói, và trao đổi với người dùng qua hình ảnh.

Tính năng duyệt web trước tiên chỉ dành cho người dùng tài khoản Plus và Enterprise, và sẽ sớm mở rộng cho mọi người dùng. Nó được kích hoạt bằng cách lựa chọn Browse with Bing dưới mục GPT-4. Tuy nhiên, OpenAI cũng cho biết tính năng duyệt web cho phép các trang web quản lý việc tương tác với ChatGPT.

Với tính năng trò chuyện bằng giọng nói, người dùng có thể chụp một tấm ảnh bất kỳ, từ một phong cảnh đẹp cho đến các kỳ quan, để trò chuyện trực tiếp với ChatGPT về điều thú vị của địa điểm đó. Bên cạnh đó, người dùng cũng có thể chụp ảnh chiếc tủ lạnh và tủ bếp của họ để hỏi ChatGPT nên nấu món gì cho bữa ăn tối.

Giải thích về công nghệ của các tính năng mới, OpenAI cho biết khả năng nói chuyện mới được hỗ trợ bởi một mô hình chuyển đổi chữ văn bản thành giọng nói mới, cho phép tạo ra giọng nói như người thật, từ chữ văn bản và một vài giây giọng nói mẫu. OpenAI cũng sử dụng hệ thống nhận dạng giọng nói nguồn mở Whisper của họ để chuyển đổi câu nói thành chữ văn bản.

Trong khi đó, khả năng “hiểu” hình ảnh là nhờ vào mô hình đa phương thức GPT-3.5 và GPT-4. Những mô hình này sử dụng các kỹ năng lý luận ngôn ngữ của chúng cho một loạt hình ảnh, bao gồm ảnh chụp, ảnh chụp màn hình, và tài liệu chứa cả chữ và hình ảnh.

Tính năng giọng nói và hình ảnh của ChatGPT có thể bị lợi dụng cho các mục đích xấu không?

“Mục tiêu của OpenAI là xây dựng trí tuệ nhân tạo tổng thể có tính an toàn và lợi ích. Chúng tôi tin tưởng việc tung ra các công cụ mới theo cách lần lượt, sẽ cho phép chúng tôi cải tiến và giảm thiểu nguy cơ theo thời gian, đồng thời chuẩn bị cung cấp cho mọi người dùng các hệ thống mạnh mẽ hơn trong tương lai. Chiến lược này càng quan trọng hơn với các mô hình cao cấp sử dụng giọng nói và hình ảnh,” công ty OpenAI khẳng định.

Các tính năng mới sẽ “mở cửa” cho nhiều ứng dụng sáng tạo mới, nhưng OpenAI cũng thừa nhận những tính năng này sẽ mang đến các mối đe dọa mới, như nguy cơ các phần tử xấu có thể mạo danh các nhân vật nổi tiếng, hay lợi dụng để lừa đảo. Đó là lý do mà OpenAI chỉ sử dụng công nghệ giọng nói mới cho một tính năng duy nhất là trò chuyện bằng giọng nói.

Về tính năng hình ảnh, OpenAI cũng sử dụng các giải pháp kỹ thuật để giới hạn khả năng của ChatGPT trong việc phân tích và bình luận trực tiếp về một người nào đó, do ChatGPT không phải lúc nào cũng chính xác, và những hệ thống này nên tôn trọng sự riêng tư của người dùng.

Bùng nổ cuộc đua Trí tuệ Nhân tạo Tạo sinh

Việc công bố tính năng mới cho ChatGPT rơi vào thời điểm không thể thích hợp hơn. Lĩnh vực Trí tuệ Nhân tạo Tạo sinh đang đón nhận sự “bùng nổ” về các khoản đầu tư trong mấy ngày gần đây.

Amazon vừa công bố đầu tư 4 tỉ USD vào Anthropic, để tăng cường sức cạnh tranh với OpenAI. Trong khi đó, Google cũng vừa ra mắt một số tính năng mới cho máy tìm kiếm trí tuệ nhân tạo Bard.

LÊ PHI (Theo Asiaone, Techwire)

Chia sẻ bài viết

Từ khóa

ChatGPT OpenAI

BÌNH LUẬN