OpenAI vừa giới thiệu phiên bản beta của Voice Engine – công cụ tạo giọng nói kỹ thuật số. Theo OpenAI, Voice Engine có khả năng tạo ra giọng nói có âm thanh tự nhiên chỉ từ mẫu âm thanh 15 giây.
Trong bài đăng trên blog, OpenAI cho biết họ đã thử nghiệm Voice Engine cho nhiều mục đích khác nhau, bao gồm đọc sách cho trẻ em, dịch ngôn ngữ và khôi phục giọng nói cho bệnh nhân ung thư.
OpenAI cho biết một nhóm nhỏ doanh nghiệp đang thử nghiệm Voice Engine. Công cụ này có khả năng tái tạo giọng nói của một người từ bản ghi âm dài 15 giây. Người dùng chỉ cần tải lên bản ghi âm và một đoạn văn bản của họ và Voice Engine sẽ đọc văn bản đó bằng giọng nói tổng hợp giống với giọng nói của người dùng.
Giọng nói tổng hợp này có thể đọc được nhiều ngôn ngữ khác nhau, ngoài ngôn ngữ mẹ đẻ của người dùng. Ví dụ: người nói tiếng Anh có thể sử dụng Voice Engine để tạo tiếng Tây Ban Nha, tiếng Pháp, tiếng Trung hoặc nhiều ngôn ngữ khác.
Tuy nhiên, một số người dùng mạng xã hội đã bày tỏ lo ngại về khả năng lạm dụng công nghệ này, chẳng hạn như tạo video deepfake hoặc hỗ trợ lừa đảo bằng cách mô phỏng giọng nói. nói chuyện bất hợp pháp.
OpenAI cũng thừa nhận lo ngại rằng công nghệ này có thể được sử dụng để đánh bại các hệ thống xác thực giọng nói được sử dụng để kiểm soát quyền truy cập vào tài khoản ngân hàng trực tuyến và các ứng dụng cá nhân khác.
“Đây là công nghệ nhạy cảm và việc triển khai cần phải được thực hiện đúng cách”Jeff Harris, Giám đốc sản phẩm của OpenAI, cho biết trong một cuộc phỏng vấn.
OpenAI đang nghiên cứu các phương pháp giữ bản quyền giọng nói tổng hợp hoặc thêm các biện pháp kiểm soát để ngăn chặn việc sử dụng trái phép giọng nói của các chính trị gia hoặc các nhân vật nổi tiếng khác.
Link nguồn: https://cafef.vn/openai-cong-bo-voice-engine-tao-ra-giong-noi-cua-bat-ky-ai-bat-cu-ngon-ngu-nao-chi-can-doan-am-thanh-15-giay-188240330152018794.chn