Google ra mắt Google Translate vào năm 2006. Kể từ đó, công ty đã dần dần bổ sung hỗ trợ cho nhiều ngôn ngữ hơn vào nền tảng này. Vào tháng 5, công ty đã bổ sung hỗ trợ cho 24 ngôn ngữ mới, nâng tổng số ngôn ngữ được hỗ trợ lên 133.
Tuy nhiên, vào ngày 27 tháng 6, Google Translate đã có bản cập nhật lớn nhất từ trước đến nay. Gã khổng lồ công nghệ thông báo rằng công cụ này đang có “bản mở rộng lớn nhất từ trước đến nay”, với 110 ngôn ngữ mới, nâng tổng số ngôn ngữ được hỗ trợ lên 243.
Để so sánh, Apple Translate hỗ trợ 20 ngôn ngữ và Microsoft Translator hỗ trợ 135 ngôn ngữ. Hiện tại, Google Translate đang chiếm ưu thế và bỏ xa hai đối thủ cạnh tranh.
Theo Google, họ đã đạt được thành tích này với sự trợ giúp của mô hình ngôn ngữ lớn PaLM 2. Một số ngôn ngữ mới được hỗ trợ bao gồm Afar, Quảng Đông, Manx, NKo, Punjabi, Tamazight và Tok Pisin.
Công ty cho biết 110 ngôn ngữ mới được bổ sung “đại diện cho hơn 614 triệu người nói, mở rộng khả năng dịch thuật cho khoảng 8% dân số thế giới”.
Ngoài ra, “Một số trong số này là ngôn ngữ chính trên thế giới với hơn 100 triệu người nói. Những ngôn ngữ khác được nói bởi các cộng đồng bản địa nhỏ và một số ngôn ngữ hầu như không có người bản xứ nhưng đang được hồi sinh.”
Một phần tư trong số 110 ngôn ngữ mới đến từ Châu Phi, khiến đây trở thành bản cập nhật lớn nhất của Google Dịch dành cho cư dân của lục địa này. Với 243 ngôn ngữ, các cặp dịch của Google Dịch hiện có tổng cộng 29.403.
Mẫu PaLM 2 có điểm gì đặc biệt?
PaLM là viết tắt của Pathways Language Model, sử dụng kiến trúc Pathways AI của Google để đào tạo các mô hình học máy thực hiện nhiều tác vụ khác nhau. Đây là một phần quan trọng trong tầm nhìn của Google nhằm đạt được AGI – trí tuệ nhân tạo tổng quát – mục tiêu mà AI sẽ có thể thực hiện mọi tác vụ suy nghĩ mà con người có thể làm.
Google trước đây đã tuyên bố rằng kiến trúc Pathways sẽ mở đường cho AI đa phương thức vượt ra ngoài văn bản và Gemini là một LLM khác đã đạt được mục tiêu này. Trong một bài đăng trên blog, công ty cho biết:
Pathways có thể kích hoạt các mô hình đa phương thức và hiểu biết về thị giác, thính giác và ngôn ngữ cùng một lúc. Vì vậy, cho dù mô hình đang xử lý từ “leopard”, âm thanh của ai đó nói “leopard” hay video về một con báo đang chạy, thì cùng một phản ứng được kích hoạt bên trong: khái niệm về một con báo. Kết quả là một mô hình sâu hơn ít bị lỗi và thiên vị hơn.
Không giống như mô hình LaMDA mà nó thay thế, PaLM 2 đã được đào tạo bằng hơn 100 ngôn ngữ và có kiến thức chuyên môn tốt hơn trong các lĩnh vực như mã hóa. Nó cũng có khả năng suy luận logic và toán học tốt hơn nhiều.
Để hỗ trợ Google Translate, PaLM 2 được đào tạo trên khối lượng lớn văn bản đa ngôn ngữ song song. Mô hình có thể học và dịch các ngôn ngữ nhanh hơn nhờ logic của nó, đặc biệt là các ngôn ngữ có liên quan chặt chẽ, chẳng hạn như các ngôn ngữ gần với tiếng Hindi.
Google đặt mục tiêu hỗ trợ 1.000 ngôn ngữ được sử dụng rộng rãi nhất trên toàn thế giới, nhằm giảm rào cản ngôn ngữ và thúc đẩy kết nối cộng đồng toàn cầu.
Link nguồn: https://cafef.vn/cong-nghe-nao-giup-google-dich-ho-tro-toi-gan-250-ngon-ngu-18824070215351292.chn