Ai là người có công trong việc tạo ra thuật toán mà cả Google và ChatGPT đều dựa vào để phát triển?
Anh Lê Viết Quốc sinh năm 1982 tại một ngôi làng nhỏ ở Hương Thủy (tỉnh Thừa Thiên-Huế), nơi trước đây Quốc sinh sống không có điện, nhưng anh vẫn thường đến thư viện gần nhà để nghiên cứu về sáng chế. qua những trang sách và ôm ấp ước mơ một ngày sẽ có những phát minh của riêng mình.
Sau khi tốt nghiệp Trường chuyên Quốc Học Huế, anh Quốc tiếp tục theo học tại Đại học Quốc gia Australia (Úc) rồi làm nghiên cứu sinh tại Đại học Stanford (Mỹ) về trí tuệ nhân tạo.
Năm 2011, Quốc đồng sáng lập Google Brain, cùng với cố vấn Tiến sĩ Andrew Ng, nghiên cứu sinh tiến sĩ Google Jeff Dean và nhà nghiên cứu Google Greg Corrado. Mục tiêu là khám phá Deep Learning trên cơ sở khối lượng dữ liệu khổng lồ của Google. Trước đó, Quốc đã thực hiện một số nghiên cứu tại Đại học Stanford về Học sâu không giám sát.
Deep Learning là một thuật toán dựa trên một số ý tưởng từ bộ não để thu nhận nhiều lớp biểu diễn, cả cụ thể và trừu tượng, từ đó làm rõ ý nghĩa của các loại dữ liệu. Deep Learning có thể giúp giải quyết hàng loạt vấn đề như giáo dục, biến đổi khí hậu, v.v.
Ví dụ, sử dụng cảm biến từ xa, dữ liệu môi trường trên toàn thế giới sẽ được theo dõi và ghi lại. Hiện tại khối lượng dữ liệu đó phần lớn chưa được xử lý và Deep Learning có thể được áp dụng để hiểu các chuỗi và chỉ ra các giải pháp.
Sau khi tốt nghiệp năm 2013, Quốc chính thức gia nhập Google với vị trí nghiên cứu viên. Anh sớm đạt được những bước đột phá ấn tượng trong lĩnh vực dịch máy (Machine Translation), một trong những lĩnh vực nghiên cứu tích cực nhất trong cộng đồng máy học.
Để đạt được điều đó, Quốc phải vượt xa các phương pháp học sâu đã hoạt động với hình ảnh và từ có thể được phân tích với đầu vào có kích thước cố định.
Năm 2014, Quốc đề xuất giải trình tự chuỗi (Seq2seq) được nghiên cứu cùng với các nhà nghiên cứu của Google là Ilya Sutskever và Oriol Vinyals. Đó là một khung – một thư viện các khung mã giải mã nhằm đào tạo các mô hình để chuyển đổi các chuỗi từ miền này sang miền khác, chẳng hạn như chuyển đổi câu sang các ngôn ngữ khác nhau.
Seq2seq learning yêu cầu ít lựa chọn thiết kế kỹ thuật hơn và cho phép hệ thống dịch thuật của Google hoạt động hiệu quả và chính xác trên các tệp dữ liệu khổng lồ. Nó chủ yếu được sử dụng cho các hệ thống dịch máy và đã được chứng minh là có thể áp dụng trong nhiều lĩnh vực hơn, bao gồm tóm tắt văn bản, hội thoại trí tuệ nhân tạo và trả lời câu hỏi.
Vì sao CEO Nguyễn Tử Quảng nói thành công của ChatGPT là nhờ Lê Viết Quốc?
Theo bài đăng mới nhất của CEO Nguyễn Tử Quảng, ông cho biết chính thuật toán seq2seq của Quốc đã giúp Google tạo ra Transformer. Thuật toán này hiện đang được sử dụng bởi cả Google và ChatGPT.
Transformer là một thuật toán do Google Brain, đơn vị nghiên cứu chuyên sâu về AI của Google, phát minh vào tháng 8/2017.
Thuật toán Transformer mang tính đột phá về đào tạo AI ngôn ngữ. Trước thuật toán này, muốn dạy AI người ta phải tạo một tập dữ liệu huấn luyện theo cặp câu hỏi-câu trả lời (dữ liệu gán nhãn). AI sẽ chỉ ghi nhớ một cặp câu có sẵn mà không hiểu nghĩa của câu đó, có một sự khác biệt rất lớn giữa học vẹt và hiểu.
Trích từ ấn phẩm Máy biến áp của Google: “Với máy biến áp, máy tính có thể nhìn thấy các mẫu giống như con người nhìn thấy”.
Google đã hào phóng cung cấp tài liệu chi tiết về thuật toán Transformer cho tất cả mọi người. Đồng thời, nó cung cấp quyền nguồn mở cho thuật toán này.
Kể từ đó, toàn bộ cộng đồng khoa học AI đã được hưởng lợi từ phát minh của Google. Trong số đó có OpenAI, một công ty được thành lập vào năm 2015 và không có bất kỳ thành tựu nổi bật nào cho đến sau năm 2017.
Sau khi Google công bố Transformer, chỉ sau vài tháng, những AI ngôn ngữ đầu tiên dựa trên thuật toán mới này đã ra đời. Vào tháng 1 năm 2018, OpenAI đã phát hành AI đầu tiên dựa trên Transformer, GPT-1, họ đã áp dụng rất nhanh, nhanh hơn cả chính Google.
GPT là viết tắt của Generative Pre-training Transformer có nghĩa là “Chương trình tạo văn bản được đào tạo bởi Transformer”.
ChatGPT này được tạo ra với mục đích chính là “Tạo văn bản”. Cụ thể, bạn sẽ chơi trò chơi ghép chữ với AI, bạn viết một câu, chatbot sẽ đọc câu đó rồi dựa trên kiến thức đã lưu trong bộ nhớ, “sinh ra từ” theo câu bạn viết.
Link nguồn: https://cafef.vn/chan-dung-nguoi-viet-la-cha-de-cua-thuat-toan-ca-google-va-chatgpt-deu-dua-vao-phat-trien-20230209155525185.chn