Tại hội thảo “Thiết kế chip bán dẫn: Cơ hội mới – Tương lai” diễn ra ngày 13/4/2024, ông Harsh Bharwani – Tổng giám đốc điều hành Tập đoàn Jetking (hơn 75 năm hoạt động trong lĩnh vực giáo dục và đào tạo công nghệ) – cho biết, hiện giá trị ngành chip toàn cầu là 500 tỷ USD, nhưng trong tương lai gần dự kiến sẽ tăng gần 4 lần lên 1.800 tỷ USD.
Gần đây, công ty khởi nghiệp Etched có trụ sở tại San Francisco đã gây chấn động thế giới công nghệ khi công bố chip AI mới mang tên Sohu có sức mạnh xử lý vượt trội, gấp 20 lần so với GPU H100 nổi tiếng của Nvidia.
Sohu là một dạng mạch tích hợp dành riêng cho ứng dụng (ASIC) được tối ưu hóa cho mô hình ngôn ngữ lớn (LLM). Theo Etched, Sohu thể hiện khả năng suy luận vượt trội hơn H100 trong các nhiệm vụ liên quan đến LLM. Ngay cả một hệ thống được trang bị 8 chip Sohu cũng có thể đạt hiệu suất tương đương với 160 GPU H100 kết hợp.
Startup Etched chỉ ra rằng các hệ thống tăng tốc AI ngày nay, bao gồm CPU và GPU, được thiết kế để tương thích với nhiều kiến trúc AI khác nhau, từ Mạng thần kinh chuyển đổi (CNN), thuật ngữ Mạng bộ nhớ ngắn (LSTM) cho đến mô hình không gian trạng thái. Vì vậy, cần phải phân bổ một lượng lớn tài nguyên tính toán cho khả năng lập trình, dẫn đến lãng phí hiệu suất đáng kể.
Theo ước tính của Etched, GPU H100 của Nvidia chỉ sử dụng 3,3% số bóng bán dẫn cho nhiệm vụ chính, trong khi 96,7% còn lại dành cho các nhiệm vụ phụ trợ. Điều này khá lãng phí, mặc dù vấn đề này là không thể tránh khỏi đối với các chip AI đa năng.
Etched đã giải quyết vấn đề này bằng cách tích hợp kiến trúc Transformer AI vào Sohu, cho phép phân bổ tối đa bóng bán dẫn cho các tác vụ điện toán AI. Kết quả là, thay vì tạo ra một con chip “đa năng” kém hiệu quả, Etched tập trung tối ưu hóa Sohu cho một loại mô hình AI cụ thể là Transformer, vốn là nền tảng của nhiều mô hình ngôn ngữ lớn như GPT, Sora, Gemini, Stable. Khuếch tán và Dall-E.
Tổng giám đốc điều hành của Etched, Gavin Uberti cho biết, “quyết định táo bạo khi đặt cược vào kiến trúc Transformer, nếu Transformer thất bại, công ty sẽ sụp đổ, nhưng nếu tiếp tục phát triển, công ty có tiềm năng trở thành một trong những công ty lớn nhất thế giới”.
Etched trước đó đã thông báo rằng họ đã huy động được 120 triệu đô la trong vòng gọi vốn series A. Số tiền này sẽ được sử dụng để tiếp tục phát triển bộ xử lý chuyên dụng của công ty. Etched đặt mục tiêu sản xuất bộ xử lý chuyên dụng để chạy mô hình AI tương tự như ChatGPT của OpenAI và Gemini của Google, được sử dụng rộng rãi hiện nay.
Các kỹ sư của công ty đang thiết kế chip để thực hiện chức năng tạo nội dung và phản hồi của điện toán AI. Đây là con chip đầu tiên được hãng thiết kế sẽ được tối ưu hóa để chạy mô hình biến áp AI.
Link nguồn: https://cafef.vn/con-dia-chan-duong-dua-1800-ty-usd-startup-my-tham-vong-chiem-ngoi-vuong-cua-nvidia-tuyen-bo-tao-ra-chip-ai-manh-gap-20-lan-h100-188240628151925055.chn