Gemma 3 của Google là một AI mã nguồn mở, GPU đơn với cửa sổ ngữ cảnh 128K. Gemma 3 được tối ưu hóa để chạy trên hầu hết mọi thứ, từ GPU mạnh mẽ đến điện thoại thông minh.
Gemma 3 là gì?
Gemma 3 là mô hình ngôn ngữ lớn (LLM) mã nguồn mở mới nhất của Google, được thiết kế để hiểu và tạo văn bản giống con người. Nó phân tích văn bản, hình ảnh và video ngắn, giúp nó linh hoạt cho nhiều ứng dụng khác nhau. Đáng chú ý, Gemma 3 được thiết kế để chạy hiệu quả trên một GPU duy nhất, cho phép các nhà phát triển triển khai các khả năng AI tiên tiến mà không cần tài nguyên phần cứng lớn.
Hầu hết các mô hình AI mới đều có quy mô lớn—nhiều tham số hơn, nhiều mã thông báo hơn, nhiều thứ hơn. Mô hình AI mới nhất của Google có một số con số lớn, nhưng nó cũng được điều chỉnh để đạt hiệu quả. Google cho biết mô hình mã nguồn mở Gemma 3 là mô hình tốt nhất trên thế giới để chạy trên một GPU hoặc bộ tăng tốc AI. Mô hình Gemma mới nhất chủ yếu nhắm đến các nhà phát triển cần tạo AI để chạy trong nhiều môi trường khác nhau, có thể là trung tâm dữ liệu hoặc điện thoại thông minh. Và bạn có thể mày mò Gemma 3 ngay bây giờ.
Google tuyên bố Gemma 3 sẽ có thể giải quyết các nhiệm vụ đầy thách thức hơn so với các mô hình Google mở cũ hơn
Google tuyên bố Gemma 3 sẽ có thể giải quyết các nhiệm vụ đầy thách thức hơn so với các mô hình Google mở cũ hơn. Cửa sổ ngữ cảnh, thước đo lượng dữ liệu bạn có thể nhập, đã được mở rộng từ 8.192 mã thông báo trong các mô hình Gemma trước đó lên 128.000. Gemma 3, dựa trên nền tảng Gemini 2.0 độc quyền, cũng là một mô hình đa phương thức có khả năng xử lý văn bản, hình ảnh có độ phân giải cao và thậm chí cả video. Google cũng có một giải pháp mới cho an toàn hình ảnh có tên là ShieldGemma 2, có thể tích hợp với Gemma để giúp chặn các hình ảnh không mong muốn trong ba danh mục nội dung: nguy hiểm, khiêu dâm hoặc bạo lực.
Hầu hết các mô hình AI phổ biến mà bạn từng nghe đến đều chạy trên các bộ sưu tập máy chủ trong một trung tâm dữ liệu, chứa đầy sức mạnh tính toán AI. Nhiều mô hình trong số đó quá lớn để chạy trên loại phần cứng bạn có ở nhà hoặc tại văn phòng. Việc phát hành các mô hình Gemma đầu tiên vào năm ngoái đã mang đến cho các nhà phát triển và những người đam mê một tùy chọn phần cứng thấp khác để cạnh tranh với các mô hình như Meta Llama3. Gần đây đã có một động lực thúc đẩy hiệu quả trong AI, với các mô hình như DeepSeek R1 đang thu hút được sự chú ý dựa trên chi phí tính toán thấp hơn.
Google cho biết Gemma 3 là “mô hình máy gia tốc đơn tốt nhất thế giới”. Tuy nhiên, không phải tất cả các phiên bản của mô hình đều lý tưởng để xử lý cục bộ. Nó có nhiều kích cỡ khác nhau, từ mô hình nhỏ chỉ có văn bản với 1 tỷ tham số có thể chạy trên hầu hết mọi thứ cho đến phiên bản đồ sộ với 27 tỷ tham số ngốn hết RAM. Nó cũng có các phiên bản 4 tỷ và 12 tỷ. Ở chế độ có độ chính xác thấp hơn, mô hình Gemma 3 nhỏ nhất có thể chiếm ít hơn một gigabyte bộ nhớ, nhưng các phiên bản siêu lớn cần 20GB–30GB ngay cả ở độ chính xác 4 bit.
Nhưng Gemma 3 tốt đến mức nào?
Google đã cung cấp một số dữ liệu dường như cho thấy những cải tiến đáng kể so với hầu hết các mô hình khác. Sử dụng số liệu Elo, đo lường sở thích của người dùng, Gemma 3 27B vượt qua Gemma 2, Meta Llama3, OpenAI o3-mini và các mô hình khác về khả năng trò chuyện. Nó không hoàn toàn bắt kịp DeepSeek R1 trong bài kiểm tra tương đối chủ quan này. Tuy nhiên, nó chạy trên một bộ tăng tốc Nvidia H100 duy nhất ở đây, trong khi hầu hết các mô hình khác cần một nhóm GPU. Google cho biết Gemma 3 cũng có khả năng hơn khi nói đến toán học, mã hóa và làm theo các hướng dẫn phức tạp. Tuy nhiên, nó không cung cấp bất kỳ con số nào để chứng minh điều đó.
Google có mô hình Gemma mới nhất có sẵn trực tuyến trong Google AI Studio. Bạn cũng có thể tinh chỉnh quá trình đào tạo của mô hình bằng các công cụ như Google Colab và Vertex AI—hoặc chỉ cần sử dụng GPU của riêng bạn. Các mô hình Gemma 3 mới có tính mở, nhưng liệu bạn có muốn gọi đó là mã nguồn mở hay không vẫn còn là vấn đề gây tranh cãi.
Bạn có thể tải xuống toàn bộ mô hình miễn phí từ các kho lưu trữ như Kagle hoặc Hugging Face. Tuy nhiên, thỏa thuận cấp phép của Google giới hạn những gì bạn có thể làm với chúng. Bất kể thế nào, Google sẽ không biết bạn đang khám phá những gì trên phần cứng của riêng mình, đó là lợi thế của việc có các mô hình cục bộ hiệu quả hơn như Gemma 3.
Bất kể bạn muốn làm gì, đều có một mô hình Gemma phù hợp với phần cứng của bạn. Bạn cần cảm hứng? Google có một cộng đồng “Gemmaverse” mới để làm nổi bật các ứng dụng được xây dựng bằng mô hình Gemma.