Hugging Face khẳng định các mô hình AI mới của mình là nhỏ nhất trong loạt mô hình cùng loại

Hugging Face giới thiệu mô hình AI nhỏ nhất là SmolVLM-256M và SmolVLM-500M, phù hợp với thiết bị hạn chế và xử lý dữ liệu lớn rẻ.

: Hugging Face đã phát hành hai mô hình AI nhỏ nhất là SmolVLM-256M và SmolVLM-500M. Chúng có khả năng mô tả hình ảnh, video và trả lời câu hỏi về PDF. Các mô hình này hoạt động hiệu quả trên thiết bị có RAM dưới 1GB và rất thích hợp cho xử lý dữ liệu lớn với chi phí thấp. Cả hai mô hình vượt trội hơn mô hình lớn Idefics 80B trên các bài kiểm tra AI2D.

Nhóm phát triển tại nền tảng AI Hugging Face đã giới thiệu các mô hình AI nhỏ nhất thị trường hiện nay là SmolVLM-256M và SmolVLM-500M. Những mô hình này được thiết kế để hoạt động tốt trên các thiết bị hạn chế về tài nguyên như laptop với RAM chưa tới 1GB, và rất phù hợp với lập trình viên cần xử lý lượng dữ liệu lớn với chi phí thấp.

Mô hình SmolVLM-256M và SmolVLM-500M có kích thước chỉ lần lượt là 256 triệu và 500 triệu tham số. Cả hai mô hình có khả năng thực hiện các tác vụ như mô tả hình ảnh hoặc video clip, trả lời câu hỏi về PDF và các yếu tố trong đó, bao gồm cả văn bản scan và biểu đồ. Để huấn luyện các mô hình này, nhóm Hugging Face đã sử dụng The Cauldron và Docmatix, cả hai đều được tạo ra bởi M4 team của họ.

Nhóm khẳng định rằng SmolVLM-256M và SmolVLM-500M có hiệu suất vượt trội hơn mô hình lớn hơn, Idefics 80B, trên các tiêu chuẩn như AI2D. Tuy nhiên, nghiên cứu gần đây cho thấy rằng mô hình nhỏ có thể gặp một số vấn đề khi thực hiện các nhiệm vụ phức tạp và điều này có thể do khả năng nhận diện các mẫu trong dữ liệu nhưng khó áp dụng kiến thức đó trong các ngữ cảnh mới.