Meta ra model mã nguồn mở Llama 3.1: 405 tỷ tham số, mạnh hơn cả GPT-4o, cho phép tự huấn luyện thêm

Jul 30, 2024

Meta đã chính thức phát hành Llama 3.1 – mô hình AI mã nguồn mở lớn nhất hiện tại với hiệu suất được tuyên bố là mạnh hơn cả GPT-4o và Claude 3.5 Sonnet của Anthropic trong một số bài kiểm tra benchmark.

Bên cạnh cải thiện khả năng, Llama 3.1 cũng hỗ trợ thêm nhiều quốc gia và ngôn ngữ hơn, đồng thời bổ sung rheme tính năng tạo ra hình ảnh dựa trên chân dung của người dùng. CEO Mark Zuckerberg cho rằng đến cuối năm nay, model này của Meta sẽ vượt qua ChatGPT để trở thành model AI được sử dụng phổ biến nhất thế giới.

Cách đây vài tháng, Meta đã ra mắt model Llama 3 và giờ đây, Llama 3.1 không chỉ có số lượng tham số mà cả hiệu suất cũng vượt trội hơn nhiều lần. Cụ thể, Llama 3.1 có tận 405 tỷ tham số và được huấn luyện bằng 16000 chiếc GPU H100 của Nvidia. Mặc dù Meta không công bố chính xác chi phí huấn luyện Llama 3.1 nhưng chỉ tính riêng tiền GPU thì có thể hình dung được con số đó đã lên tới hàng trăm triệu đô la.

Lý giải cho việc bỏ tiền ra đầu tư mà vẫn phát hành dưới dạng mã nguồn mở, Zuckerberg cho rằng các model AI mã nguồn mở sẽ phát triển với tốc độ nhanh hơn và sẽ vượt qua các model private. Anh ví việc này tương tự như Linux cũng mã nguồn mở nhưng đã trở thành nền tảng vận hành hầu hết các chiếc điện thoại, máy chủ hay nhiều thiết bị công nghệ khác.

Meta cho biết để huấn luyện Llama 3.1, họ đã làm việc với hàng chục công ty khác, bao gồm cả Microsoft, Amazon, Google, Nvidia, Databricks,… để giúp các lập trình viên phát triển phiên bản của riêng họ. Meta tuyên bố rằng Llama 3.1 có chi phí chỉ bằng một nửa so với GPT 4o của OpenAI. Ngoài ra, Meta cũng phát hành Weight (trọng số) để những công ty khác có thể tự huấn luyện bằng dữ liệu của họ và fine tune model theo cách mà họ muốn.

Meta không cho biết họ dùng bao nhiêu dữ liệu để huấn luyện Llama 3.1, cũng không nói rằng nguồn dữ liệu ở đâu. Có luồng ý kiến nói rằng thông tin này là bí mật thương mại nhưng cũng có ý kiến nói rằng đây là một chiến thuật để né các các vấn đề về vi phạm bản quyền. Meta chỉ cho biết là họ sử dụng dữ liệu tổng hợp hoặc các data được tạo ra bởi các model thay vì con người.

Khi được hỏi về vấn đề dữ liệu huấn luyện đang cạn dần, Meta cho rằng điều đó sẽ đến nhưng vẫn còn xa mới đến đó. Ngoài ra, Meta cũng cho biết với Llama 3.1, họ đã lần đầu tiên sử đội ngũ test chuyên dụng để kiểm tra các vấn đề tiềm ẩn liên quan tới an ninh mạng và các vấn đề sinh hóa.

Kết quả cuối cùng là model Llama 3.1 với 405 tỷ tham số, cao hơn rất rất nhiều lần so với con số 70 tỷ và 8 tỷ tham số ở các phiên bản trước đây. Giám đốc mảng gen AI của Meta nói rằng Llama 3.1 sẽ được các nhà phát triển sử dụng rộng rãi như “một giáo viên để dạy cho các model nhỏ hơn mà họ deploy với chi phí cực kỳ hiệu quả.”

Trong một thí dụ, Meta nói rằng Llama 3.1 có khả năng tích hợp với các API search engine để “lấy thông tin từ internet dựa trên một truy vấn phức tạp và gọi nhiều tools liên tiếp để hoàn thành task được giao”. Thí dụ người ta có thể yêu cầu model trả về số nhà được bán trên khắp nước Mỹ trong 5 năm gần nhất, nó sẽ truy xuất kết quả tìm kiếm, tạo ra một đoạn mã Python và vẽ đồ thị để biểu diễn các số liệu đó.

Sử dụng Llama 3.1, Meta đã tạo ra một chatbot AI tương tự như con ChatGPT của OpenAI, sẽ được tích hợp vào Facebook, Instagram và WhatsApp. Từ tuần này, nugoiwf dùng tại Mỹ đã có thể truy cập được vào Llama 3.1 thông qua WhatsApp và trang chủ AI của Meta. Facebook và Instagram sẽ được cập nhật trong vài tuần tới. Đồng thời, Llama 3.1 cũng được cập nhật thêm cá ngôn ngữ như Pháp, Đức, Hindi, Ý và Tây Ban Nha.

Chatbot AI này sẽ sử dụng model Llama 3.1 405 tỷ tham số và sau một số prompt nhất định, người dùng sẽ được chuyển xuống dùng model Llama 3.1 70 tỷ tham số. Qua đó có thể thấy, Model Llama 3.1 405 tỷ tham số này thực sự tốn kém để Meta có thể chạy ở quy mô đầy đủ cho tất cả mọi người. Hiện vẫn chưa rõ ngưỡng này là bao nhiêu.

Cuối cùng, Meta cũng phát hành một tính năng AI mới là Imagine Me, cho phép người dùng đưa ảnh chân dung lên để tạo ra những bức ảnh khác bằng AI. Bằng việc tạo ra ảnh AI theo cách này, Meta hy vọng rằng nó sẽ vừa đáp ứng nhu cầu tạo ra các hình ảnh của người dùng, nhưng vẫn không đi lệch như deepfake. Nói cách khác, Meta cho đây là giải pháp để xác định rõ ranh giới hơn giữa những hình thật và hình người do AI tạo ra.

Theo Tinhte.vn

You need to login in order to like this post: click here