Là một chuyên gia kiểm tra chatbot AI, tôi đã khám phá những lựa chọn thay thế xuất sắc nhất cho ChatGPT

Đăng bởi

14/08/2025

Vào 14/08/2025

Với việc ra mắt GPT-5, OpenAI đã đưa ChatGPT lên một tầm cao mới, mang đến những cuộc trò chuyện thông minh hơn, nhạy bén hơn về mặt cảm xúc so với trước đây. Tuy nhiên, trong bối cảnh AI đang cạnh tranh khốc liệt như hiện nay, việc dẫn đầu không đồng nghĩa với việc trở thành người giỏi nhất.

Mặc dù ChatGPT vẫn là lựa chọn hàng đầu của nhiều người, nhưng nó không còn là chatbot mạnh mẽ duy nhất nữa. Và khi nó gặp sự cố, việc có một lựa chọn thay thế luôn là điều tuyệt vời.

Các đối thủ như Claude, Gemini 2.5 Pro, Perplexity và Microsoft Copilot đã nhanh chóng chiếm lĩnh thị trường, cung cấp các tính năng độc đáo, trả lời nhanh hơn và trong một số trường hợp, hiệu suất tốt hơn tùy thuộc vào nhu cầu của bạn.

Cho dù ChatGPT có bị lỗi, lỗi thời hay không đáp ứng được một nhiệm vụ cụ thể nào đó, những lựa chọn thay thế này đều rất hiệu quả. Khi cuộc cạnh tranh ngày càng gay gắt, việc làm quen với tất cả các chatbot và thậm chí sử dụng chúng cùng nhau để có được phản hồi hoàn hảo là rất tốt.

Là một người thường xuyên kiểm tra các công cụ AI, tôi đã tổng hợp những lựa chọn thay thế ChatGPT tốt nhất đáng thử ngay bây giờ; tất cả đều dựa trên kinh nghiệm thực tế.

Mục lục

Tốt nhất về tổng thể: Claude

Một chatbot khác đang âm thầm chiếm ưu thế là Claude. Với tính năng giọng nói mới và các phiên bản Sonnet 4 và Opus 4 nhanh hơn, chatbot này là một trong những chatbot bạn không thể bỏ qua.

Cửa sổ ngữ cảnh của Claude cũng là một trong những cửa sổ lớn nhất trong số các chatbot AI với số lượng mặc định khoảng 200.000, có thể tăng lên 1 triệu trong một số trường hợp sử dụng nhất định. Điều này đặc biệt hữu ích khi Claude tích hợp khả năng thị giác, có thể dễ dàng phân tích hình ảnh, ảnh chụp và đồ thị.

Vấn đề lớn nhất của Claude là giới hạn tốc độ tương đối thấp. Nếu bạn là người dùng thường xuyên, bạn sẽ nhanh chóng gặp cảnh báo “không còn tin nhắn” mà không có cách nào để tăng số lượng tin nhắn. Bạn sẽ phải chuyển sang Opus hoặc mô hình Haiku nhỏ cho đến khi giới hạn tin nhắn được đặt lại sau 3-5 giờ.

Claude không có khả năng tạo hình ảnh mặc dù nó đặc biệt tốt trong việc cung cấp lời nhắc mà bạn có thể dán vào trình tạo hình ảnh như Midjourney. Nó cũng tốt hơn về khả năng lập trình so với một số mô hình khác.

Một trong những điểm hấp dẫn nhất của Claude là các tính năng bổ sung. Khi Sonnet 3.5 ra mắt, chúng ta đã thấy sự xuất hiện của Artifacts, một công cụ cho phép bạn chạy mã trong trình duyệt hoặc thậm chí lưu nội dung do Claude tạo ra để sử dụng ở nơi khác. Ngoài ra, Claude hiện còn có tính năng thư viện dự án để chia sẻ công việc và ý tưởng.

Cùng với Sonnet 3.5, Anthropic đã giới thiệu Claude 3.5 Haiku. Theo nhiều đánh giá, mô hình này tương đương với hiệu suất của mô hình lớn nhất trước đó, Claude 3 Opus, trong khi vẫn hoạt động ở tốc độ tương tự như thế hệ Haiku trước. Mô hình này rất phù hợp cho các sản phẩm hướng đến người dùng, các tác vụ phụ chuyên biệt của agent và tạo ra trải nghiệm cá nhân hóa từ khối lượng dữ liệu lớn.

Việc phát hành các ứng dụng máy tính để bàn cho Windows và macOS, cùng với việc bổ sung hỗ trợ đọc chính tả, cho phép người dùng tương tác với Claude trực tiếp từ máy tính của họ, loại bỏ nhu cầu chuyển đổi giữa các thiết bị. Sự tích hợp này tạo điều kiện thuận lợi cho việc đa nhiệm liền mạch, cho phép người dùng tích hợp các chức năng của Claude vào nhiều ứng dụng khác nhau như tài liệu, bảng tính và bản trình bày mà không cần chỉ dựa vào giao diện web.

Anthropic cũng đã giới thiệu Công cụ Phân tích trong Claude.ai, cho phép Claude viết và thực thi mã JavaScript. Tính năng này cho phép Claude xử lý dữ liệu, tiến hành phân tích và tạo ra thông tin chi tiết theo thời gian thực ngay trong nền tảng. Người dùng có thể tải lên các tệp dữ liệu, chẳng hạn như CSV, và Claude có thể thực hiện các tác vụ như dọn dẹp, khám phá và phân tích dữ liệu, cung cấp kết quả chính xác và có thể tái tạo.

Claude đã mở rộng khả năng truy cập bằng cách ra mắt các ứng dụng máy tính để bàn cho Windows và Mac. Các ứng dụng này cung cấp các chức năng tương tự như phiên bản web, bao gồm khả năng đặt câu hỏi, truy cập các cuộc trò chuyện trước đó và xem các cuộc trò chuyện được đánh dấu sao. Ngoài ra, hỗ trợ đọc chính tả bằng giọng nói đã được bổ sung vào các ứng dụng di động của Claude, cho phép người dùng nhập truy vấn bằng giọng nói.

Những phát triển này càng nhấn mạnh cam kết của Claude trong việc mang đến trải nghiệm người dùng tích hợp và hiệu quả hơn.

Giải thưởng danh dự nhất: DeepSeek

DeepSeek là một công ty AI đang phát triển nhanh chóng có trụ sở tại Trung Quốc, đang tạo nên làn sóng với các mô hình ngôn ngữ mạnh mẽ và tiết kiệm chi phí. Với bản cập nhật gần đây, chatbot độc đáo này đã trở nên cạnh tranh hơn nữa với các đối thủ.

Được biết đến với khả năng vượt qua giới hạn của lý luận, lập trình và các tác vụ sáng tạo, đồng thời vượt trội hơn so với các đối thủ như OpenAI về chi phí – mô hình V3 của công ty được cho là chỉ tốn 6 triệu đô la để đào tạo.

DeepSeek cũng cung cấp tính năng tạo hình ảnh, giao diện web trực quan và ứng dụng di động, giúp nó dễ tiếp cận với nhiều người dùng. Mặc dù về mặt thống kê, nó kém “an toàn” hơn so với các chatbot khác (có nghĩa là dễ bị ảo giác hoặc phản hồi vượt giới hạn), nhưng đó chính xác là lý do tại sao nó vượt trội trong các tác vụ sáng tạo như tạo ra các gợi ý độc đáo.

Tuy nhiên, công ty đã gây ra lo ngại về quyền riêng tư ở một số quốc gia do máy chủ của họ đặt tại Trung Quốc và các chatbot của họ có xu hướng tránh các chủ đề chính trị nhạy cảm.

Tuy nhiên, để tạo ra ý tưởng và tư duy đột phá, DeepSeek là một trong những công cụ hấp dẫn nhất hiện nay.

Tốt nhất cho Dữ liệu Trực tiếp: Google Gemini

Chatbot của Google ban đầu được gọi là Bard nhưng đã được đặt một cái tên mới — và một bộ não lớn hơn nhiều — khi gã khổng lồ tìm kiếm ra mắt dòng sản phẩm Gemini gồm các mô hình ngôn ngữ lớn. Đây là một chatbot toàn diện với lối diễn đạt thân thiện.

Tuy nhiên, đây cũng là một trong những chatbot thận trọng và được kiểm duyệt chặt chẽ nhất. Ví dụ, chatbot sẽ từ chối thảo luận về một số chủ đề nhất định, không tạo hình ảnh hoặc thậm chí là lời nhắc về hình ảnh người thật, và ngừng phản hồi nếu không thích cuộc trò chuyện.

Tuy nhiên, nó đang ngày càng được cải thiện. Google đã ra mắt Gemini 2.0, đánh dấu một bước tiến đáng kể trong khả năng AI của mình. Bản cập nhật này giới thiệu các tính năng như API Live đa phương thức, cho phép tương tác âm thanh và video theo thời gian thực, cho phép Gemini xử lý và phản hồi đồng thời nhiều loại dữ liệu khác nhau. Khả năng hiểu và tương tác với thông tin không gian cũng được cải thiện khi Gemini 2.0 ra mắt.

Google đã cải tiến hệ điều hành Android và các thiết bị Pixel với các tính năng mới được hỗ trợ bởi AI, bao gồm:

Phụ đề biểu cảm: Một phần mở rộng của tính năng Phụ đề trực tiếp (Live Caption), cung cấp văn bản cho hầu hết mọi nội dung đa phương tiện trên điện thoại, ghi lại các yếu tố không phải lời nói như tiếng thở dài và tiếng thở hổn hển bằng AI trên thiết bị.

Mô tả hình ảnh được cải thiện: Ứng dụng Lookout đã được cải tiến bằng mô hình ngôn ngữ tiên tiến hơn, cung cấp mô tả hình ảnh tốt hơn.

Tiện ích mở rộng Spotify dành cho Gemini: Cho phép người dùng tương tác với Spotify thông qua chatbot Gemini, tạo điều kiện thuận lợi cho việc khám phá và phát nhạc.

Quét tài liệu được cải tiến: Google Drive trên Android hiện cung cấp khả năng quét tài liệu được cải tiến.

Chia sẻ nhanh bằng mã QR: Đơn giản hóa quy trình chia sẻ bằng cách tạo mã QR để dễ dàng chuyển nội dung.

Tương tác được cá nhân hóa: Tính năng “Thông tin đã lưu với Gemini” cho phép người dùng tương tác được cá nhân hóa hơn.

Giống như ChatGPT, Google Gemini có khả năng tạo hình ảnh riêng. Mô hình mới này cho phép Gemini tạo hình ảnh và chuyển đổi văn bản thành giọng nói với các thông số có thể điều chỉnh. Chúng tôi đang thấy khả năng thực hiện các tác vụ một cách tự động được cải thiện, cũng như các chức năng như Google Search trong Gemini. Nó sử dụng mô hình Imagen 3 ấn tượng và có thể tạo ra những hình ảnh hấp dẫn, chân thực. Bạn chỉ có thể tạo ảnh người (miễn là họ không tồn tại) với gói đăng ký Gemini Advanced.

Google đã bị chỉ trích vì những rào cản quá mức được đặt ra cho Gemini, dẫn đến các vấn đề về chủng tộc trong ảnh người. Phản ứng của Google là chỉ cần ngừng tạo ảnh người — điều này vẫn chưa được gỡ bỏ.

Tuy không hoạt động tốt bằng ChatGPT cho mục đích này, nhưng Google có quyền truy cập trực tiếp vào kết quả Tìm kiếm của Google. Điều này có nghĩa là bạn có thể nhận được thông tin cụ thể không có trong dữ liệu đào tạo và trích dẫn nguồn nội dung.

Tính năng này hoạt động tốt nhất khi được kết nối với các sản phẩm của Google. Gemini tích hợp chặt chẽ, tùy chọn tham gia, với Maps, Gmail, Docs và các sản phẩm khác của Google.

Google gần đây đã cung cấp miễn phí các tính năng tiên tiến nhất của Gemini cho người dùng. Ngoài ra, Google còn giới thiệu Gemini Canvas, một không gian làm việc tương tác để tinh chỉnh tài liệu và mã, và Audio Overview, một tính năng biến mọi thứ, từ các tệp đơn lẻ đến báo cáo Nghiên cứu chuyên sâu, thành các cuộc thảo luận theo phong cách podcast.

Cả hai gói miễn phí và trả phí đều có quyền truy cập vào Gemini 2.5. Phiên bản trả phí sử dụng Gemini Pro 1.5 và Gemini 2.0 mạnh mẽ hơn. Trước đây, nó sử dụng Gemini Ultra 1.0 nhưng Pro 1.5 vượt trội hơn về điểm chuẩn. Tôi nghi ngờ khi Ultra 1.5 ra mắt, nó sẽ được tích hợp với Gemini Advanced.

Gemini cũng bao gồm quyền truy cập vào Gemini Live, câu trả lời của Google cho ChatGPT Advanced Voice, cho phép bạn trò chuyện bằng giọng nói với AI. Tính năng này hoạt động hiệu quả đáng ngạc nhiên với nhiều giọng nói và phong cách khác nhau.

Sáng tạo nhất: Microsoft Copilot

Microsoft Copilot có nhiều tên gọi và phiên bản hơn cả các mẫu iPhone hiện tại của Apple — không hẳn vậy, nhưng bạn hiểu ý tôi rồi đấy.

Bản cập nhật mới nhất bao gồm GPT-4o, mô hình đa phương thức gốc mạnh mẽ nhất của OpenAI. Điều này mang lại khả năng suy luận và hiểu biết được cải thiện, cũng như khả năng thị giác AI tốt hơn. Nó cũng có giao diện và chế độ giọng nói mới.

Với bản thiết kế lại lớn được công bố vào tháng 10, Microsoft đã làm cho nó giống Pi hơn là ChatGPT, hiển thị nội dung dễ dàng hơn và tập trung vào chế độ giọng nói.

Ban đầu, nó được ra mắt với một vài phiên bản như Bing Chat, Microsoft Edge AI chat, Bing với ChatGPT và cuối cùng là Copilot. Sau đó, Microsoft đã hợp nhất tất cả các bot được hỗ trợ bởi ChatGPT dưới cùng một nền tảng.

Ở phiên bản hiện tại, Copilot được tích hợp sâu trên mọi sản phẩm của Microsoft, từ Windows 11 và trình duyệt Edge, đến Bing và Microsoft 365. Copilot cũng có mặt trong các công cụ doanh nghiệp. Mặc dù được hỗ trợ bởi GPT-4o của OpenAI, Copilot vẫn là một sản phẩm của Microsoft.

Microsoft là nhà đầu tư lớn nhất vào OpenAI với dịch vụ đám mây Azure được sử dụng để đào tạo các mô hình và chạy các ứng dụng AI khác nhau. Gã khổng lồ công nghệ đã tinh chỉnh các mô hình OpenAI dành riêng cho Copilot, mang đến các mức độ sáng tạo và độ chính xác khác nhau.

Copilot có một số tính năng bổ sung ấn tượng bao gồm tạo chatbot tùy chỉnh, truy cập vào các ứng dụng Microsoft 365, khả năng tạo, chỉnh sửa và tùy chỉnh hình ảnh bằng DALL-E thông qua Designer và các plugin như trình tạo nhạc Suno AI.

Microsoft Copilot Vision, một công cụ AI cho phép Copilot xem những gì người dùng đang xem trên trình duyệt internet của họ, hỗ trợ điều hướng và truy xuất thông tin bằng cách quét các trang web và cung cấp câu trả lời phù hợp, tạo ra trải nghiệm duyệt web tương tác và cá nhân hóa hơn.

Chế độ giọng nói của AI được xây dựng dựa trên Advanced Voice của OpenAI và không giống như sản phẩm ChatGPT, Copilot Voice được cung cấp miễn phí và tôi thấy nó mang tính hội thoại hơn.

Chỉ trong năm nay, Microsoft đã công bố việc đưa các tính năng hỗ trợ AI vào gói đăng ký Microsoft 365 Personal và Family với mức phí bổ sung 3 đô la mỗi tháng, so với mức phí hàng tháng 20 đô la trước đây cho gói đăng ký Copilot Pro. Người đăng ký hiện tại có thể chọn không tham gia các tính năng AI này để tránh việc tăng giá. Việc tích hợp này diễn ra sau nhiều tháng thử nghiệm và hiện đã có sẵn trên toàn cầu.

Những cập nhật này thể hiện nỗ lực không ngừng của Microsoft trong việc tích hợp các khả năng AI trên toàn hệ sinh thái sản phẩm của mình, nâng cao trải nghiệm người dùng và năng suất.

Tốt nhất cho nghiên cứu: Perplexity

Mặc dù Perplexity được quảng cáo là một lựa chọn thay thế cho Google hơn là một chatbot AI, nhưng nó cho phép bạn đặt câu hỏi, theo dõi và trả lời theo kiểu hội thoại. Với tôi, điều đó đúng là chatbot, đó là lý do tại sao tôi đưa nó vào danh sách những lựa chọn thay thế tốt nhất cho ChatGPT.

Điểm nổi bật của Perplexity so với các công cụ khác là lượng thông tin khổng lồ mà nó có sẵn trong tầm tay và khả năng tích hợp với nhiều mô hình AI. Phiên bản miễn phí có thể sử dụng mà không cần đăng nhập và cung cấp phản hồi hội thoại cho các câu hỏi — nhưng có kèm nguồn.

Perplexity kết hợp những ưu điểm của trò chuyện với ChatGPT với kết quả tìm kiếm trực tiếp và được cấu trúc tốt của Google. Điều này khiến nó trở thành công cụ AI hoàn hảo cho nghiên cứu hoặc chỉ đơn giản là tìm hiểu sâu về một chủ đề.

Bạn có thể đặt trọng tâm cho phần tìm kiếm, bao gồm các bài báo học thuật, kiến thức tính toán, YouTube hoặc Reddit. Bạn cũng có thể tắt tìm kiếm trên web và chỉ sử dụng nó như ChatGPT.

Perplexity hiện cũng có tính năng Trang cho phép bạn tổng hợp tìm kiếm của mình thành một trang web duy nhất có thể chia sẻ.

Perplexity đã ra mắt trung tâm mua sắm để nâng cao trải nghiệm người dùng khi tìm kiếm sản phẩm. Được hỗ trợ bởi Amazon và Nvidia, tính năng này hiển thị các thẻ sản phẩm hiển thị các mặt hàng liên quan để trả lời các truy vấn liên quan đến mua sắm, nhằm mục đích hợp lý hóa quy trình mua sắm cho người dùng.

Cá nhân hóa nhất: Inflection Pi

Pi của Inflection AI là mô hình ngôn ngữ lớn tôi thích nhất để giao tiếp. Nó không hẳn là mạnh nhất hay giàu tính năng nhất, nhưng giao diện và phong cách trò chuyện tự nhiên, thân thiện và hấp dẫn hơn bất kỳ mô hình nào khác tôi từng thử.

Tin nhắn chào mừng khi bạn mở Pi lần đầu rất thân thiện, với nội dung: “Mục tiêu của tôi là hữu ích, thân thiện và vui vẻ. Hãy hỏi tôi lời khuyên, câu trả lời, hoặc chúng ta hãy cùng nhau nói về bất cứ điều gì bạn đang nghĩ.” Giao diện rất đơn giản với các cuộc thảo luận theo chủ đề thay vì các cuộc trò chuyện mới.

Gần đây, tôi đã hỏi tất cả các chatbot một câu hỏi về hai người ở cùng một bên đường đang băng qua đường để tránh nhau. Pi là chatbot duy nhất cảnh báo tôi về các mối nguy hiểm tiềm ẩn từ giao thông khi băng qua đường và khuyến cáo hãy cẩn thận.

Pi được cài đặt sẵn một số lời nhắc trên thanh bên, chẳng hạn như môi trường ngủ lý tưởng và lời khuyên về mối quan hệ. Nó cũng có thể lấy tin tức hoặc thể thao mới nhất — giống như Perplexity — và cho phép bạn đặt câu hỏi về một câu chuyện.

Tốt nhất cho mạng xã hội: Meta

Với gần 600 triệu người dùng, Meta AI được tích hợp vào Facebook, Instagram và WhatsApp, và gần đây đã được ra mắt dưới dạng một ứng dụng độc lập. Nó được thiết kế để nhanh chóng, hữu ích và gắn kết chặt chẽ với hệ sinh thái rộng lớn hơn của Meta, mang đến cho người dùng một điểm truy cập dễ dàng hơn vào AI tạo sinh.

Chatbot trả lời các câu hỏi, tạo hình ảnh và đưa ra các đề xuất thông minh thông qua cả tương tác văn bản và giọng nói. Nó cũng được tích hợp sâu vào phần cứng của Meta – từ kính thông minh Ray-Ban đến tai nghe Quest VR – cung cấp hỗ trợ thời gian thực mọi lúc mọi nơi.

Mặc dù các mẫu Llama cơ bản (như Llama 4) được cung cấp theo giấy phép cộng đồng, Meta vẫn duy trì các quy trình kiểm soát chặt chẽ để đảm bảo việc phát triển và triển khai AI có trách nhiệm.

Điểm khác biệt của Meta AI là khả năng tích hợp nền tảng xã hội và khả năng sáng tạo độc đáo – người dùng có thể tạo tới 100 hình ảnh mỗi ngày (bao gồm cả hoạt ảnh) và truy cập các tùy chọn giọng nói của người nổi tiếng như Dame Judi Dench.

AI mở rộng ra ngoài phần mềm vào hệ sinh thái phần cứng của Meta, cung cấp chức năng giọng nói/hình ảnh thông qua kính thông minh Ray-Ban và tai nghe Quest VR để hỗ trợ thời gian thực.

Mặc dù vẫn còn kém xa các công ty dẫn đầu ngành như Gemini và ChatGPT ở một số lĩnh vực, nhưng Meta AI vẫn có những lợi thế chiến lược.

Được hỗ trợ bởi phiên bản tùy chỉnh của Llama 4, được thiết kế riêng cho các sản phẩm của Meta, MetaAI là một chatbot độc lập mới từ gã khổng lồ truyền thông xã hội.

Thú vị nhất: X AI Grok

Có thể truy cập thông qua thanh bên X hoặc thông qua ứng dụng độc lập dành cho iOS, Grok là phiên bản chatbot AI của Elon Musk, kết hợp tìm kiếm internet thời gian thực, tạo hình ảnh và khả năng trò chuyện tinh tế thành một công cụ đầy tham vọng. Ban đầu, Grok được ra mắt như một trợ lý theo phong cách ChatGPT, nhưng giờ đây nó đã hỗ trợ tab Khám phá mở rộng trên X, cung cấp tóm tắt nhanh về các chủ đề thịnh hành và các tin tức nổi bật để thu hút người dùng.

Với việc phát hành Grok 4, chatbot hiện bao gồm các khả năng đa phương thức như tạo hình ảnh (được hỗ trợ bởi các mô hình Flux và Aurora của xAI), trợ giúp lập trình, phân tích PDF và chế độ “nghiên cứu chuyên sâu” cho kết quả được tăng cường trên web, dành cho người dùng Pro. Bạn có thể tải lên hình ảnh để diễn giải, thả PDF để nhận câu trả lời hoặc đặt các câu hỏi phức tạp, thời gian thực yêu cầu truy cập web.

Grok cũng nổi bật so với các đối thủ cạnh tranh nhờ triết lý mở (và gây tranh cãi). Không giống như OpenAI, xAI đã phát hành phiên bản đầu tiên của mô hình Grok để tải xuống công khai, đào tạo và tinh chỉnh trên phần cứng cục bộ; một sự công nhận về tính minh bạch và tính thử nghiệm. Mặc dù Grok có thể không phải lúc nào cũng tuân theo các quy tắc an toàn giống như các đối thủ cạnh tranh, nhưng đó là do thiết kế. Musk đã nhấn mạnh “tự do ngôn luận” là nguyên tắc cốt lõi, dẫn đến việc kiểm duyệt nội dung lỏng lẻo hơn so với các chatbot khác.

Trên thực tế, Grok có thể nhạy bén đến bất ngờ. Khi tôi hỏi một số AI xem liệu ai đó có thể băng qua đường để tránh người khác không, Grok là AI duy nhất nhận ra những căng thẳng xã hội tiềm ẩn. Sự khác biệt tinh tế đó thể hiện rõ nét tính cách thô sơ, chưa được sàng lọc của nó.

Giờ đây, không chỉ có trên nền tảng X, Grok tiếp tục phát triển thành một trợ lý ảo đầy đủ tính năng với khả năng nhận thức theo thời gian thực, khả năng sáng tạo và giọng nói đặc trưng.

Tốt nhất cho mã nguồn mở: Llama 3.2

Các mô hình Llama của Meta đã nhanh chóng trở thành một trong những mô hình ngôn ngữ lớn mã nguồn mở được áp dụng rộng rãi nhất trên thế giới, và chúng đang phát triển nhanh chóng. Việc ra mắt Llama 3.1 vào tháng 7 đã giới thiệu ba biến thể chính: 8B, 70B và phiên bản “biên giới” 405B mạnh mẽ.

Tiếp theo là Llama 3.2 vào tháng 9, ra mắt các mô hình đa phương thức 11B và 90B có khả năng phân tích hình ảnh; một bước tiến quan trọng hướng tới việc biến các mô hình Llama thực sự trở thành đa phương thức.

Giờ đây, Meta đã phát hành Llama 3.3, một mô hình 70 tỷ tham số, tương đương với hiệu suất của phiên bản tiền nhiệm 405B nhưng hiệu quả hơn và tốc độ suy luận nhanh hơn. Theo Meta, hệ sinh thái Llama hiện đã vượt qua 650 triệu lượt tải xuống, trở thành mô hình AI được áp dụng nhiều nhất trên toàn cầu. Dòng sản phẩm Llama hỗ trợ mọi thứ, từ Meta AI (trợ lý ảo của công ty) đến tích hợp với kính thông minh Ray-Ban Meta, Instagram, WhatsApp và ứng dụng Meta AI độc lập.

Giám đốc điều hành Meta, Mark Zuckerberg, cho biết tầm nhìn dài hạn của công ty là biến Meta AI thành “trợ lý AI tốt nhất thế giới” và họ đang đầu tư mạnh mẽ để đạt được điều đó. Llama 4 hiện đang trong quá trình phát triển và dự kiến sẽ yêu cầu nguồn lực đào tạo gấp 10 lần so với Llama 3, đưa Meta vào lãnh địa mô hình tiên tiến thực sự.

Một lý do cho sự phổ biến của Llama là tính mở của nó. Không giống như các mô hình độc quyền của OpenAI hay Google, Llama là mã nguồn mở; cho phép các nhà phát triển, nhà nghiên cứu và các công ty khởi nghiệp tinh chỉnh và triển khai các phiên bản riêng của họ. Sự tự do đó đã dẫn đến một hệ sinh thái sôi động với các biến thể Llama được tùy chỉnh, nhiều trong số đó ưu tiên tốc độ, sử dụng bộ nhớ thấp hơn hoặc các trường hợp sử dụng độc đáo như lập trình hoặc hướng dẫn.

Về khả năng sử dụng, Llama 3.1 trở lên thể hiện một bước tiến vượt bậc so với các phiên bản trước. Việc từ chối phản hồi ít xảy ra hơn, các rào cản an toàn được cân bằng hơn, và trải nghiệm chatbot, dù thông qua phiên bản của Meta hay các nhánh do cộng đồng xây dựng, đều mượt mà, thú vị và hữu ích một cách đáng ngạc nhiên.

Với việc phát hành Llama 3.3 và sự ra mắt sắp tới của Llama 4, tham vọng về AI của Meta rõ ràng đang tăng tốc — và thế giới mã nguồn mở cũng đang theo kịp.

Nhiều lựa chọn hơn: Poe

Poe khác với hầu hết các chatbot khác mà chúng tôi đã đề cập ở chỗ nó không phải là một mô hình riêng biệt, mà là một tập hợp tất cả các mô hình để bạn có thể so sánh chúng.

Một số hoàn toàn miễn phí, một số khác đi kèm với chi phí “tính toán”, bao gồm mô hình biên giới Llama 3.1 405b mới. Bên cạnh các tùy chọn mã nguồn mở, bạn có thể truy cập các mô hình từ Anthropic, OpenAI và Google, tất cả đều từ cùng một trang web.

Poe cũng có một bộ sưu tập các mẫu do cộng đồng tạo ra và các mô hình tùy chỉnh được thiết kế để giúp bạn tạo ra lời nhắc hoàn hảo cho các công cụ như Midjourney và Runway.

Một trong những bản cập nhật gần đây nhất của Poe là việc bổ sung các công cụ hình ảnh như Stable Diffusion và các trình tạo video như Runway. Poe thậm chí còn cho phép bạn tạo bot của riêng mình.

Blog