Không phải tối ưu chi phí như DeepSeek, nhưng Grok-3 có một thứ mà đến ChatGPT cũng phải mơ ước: khoản đầu tư khổng lồ của ông Elon Musk.
Vài ngày trước, tỷ phú Elon Musk đã bị một phen bẽ mặt bởi chính chatbot AI của mình Grok-3. Trước đó, ông vừa hết lời ca ngợi AI "con đẻ" của mình vì giải được một trong những bài toán khó nhất của kỳ thi Putnam chỉ trong vài phút, thì không lâu sau đó, chính chatbot AI này lại thừa nhận lời giải của mình là không chính xác vì các ngộ nhận về tham số.
Đây cũng không phải lần đầu Grok-3 làm ông chủ của mình phải xấu hổ trước cộng đồng người dùng toàn cầu. Vài ngày trước đó, chính chatbot AI này đã cho rằng ông Elon Musk là một trong những nguồn phát tán tin giả lớn nhất thế giới. Thậm chí sau đó, đội ngũ lập trình của Grok-3 phải vô hiệu hóa khả năng trả lời các câu hỏi tương tự của AI này.
Các sự cố này cho thấy, liệu Grok-3 có thật sự thông minh nhất Trái Đất như ông Elon Musk vẫn ca ngợi hay tuyên bố đó chỉ giống như "con hát mẹ khen hay"? Và ông Musk căn cứ vào đâu để nói rằng Grok-3 là AI thông minh nhất hiện nay?

Câu hỏi này đã được giải đáp phần nào trong bài đăng của chuyên gia công nghệ Nguyễn Hồng Phúc trên Facebook của mình.
Đầu tiên, theo ông Phúc, AI Grok-3 thực sự khá thông minh chứ không chỉ là một tuyên bố gây sốc khác của ông Musk. Trước tiên nhìn vào các tính năng của chatbot AI này:
+ Mô hình AI Ngôn Ngữ lớn với được huấn luyện bằng dữ liệu từ mạng xã hội Twitter(X) nên có khả năng nói chuyện "tuyệt đối giống người"
+ Năng lực Tư Duy Suy Luận - Reasoning mức độ cao nhất khi so với các mô hình reasoning khác như OpenAI O1, O3-mini, DeepSeek R1, Gemini-2 Flash Thinking dẫn tới khả năng làm toán và viết code - những tác vụ cần khả năng suy luận cấp cao thì Grok AI thực sự vượt trội so với các mô hình khác.
+ Tính năng AI Agent tìm kiếm, tổng hợp thông tin thành báo cáo "Cơ bản" nhưng kém hơn nhiều so với OpenAI Deep Research, có lẽ vì vậy nó được xAI gọi là Deep Search.
+ Đa giác quan (multimodal) cơ bản, bao gồm năng lực đọc hình ảnh, đọc file cơ bản, tuy nhiên AI này chưa có khả năng coi video, nghe âm thanh. Ngoài ra nó cũng không có khả năng phản hồi bằng việc khởi tạo hình ảnh, âm thanh.
+ Ứng dụng AI Chatbot Grok có thể dùng trực tiếp trên mạng xã hội X bản Web, iOS, Android hoặc app riêng lẻ. Về mặt App AI Chatbot thì không có gì khác biệt đặc sắc nhiều, ngoại từ có thêm tính năng Follow-up Questions, tức là AI tự động gợi ý các câu chat tiếp theo để người dùng chọn thay vì phải nghĩ. Đây được xem là tính năng tiến bộ về giao diện và chức năng so với các AI Chatbot hiện có.
Dường như việc tích hợp trực tiếp chatbot AI này vào nền tảng mạng xã hội X.com là nguyên nhân giúp cho Grok-3 được nhiều người dùng bất ngờ về khả năng "nói chuyện tự nhiên tuyệt đối như con người."

Hệ thống siêu máy tính để vận hành Grok-3 có quy mô khổng lồ
Tuy nhiên theo ông Phúc, điều thú vị nhất của Grok-3 này lại không nằm ở việc có đột phá mới về công nghệ, mà là khoản đầu tư khổng lồ của ông Elon Musk cho AI này: lên tới 6 tỷ USD cho hệ thống Siêu máy tính Colossus chứa tới 200.000 GPU NVIDIA H100 (mới nhất, đắt nhất của NVIDIA), dự kiến tới hết năm nay sẽ có tới 1 triệu GPU H100.
Siêu máy tính này lớn tới nỗi chiếm tới 200 hecta đất tại Memphis bang Tennessee Mỹ, tiền điện để vận hành ngốn gần bằng một thành phố.
Một AI mang lại "cảm giác thông minh tuyệt đỉnh"
Điều thú vị thứ 2: là cách Elon Musk tạo nên "cảm giác AI thông minh" cho Grok-3 bằng việc "nói chuyện tuyệt đối giống người" thay vì thực sự làm ra một "AI thông minh".
Việc mua lại Twitter đã giúp ông Musk nắm được khối dữ liệu khổng lồ vô cùng giá trị của mạng xã hội này. Hàng tỉ tỉ post Tweets chính là kho dữ liệu mà các nhà làm AI đều thèm khát. Chúng chính là kho dữ liệu được làm sạch một cách tự nhiên về "giao tiếp thuần tuý của con người" vì format của Tweets từ ngày Twitter ra đời là rất ngắn gọn chỉ 140 đến 200 kí tự cho mỗi post và mỗi reply (tương đường với chiều dài của một SMS), khiến cho nội dùng của Tweets luôn cực kỳ cô đọng, nó phải chứa trong đó đủ thông tin muốn truyền tải bao gồm thông tin sự kiện-sự việc, và cả cảm xúc của người đăng; tất cả được diễn giải bằng chữ.
Theo ông Phúc, Twitter là mạng xã hội mà người trưởng thành, có trí thức, có quan điểm riêng, sử dụng. Vì vậy, rất khác so với dữ liệu từ Facebook, là nơi dữ liệu là đa phương tiện có cả text, video, hình ảnh…, phục vụ giới trẻ, nội dung ít tính real-time thời sự hơn Twitter, và lan man hơn do các bài đăng dài hơn rất nhiều Tweet.

Thay vì là công cụ độc lập như ChatGPT, Grok-3 được tích hợp và sử dụng thông qua tài khoản X.com
Có thể thấy nền tảng X (hay Twitter) chính là kho dữ liệu tạo nên khả năng "nói chuyện tuyệt đối giống người" của Grok 3. Thuần tuý là do Dữ Liệu Huấn Luyện đầu vào sạch, cô đọng, có quan điểm riêng, có sắc thái cảm xúc như con người. Nên Grok 3 nói chuyện rất người, thậm chí "chửi tục" như người.
Chưa hết, về phần dữ liệu huấn luyện Grok 3. Có một điểm cực kỳ quan trọng là con AI này không-bị-kiểm-duyệt-nội-dung dạng "tiền kiểm". Kiểm duyệt nội dung là hình thức an toàn mà các nhà làm AI đưa vào AI LLM để nó không nói những điều tiêu cực theo tiêu chuẩn xã hội hiện nay.
Hiện các Chatbot AI như ChatGPT, Gemini, Claude, nhất là DeepSeek, đều đang bị kiểm duyệt nội dung rất chặt chẽ. Việc kiểm duyệt nội dung thường được làm ngay từ khâu làm dữ liệu huấn luyện nên gọi là "tiền kiểm", tức là lọc bỏ các dữ liệu huấn luyện "lệch chuẩn" nên AI còn không có cơ hội được học điều "sai trái lệch chuẩn" đó luôn và để đề phòng AI tự học được những kiến thức lệch chuẩn bằng cách tự tổng hợp từ nhiều kiến thức khác (kiểu học từ logic tam đoạn luận), thì các cty AI sẽ thêm vào hàng rào lọc ở "hậu kiểm" tức là khi chat, nếu người dùng hỏi các chủ đề nhạy cảm gây tranh cãi thì AI sẽ nghị ngắt trả lời ngay lập tức.
Đối với Grok-3, ông Elon Musk luôn xem đây là AI tự do theo tuyên ngôn của Twitter, nên người dùng trên nền tảng này nói gì nó sẽ học cái đó, dù vấn đề đó có gây tranh cãi cỡ nào đi chăng nữa. Bởi nên vậy người dùng sẽ có cảm giác rằng Grok 3 nói chuyện cực kỳ thông minh và rất "con người". Đơn giản là vì AI này giống cả mặt tốt và mặt xấu của con người nên mới hoàn thiện hơn các AI khác.

Các dòng lệnh được thêm vào để Grok-3 không trả lời các câu hỏi về việc ông Musk phát tán tin giả
Tuy nhiên, cũng theo quan sát của ông Phúc, cách đây 2 ngày, trong System Prompt mới nhất của Grok 3, xAI bắt đầu đưa vô một số yêu cầu "hậu kiểm" yêu cầu Grok 3 không trả lời rằng ông Musk và tổng thống Trump hay đưa tin giả tin sai lệch.
Học liên tục không giới hạn
Điều thú vị thứ 3: là Grok có kiến thức update realtime. Để chứng minh điều này, ông Phúc đã tìm cách buộc Grok-3 leak ra System Prompt của mình giúp người dùng thấy rõ hơn về cách hoạt động của Grok.
Trong system prompt có dòng:
* Your knowledge is continuously updated - no strict knowledge cutoff.
* Use in-context knowledge from tools for realtime updates.
Nghĩa là nó được chỉ thị rằng luôn trả lời là kiến thức được update liên tục, không có thời điểm "cut-off" , và nó sẽ dùng kiến thức được bổ sung vào "context" bằng các "Công cụ" (Tools).

Đây không phải là một phép màu công nghệ gì cả, chỉ đơn giản là Grok-3 sẽ dùng các công cụ để truy vấn kiến thức bên ngoài và bổ sung vào "context" của AI để trả lời. Các công cụ mà Grok 3 có thể sử dụng bao gồm công cụ Search Web trên Google hay Brave, công cụ search nội dung Tweets trên Twitter, công cụ đọc các files mà người dùng "đã upload trước đó lên Grok".
Điều thú vị thứ 4:
Grok-3 có tính năng AI Agent (tác nhân AI) đầu tiên của nó là AI DeepSearch, với nhiều điểm tương tự như Deep Research của OpenAI. Câu trả lời của Grok thông qua AI Agent DeepSearch khá ngắn gọn chứ không chi tiết như AI Agent DeepResearch - có lẽ vì vậy nó mới được gọi là DeepSearch tức là tìm kiếm sâu chứ không phải Nghiên Cứu Sâu (DeepResearch).

Tính năng DeepSearch được triển khai tương tự như DeepResearch của ChatGPT nhưng kém hơn
Theo ông Phúc, một trong những điểm ấn tượng nhất về khả năng suy luận của Grok-3 là nó có khả năng hỏi ngược lại người dùng để làm rõ yêu cầu câu hỏi rồi tự viết ra "Luận Điểm Nền" (Thesis) để thực hiện việc đi Search, rồi phân tích kết quả trả về để đưa ra hướng tìm kiếm tiếp theo, nó có khả năng lặp lại việc tìm kiếm ít nhất là 3 lần rồi tổng hợp các luận điểm, các kết quả tìm kiếm thành một câu trả lời dạng báo cáo ngắn gọn.
Đặc biệt là xAI thực hiện kỹ thuật gọi là few-shot learning để đưa một số mẫu ví dụ về cách thực hiện Deep Search vào System Prompt cho AI tham khảo mà làm theo. Thông qua một kịch bản tình huống tìm kiếm mẫu, Grok 3 có vẻ bắt chước được cách "suy nghĩ", lý luận, tìm kiếm, và đánh giá kết quả tìm kiếm.
Theo đánh giá của ông Phúc, tính năng AI Agent này của Grok không phải là sự kết hợp nhiều tác nhân cùng lúc (Multi-Agent) mà là một AI thực hiện tuần tự nhiều tác vụ trong cùng một "Super-Prompt" (Dạng Prompt dài mô tả chi tiết công việc qua nhiều bước mà AI phải làm). Đây là một dạng AI Agent rất cơ bản, không phức tạp về cách thức tạo cũng như huấn luyện (hầu như không huấn luyện).
Một năng lực độc đáo khác của mô hình AI Grok 3 là khả năng xử lý số lượng text đầu vào lớn (Large Context Window). Trên livestream giới thiệu Grok, ông Musk và team xAI có nói là Grok 3 có khả năng xử lý tới 1 triệu tokens đầu vào. Vậy đây là công ty thứ 2 sau Google có thể cung cấp AI với năng lực xử lý text đầu vào lên tới 1 triệu tokens. Dĩ nhiên, năng lực này không phải đến từ đột phá công nghệ mà nằm ở hạ tầng máy chủ vô cùng lớn đang được ông Musk triển khai cho Grok-3 mà thôi.
Có thể nói, hạ tầng khổng lồ và nền tảng mạng xã hội X của ông Elon Musk chính là điểm khác biệt lớn nhất mà Grok-3 có được so với các AI khác. Tuy nhiên, việc đóng vai trò như một tính năng của X.com cũng làm hạn chế khả năng tích hợp Grok-3 vào các nhà phát triển khác - thông qua việc cung cấp API như ChatGPT hoặc Claude AI đang làm hiện nay. Nhưng đường đua AI vẫn còn dài, liệu các lợi thế này có giúp Grok-3 đuổi kịp các đối thủ đi trước hay không vẫn cần thời gian trả lời.