Điều ít người biết về cha đẻ DeepSeek

NhatTrungNguyen

Super Moderators
Thành viên BQT

Xuất thân từ ngôi làng nhỏ tại phía nam Trung Quốc, Liang Wenfeng trở thành nguồn cảm hứng cho giới trẻ khi sáng lập startup nổi danh toàn cầu DeepSeek.​


11020042025.jpg


Một năm trước, không nhiều người Trung Quốc biết đến Mililing, ngôi làng yên bình nằm ở phía nam tỉnh Quảng Đông. Hiện tại, hàng trăm người đến làng mỗi ngày bởi đây là quê hương của Liang Wenfeng (40 tuổi), nhà sáng lập startup DeepSeek.

Từ khi DeepSeek gây chấn động Thung lũng Silicon với mô hình AI lý luận vào tháng 1, Wenfeng trở thành một trong những nhân vật có tầm ảnh hưởng lớn tại Trung Quốc. Trên toàn cầu, ông được so sánh với Sam Altman, CEO OpenAI.

Dân làng tại Mililing thậm chí dựng gian hàng gần ngôi nhà thời thơ ấu của Wenfeng để bán quà lưu niệm và đồ uống, trong đó có nước mía zhuangyuan, vốn dùng để tôn vinh người đạt điểm cao trong kỳ thi hoàng gia thời xưa.

“Không phải lúc nào Trung Quốc cũng chỉ theo sau”, Wenfeng chia sẻ trong cuộc phỏng vấn với trang tin 36Kr năm 2024. Khi trở lại quê nhà dịp Tết Nguyên đán vào cuối tháng 1, Wenfeng còn được cảnh sát hộ tống. Điều này cho thấy tầm quan trọng của ông với ngành công nghệ Trung Quốc.

Con nhà gia giáo, học giỏi từ nhỏ​

Wenfeng sinh năm 1985 trong gia đình nhà giáo. Thời điểm đó, GDP đầu người của Trung Quốc khoảng 300 USD, dịch vụ tài chính hạn chế và không có thị trường chứng khoán. Mililing vẫn là khu làng truyền thống, đa số người dân quen biết nhau.

Thời nhỏ, Wenfeng học rất giỏi tại trường công lập, nơi chú trọng đào tạo các môn toán và vật lý. Năm 2002, ông đạt điểm cao nhất trong kỳ thi tuyển sinh đại học tại vùng Trạm Giang, Quảng Đông.

Thành tích học tập xuất sắc giúp Wenfeng trúng tuyển Đại học Chiết Giang tại Hàng Châu. Thời điểm đó, Jack Ma đang nỗ lực phát triển startup thương mại điện tử Alibaba tại Hàng Châu.

11120042025.jpg


Cùng Đại học Thanh Hoa và Đại học Bắc Kinh, Đại học Chiết Giang được xem là nơi đào tạo các tỷ phú nổi tiếng của Trung Quốc. Trong danh sách cựu sinh viên Đại học Chiết Giang có Colin Huang Zheng, nhà sáng lập công ty mua sắm trực tuyến PDD Holdings, sở hữu khối tài sản ước tính 34 tỷ USD.

Theo SCMP, giai đoạn bùng nổ kinh tế của Trung Quốc đầu thập niên 2000 chứng kiến nhiều câu chuyện vươn lên từ nghèo khó, nhấn mạnh tầm quan trọng của công nghệ trong nền kinh tế phát triển nhanh chóng.

Wenfeng học đại học ngành kỹ thuật điện tử, tham gia chương trình sau đại học về thị giác máy tính năm 2007. Ông tốt nghiệp năm 2010 với luận án thuật toán theo dõi đối tượng cho camera.

Thời gian học tập tại Hàng Châu của Wenfeng trùng với thời kỳ kinh tế hưng thịnh, thị trường chứng khoán phát triển và sự bùng nổ của Internet tại Trung Quốc.

Tuy tiếp cận nhiều công việc lương cao, ông vẫn chọn con đường của riêng mình. Trong nhóm thực tập tại trường, một người bạn tiết lộ Wenfeng là học viên duy nhất yêu cầu không đến công ty.

Lối sống kín tiếng​

Sau khi tốt nghiệp, Wenfeng chuyển đến Thành Đô, thủ phủ tỉnh Tứ Xuyên. Tại đây, ông làm việc trên dự án sử dụng thuật toán để giao dịch chứng khoán. Năm 2015, ông và bạn cùng lớp thời đại học Xu Jin sáng lập High-Flyer Quant.

Chỉ trong vài năm, High-Flyer Quant nhanh chóng nổi tiếng, trở thành một trong 4 quỹ đầu cơ hàng đầu Trung Quốc, nguồn tài sản quản lý vượt mốc 100 tỷ nhân dân tệ. Lượng tài nguyên này giúp Wenfeng đầu tư trung tâm máy tính khổng lồ, phục vụ phân tích dữ liệu và chọn cổ phiếu.

Năm 2021, High-Flyer đầu tư 1 tỷ nhân dân tệ phát triển trung tâm điện toán, sử dụng 10.000 card đồ họa Nvidia.

Dù thành công lớn, High-Flyer vẫn đối mặt thách thức. Trước lo ngại bị chính quyền Trung Quốc giám sát chặt chẽ, công ty đã giảm lượng tài sản quản lý vào năm 2022, trả tiền cho nhà đầu tư và mua cổ phiếu trong thời kỳ thị trường suy thoái.

11220042025.jpg


Khi tài nguyên điện toán của High-Flyer vượt quá nhu cầu giao dịch hàng ngày, Wenfeng chuyển trọng tâm sang nghiên cứu AI, thành lập phòng thí nghiệm đầu tiên vào năm 2019.

Đến 2023, chỉ vài tháng sau khi OpenAI ra mắt ChatGPT, Wenfeng đổi mô hình phòng thí nghiệm thành thực thể độc lập có tên DeepSeek, tập trung phát triển mô hình ngôn ngữ lớn (LLM). Các sản phẩm được công ty giới thiệu khiến Thung lũng Silicon dậy sóng.

Theo SCMP, việc DeepSeek ra mắt mô hình nền tảng nguồn mở V3 vào tháng 12/2024, và mô hình lý luận R1 tháng 1 năm nay đã “cách mạng hóa” lĩnh vực AI tại Trung Quốc.

Trả lời phỏng vấn, Lee Kai-fu, nhà sáng lập kiêm CEO startup 01.AI, cho biết công ty đã ngừng phát triển mô hình riêng do thành công của DeepSeek.

DeepSeek tiết kiệm chi phí và mã nguồn mở, có thể trở thành giải pháp thay thế những mô hình do Mỹ phát triển. Điều này khác biệt với OpenAI, công ty hoạt động theo mô hình mã nguồn đóng.

11320042025.jpg


Dù tạo nên cơn sốt toàn cầu, Wenfeng vẫn khá kín tiếng. Lần xuất hiện đáng chú ý nhất của ông tại hội nghị cấp cao do Chủ tịch Trung Quốc Tập Cận Bình tổ chức vào tháng 2.

Trong video của đài truyền hình CCTV, Wenfeng không phát biểu khi tham gia hội nghị, trái ngược nhà sáng lập Huawei Ren Zhengfei và nhà sáng lập Xiaomi Lei Jun.

Wenfeng cũng từ chối lời mời tại hội nghị AI Action Summit ở Paris. Ông liên tiếp né tránh trả lời phỏng vấn, kể cả khi phóng viên đứng trước trụ sở DeepSeek tại Hàng Châu. Nguồn tin cho biết Wenfeng cũng không họp với nhà đầu tư tiềm năng và quan chức địa phương.

Đáng chú ý khi Wenfeng không xuất hiện trên mạng xã hội, điều hiếm hoi kể cả trong giới doanh nhân kín tiếng tại Trung Quốc.

Bằng chứng duy nhất cho thấy ông tham gia DeepSeek đến từ các bài báo khoa học do startup công bố. Điều này hoàn toàn trái ngược với Sam Altman khi thường xuyên quảng bá sản phẩm OpenAI trên toàn cầu.

Truyền cảm hứng cho giới trẻ Trung Quốc​

Sự nổi lên của DeepSeek cũng tạo nên thách thức cho OpenAI, đặc biệt với chiến lược nguồn mở và định vị thị trường. Đầu tháng 4, Altman chia sẻ trên X rằng OpenAI sẽ “ra mắt mô hình ngôn ngữ trọng số mở, có khả năng lý luận trong vài tháng tới”.

Năm ngoái, Wenfeng dự đoán các mô hình AI khác sẽ sớm vượt mặt ChatGPT, kể cả khi OpenAI duy trì mã nguồn đóng.

Với nhiều kỹ thuật khác nhau, DeepSeek giúp giảm đáng kể chi phí đào tạo mô hình AI. Quan trọng hơn, startup đã thúc đẩy làn sóng áp dụng AI trên khắp Trung Quốc. Dù không thể đáp ứng mọi nhu cầu, nhiều công ty lớn như Alibaba và Tencent đều bày tỏ mong muốn tích hợp DeepSeek lên sản phẩm.

11420042025_1.jpg


Dù vậy, DeepSeek vẫn đối mặt khó khăn riêng. Các mô hình mới của công ty được đặt kỳ vọng cao, trong khi bản thân startup đang gặp vấn đề khi Mỹ thắt chặt quyền tiếp cận chip tiên tiến.

Wenfeng từng tuyên bố mục tiêu cuối cùng của DeepSeek là xây dựng trí tuệ nhân tạo tổng quát (AGI), giai đoạn mà AI có thể sánh ngang, hoặc vượt qua nhận thức của con người.

“LLM sở hữu một số đặc điểm của AGI, và có thể là con đường duy nhất để đạt đến AGI”, ông cho biết. Bất kể tương lai của DeepSeek, Wenfeng đã trở thành nguồn cảm hứng cho thế hệ trẻ tại Trung Quốc.

Theo SCMP, câu chuyện của Wenfeng xuất hiện trên tấm poster tại trường tiểu học mà ông từng theo học. Giáo viên thường lấy lãnh đạo DeepSeek làm tấm gương cho sự siêng năng, cần cù.

Khi chuẩn bị viết bài luận văn học tại Trung Quốc, nhiều học sinh khẳng định sẽ lấy hình ảnh người này để minh họa lòng kiên trì, cống hiến và vượt qua nghịch cảnh.
 
Bên trên