Thứ năm, Tháng Một 30, 2025
HomeGiải TríCEO bí ẩn của DeepSeek, công ty AI Trung Quốc đang gây...

CEO bí ẩn của DeepSeek, công ty AI Trung Quốc đang gây sốt toàn cầu

DeepSeek do nhà quản lý quỹ đầu tư Liang Wenfeng thành lập, công bố mô hình R1 vào ngày 20/1 kèm theo một bài báo chi tiết phác thảo cách đào tạo mô hình học tăng cường (RL) quy mô lớn mà không dựa vào điều chỉnh tinh chỉnh có giám sát (SFT).

Chỉ trong vài ngày, ứng dụng DeepSeek vươn lên dẫn đầu bảng xếp hạng ứng dụng miễn phí trên iPhone ở cả Trung Quốc và Mỹ, vượt qua ChatGPT – ứng dụng cũng từng “làm mưa làm gió” sau khi ra mắt.

CEO bí ẩn của DeepSeek, công ty AI Trung Quốc đang gây sốt toàn cầu- Ảnh 1.

Liang Wenfeng, 40 tuổi (áo xám) trong buổi gặp Thủ tướng Trung Quốc.

Việc phát hành mô hình R1 của DeepSeek làm dấy lên cuộc tranh luận sôi nổi ở thung lũng Silicon về việc liệu các công ty AI của Mỹ, với nguồn lực lớn hơn rất nhiều, bao gồm Meta và OpenAI, có thể duy trì được lợi thế công nghệ hay không.

Trong khi đó, nhà sáng lập DeepSeek – Liang Wenfeng trở thành tâm điểm thảo luận ở Trung Quốc. Tuần trước, Liang được mời tham dự một hội thảo ở Bắc Kinh, nơi Thủ tướng Trung Quốc Lý Cường lắng nghe ý kiến và đề xuất từ các chuyên gia, doanh nhân và đại diện trong nhiều lĩnh vực về một bản dự thảo báo cáo công tác của chính phủ.

Vì sao DeepSeek Trung Quốc gây chấn động toàn cầu?

Liang Wenfeng là ai?

Từ Quảng Đông, Liang đến Đại học Chiết Giang, Hàng Châu để học thông tin điện tử và thị giác máy tính – một lĩnh vực AI đào tạo máy tính để nắm bắt, diễn giải thông tin từ hình ảnh và dữ liệu video. Cùng với một nhóm bạn cùng lớp đại học, Liang bắt đầu khám phá cách AI có thể được sử dụng để tự động hóa các khoản đầu tư cổ phiếu.

Kinh nghiệm này sau đó đưa Liang trở thành người đồng sáng lập High-Flyer Quant, công ty sử dụng AI để quản lý một trong những quỹ đầu tư định lượng lớn nhất Trung Quốc đại lục. High-Flyer Quant tăng tài sản được quản lý của mình gấp 10 lần trong 4 năm, từ 1 tỷ nhân dân tệ vào năm 2016 lên hơn 10 tỷ nhân dân tệ vào năm 2019.

“Trong những năm qua, High-Flyer Quant chi một phần lớn lợi nhuận vào AI để xây dựng cơ sở hạ tầng và tiến hành nghiên cứu quy mô lớn”, công ty cho biết vào tháng 4/2023. Vài tháng sau, High-Flyer Quant tách DeepSeek, công ty ra mắt một loạt mô hình AI được các nhà phát triển sử dụng để xây dựng các ứng dụng của bên thứ ba, được công ty khởi nghiệp này sử dụng để tạo ra chatbot của riêng mình.

Theo hãng truyền thông địa phương 36kr, High-Flyer Quant mua được hơn 10.000 bộ xử lý đồ họa Nvidia trước khi chính phủ Mỹ áp đặt các hạn chế về chip AI đối với Trung Quốc. Trên trang web của mình, nhà quản lý quỹ cho biết họ chi 200 triệu nhân dân tệ và 1 tỷ nhân dân tệ (khoảng 27 triệu USD và 137 triệu USD) vào năm 2020 và 2021 để xây dựng chuỗi cụm máy tính AI Fire-Flyer.

DeepSeek V3 được phát triển với ngân sách 5,58 triệu USD trong khoảng thời gian hai tháng – chỉ bằng một phần nhỏ chi phí vốn mà các công ty công nghệ khác đầu tư vào việc xây dựng LLM.

Theo CGTN , Liang Wenfeng khá kín tiếng, chỉ trả lời phỏng vấn Anyong, một thương hiệu con của công ty truyền thông công nghệ thương mại 36Kr của Trung Quốc, vào năm 2023 và 2024. CGTN đã tổng hợp lại các trích đoạn được dịch từ các cuộc phỏng vấn này, thể hiện quan điểm của Liang đối với DeepSeek nói riêng và AI nói chung.

CEO bí ẩn của DeepSeek, công ty AI Trung Quốc đang gây sốt toàn cầu- Ảnh 2.

Liang Wenfeng.

“Chủ nghĩa dài hạn” của DeepSeek

Đối với Liang, DeepSeek giống như một dự án phụ được thúc đẩy bởi sự tò mò và cam kết nghiên cứu nền tảng. Anh thừa nhận rằng nghiên cứu cơ bản thường không mang lại nhiều lợi tức đầu tư ngay lập tức, tuy nhiên anh bị thu hút bởi thách thức khám phá các lĩnh vực phức tạp như tài chính và tiềm năng của trí tuệ nhân tạo tổng hợp (AGI).

Trọng tâm của Liang là tìm hiểu bản chất của trí thông minh con người và các quá trình nền tảng của nó, tin rằng khám phá này rất quan trọng dù thiếu các động lực thương mại.

“Bản chất trí thông minh con người có thể là ngôn ngữ; suy nghĩ của con người có thể là một quá trình ngôn ngữ. Bạn nghĩ rằng bạn đang suy nghĩ, nhưng thực tế có thể bạn đang vận động ngôn ngữ trong tâm trí mình. Điều này ngụ ý rằng trí tuệ nhân tạo giống con người (AGI) có thể xuất hiện từ các mô hình ngôn ngữ lớn” , Liang nói.

Liang và đội nhóm từng thử nghiệm nhiều kịch bản và cuối cùng quyết định đi sâu vào lĩnh vực tài chính đủ phức tạp. “Đối với chúng tôi, đó là câu hỏi về cách thực hiện, không phải lý do tại sao phải thực hiện”.

Nhân tài và xây dựng đội ngũ

Hồ sơ LinkedIn của DeepSeek cho thấy công ty này có đội ngũ chưa đến 10 người. Một thành viên của nhóm được cho là đã được Lei Jun của Xiaomi chiêu mộ để phát triển AI vào tháng 12/2024.

Nói về việc tuyển dụng đội ngũ, Liang cho rằng nếu đang theo đuổi những mục tiêu ngắn hạn, thuê những người có kinh nghiệm là bước đi đúng đắn. ” Nhưng về lâu dài, kinh nghiệm ít quan trọng hơn. Kỹ năng nền tảng, sự sáng tạo và niềm đam mê mới là quan trọng. Từ góc độ này, có rất nhiều ứng viên phù hợp ở Trung Quốc”.

Liang cho rằng điều thu hút mạnh mẽ nhất đối với những tài năng hàng đầu là cơ hội giải quyết những thách thức, khó khăn lớn nhất của thế giới. “Trên thực tế, những tài năng hàng đầu ở Trung Quốc bị đánh giá thấp. Có quá ít sự đổi mới cốt lõi ở cấp độ xã hội, vì vậy họ không được công nhận. Bằng cách làm việc với những vấn đề khó khăn nhất, chúng tôi trở nên hấp dẫn họ”.

CEO bí ẩn của DeepSeek, công ty AI Trung Quốc đang gây sốt toàn cầu- Ảnh 3.

DeepSeek trên website.

Theo Fortune , Liang muốn biến DeepSeek trở thành công ty dẫn đầu trong nước về AI khi tuyển dụng nhân tài từ các trường đại học hàng đầu Trung Quốc và trả lương hậu hĩnh cho họ ngang bằng các công ty công nghệ lớn như ByteDance, công ty mẹ của TikTok.

Liang nhận định rằng sự đổi mới thường xuất hiện một cách tự nhiên, thay vì được lên kế hoạch hay được dạy. Vì vậy, đổi mới đòi hỏi sự tự do cũng như không gian cho thử nghiệm và sai sót; còn sự can thiệp và quản lý chỉ ở mức tối thiểu. Quá trình này đôi khi có thể tốn kém và không hiệu quả.

“Do đó, chỉ khi nền kinh tế đạt đến một mức độ phát triển nhất định thì đổi mới mới có thể phát triển mạnh. Khi nguồn lực khan hiếm hoặc trong ngành công nghiệp không được thúc đẩy bởi sự đổi mới, chi phí và hiệu quả là rất quan trọng. Hãy nhìn xem, OpenAI cũng phải mất rất nhiều tiền để đạt được điều đó”.

Trong các cuộc phỏng vấn, Liang nhấn mạnh nhu cầu của Trung Quốc trong việc chuyển từ bắt chước sang sáng tạo và xây dựng hệ sinh thái công nghệ của riêng mình.

“Sự đi đầu của NVIDIA không chỉ là kết quả của những nỗ lực của một công ty; đó là thành tựu chung của toàn bộ cộng đồng công nghệ và ngành công nghiệp phương Tây. Họ có thể nhìn thấy thế hệ xu hướng công nghệ tiếp theo và có lộ trình.

Sự phát triển AI của Trung Quốc cần một hệ sinh thái tương tự. Nhiều chip trong nước không phát triển được vì thiếu cộng đồng công nghệ hỗ trợ và dựa vào thông tin gián tiếp. Đó là lý do tại sao Trung Quốc phải có những người đi đầu trong công nghệ”.

Nguồn: https://kenh14.vn/ceo-bi-an-cua-deepseek-cong-ty-ai-trung-quoc-dang-gay-sot-toan-cau-215250128201858508.chn

Kenh14 Logo

Hello Mình là Cải

Theo dõi
Thông báo của
0 Góp ý
Mới nhất
Cũ nhất Được bỏ phiếu nhiều nhất
Phản hồi nội tuyến
Xem tất cả bình luận

Tin Nóng Hôm Nay