Thế Giới

CEO bí ẩn của DeepSeek công ty về công nghệ AI của Trung Quốc đang gây sốt toàn cầu

Tuesday, 28/01/2025 - 08:00:19

Tạo dựng một công cụ AI mang tên DeepSeek với giá chưa tới $6 triệu đô la nhưng CEO Liang Wenfeng của công ty này khá kín tiếng, hiếm khi xuất hiện và chỉ được biết đến qua vài cuộc phỏng vấn vào năm 2023 và 2024.

DeepSeek
Liang Wenfeng xuất hiện hiếm hoi trong một hội nghị về AI


DeepSeek do nhà quản lý quỹ đầu tư Liang Wenfeng thành lập, công bố mô hình R1 vào ngày 20/1 vừa qua kèm theo một bài báo chi tiết phác thảo cách đào tạo mô hình học tăng cường (RL) quy mô lớn mà không dựa vào điều chỉnh tinh chỉnh có giám sát (SFT).

Chỉ trong vài ngày, ứng dụng DeepSeek vươn lên dẫn đầu bảng xếp hạng ứng dụng miễn phí trên iPhone ở cả Trung Quốc và Mỹ, vượt qua ChatGPT - ứng dụng cũng từng "làm mưa làm gió" sau khi ra mắt.

Việc phát hành mô hình R1 của DeepSeek làm dấy lên cuộc tranh luận sôi nổi ở thung lũng Silicon về việc liệu các công ty AI của Mỹ, với nguồn lực lớn hơn rất nhiều, bao gồm Meta và OpenAI, có thể duy trì được lợi thế công nghệ hay không.

Trong khi đó, nhà sáng lập DeepSeek - Liang Wenfeng trở thành tâm điểm thảo luận ở Trung Quốc. Tuần trước, Liang được mời tham dự một hội thảo ở Bắc Kinh, nơi Thủ tướng Trung Quốc Lý Cường lắng nghe ý kiến và đề xuất từ các chuyên gia, doanh nhân và đại diện trong nhiều lĩnh vực về một bản dự thảo báo cáo công tác của chính phủ.

Vì sao DeepSeek Trung Quốc gây chấn động toàn cầu? và CEO Liang Wenfeng là ai?

Từ Quảng Đông, Liang đến Đại học Chiết Giang, Hàng Châu để học thông tin điện tử và thị giác máy tính – một lĩnh vực AI đào tạo máy tính để nắm bắt, diễn giải thông tin từ hình ảnh và dữ liệu video. Cùng với một nhóm bạn cùng lớp đại học, Liang bắt đầu khám phá cách AI có thể được sử dụng để tự động hóa các khoản đầu tư cổ phiếu.

Kinh nghiệm này sau đó đưa Liang trở thành người đồng sáng lập High-Flyer Quant, công ty sử dụng AI để quản lý một trong những quỹ đầu tư định lượng lớn nhất Trung Quốc đại lục. High-Flyer Quant tăng tài sản được quản lý của mình gấp 10 lần trong 4 năm, từ 1 tỷ nhân dân tệ vào năm 2016 lên hơn 10 tỷ nhân dân tệ vào năm 2019.

"Trong những năm qua, High-Flyer Quant chi một phần lớn lợi nhuận vào AI để xây dựng cơ sở hạ tầng và tiến hành nghiên cứu quy mô lớn", công ty cho biết vào tháng 4/2023. Vài tháng sau, High-Flyer Quant tách DeepSeek, công ty ra mắt một loạt mô hình AI được các nhà phát triển sử dụng để xây dựng các ứng dụng của bên thứ ba, được công ty khởi nghiệp này sử dụng để tạo ra chatbot của riêng mình.

Theo hãng truyền thông địa phương 36kr, High-Flyer Quant mua được hơn 10,000 bộ xử lý đồ họa Nvidia trước khi chính phủ Mỹ áp đặt các hạn chế về chip AI đối với Trung Quốc. Trên trang web của mình, nhà quản lý quỹ cho biết họ chi 200 triệu nhân dân tệ và 1 tỷ nhân dân tệ (khoảng $27 triệu USD và $137 triệu USD) vào năm 2020 và 2021 để xây dựng chuỗi cụm máy tính AI Fire-Flyer.

DeepSeek V3 được phát triển với ngân sách tiền chỉ $5.58 triệu USD trong khoảng thời gian hai tháng - chỉ bằng một phần nhỏ chi phí vốn mà các công ty công nghệ khác đầu tư vào việc xây dựng LLM.

Theo CGTN , Liang Wenfeng khá kín tiếng, chỉ trả lời phỏng vấn Anyong, một thương hiệu con của công ty truyền thông công nghệ thương mại 36Kr của Trung Quốc, vào năm 2023 và 2024. CGTN đã tổng hợp lại các trích đoạn được dịch từ các cuộc phỏng vấn này, thể hiện quan điểm của Liang đối với DeepSeek nói riêng và AI nói chung.

The VTC

Viết bình luận đầu tiên

Advertisement

MỚI CẬP NHẬT