biografie · DeepSeek · AI Chiny

Liang Wenfeng — twórca DeepSeek, człowiek który rozbił mit nieograniczonych zasobów

W połowie stycznia 2025 roku nieznany szerzej Chińczyk po czterdziestce wypuścił model AI, który w ciągu tygodnia stał się najczęściej pobieraną aplikacją w USA, skasował 600 miliardów dolarów z wyceny Nvidii i zmusił cały Silicon Valley do zadania sobie pytania: czy wszystkie te miliardy były naprawdę potrzebne?

Liang Wenfeng DeepSeek DeepSeek R1 High-Flyer AI Chiny efektywność AI Zhejiang University
Liang Wenfeng — oś czasu: od Guangdong przez Zhejiang University i High-Flyer do DeepSeek-R1. Oprac. 13ai.pl
// streszczenie

Liang Wenfeng (梁文锋; ur. 1985, Wuchuan, Guangdong) — chiński przedsiębiorca technologiczny, współzałożyciel funduszu ilościowego High-Flyer i założyciel DeepSeek. Przez dekadę budował jeden z największych chińskich funduszy quant. W lipcu 2023 roku założył DeepSeek. W styczniu 2025 roku DeepSeek-R1 stał się najczęściej pobieraną aplikacją w USA, wywołując kryzys na giełdach i zmuszając przemysł AI do weryfikacji założeń o nieuchronności kosztownego skalowania.

01 / Wuchuan: prowincja, która uczy pragmatyzmu

Liang Wenfeng przychodzi na świat w 1985 roku w Wuchuan — małym mieście w prowincji Guangdong, na południu Chin. Guangdong lat osiemdziesiątych i dziewięćdziesiątych to epifenomen chińskiej reformy: pierwsza prowincja, która systemowo otworzyła się na rynek, pierwsza, gdzie zwykli ludzie zaczęli zakładać firmy, pierwsza, w której zarobić pieniądze stało się równie honorowe jak dostać się na dobry uniwersytet. Liang jest dzieckiem tego środowiska — otoczonego przedsiębiorczością, ale bardziej akademicko skłonnym niż rówieśnicy.

Jest wzorowym uczniem. Matematyka i nauki ścisłe są jego naturalnym terenem. W wieku kilkunastu lat dostaje się na Zhejiang University — jedną z najstarszych i najbardziej prestiżowych uczelni Chin, o profilu inżynierskim. Wybiera kierunek inżynierii informacyjno-komunikacyjnej na wydziale elektroniki.

To istotne: Liang nie wybiera informatyki ani AI w nowoczesnym rozumieniu tego słowa. Wybiera inżynierię, która uczy myśleć o systemach — o efektywności przesyłu sygnału, minimalizacji strat, optymalizacji w warunkach ograniczeń. Ta perspektywa stanie się kluczowa dla wszystkiego, co zrobi dwadzieścia lat później.

02 / Zhejiang University: algorytmy zamiast ideologii

Na studiach Liang szybko orientuje się, że nowe metody uczenia maszynowego pozwalają robić rzeczy, których klasyczna inżynieria nie mogła. Razem z grupą kolegów zaczyna eksperymentować z zastosowaniem metod AI do prognozowania rynków finansowych — zbierają dane o notowaniach, budują modele predykcyjne. Eksperymenty są nieudane, ale doświadczenie jest bezcenne.

Pracę magisterską kończy w 2010 roku. Temat dysertacji mówi wszystko o jego sposobie myślenia: algorytm śledzenia obiektów oparty na taniej kamerze PTZ. Nie najbardziej seksowny problem dekady. Ale zadanie postawione precyzyjnie: jak osiągnąć dobre wyniki przy ograniczonych zasobach sprzętowych.

→ Filozofia inżynieryjna „Inteligentna inżynieria to nie wydawanie dużo. To robienie więcej za mniej" — ta myśl, sformułowana przez Lianga dekadę później, ma swój zarodek już w magisterium z Zhejiang University.

03 / High-Flyer: fund, który nauczył Lianga skalowania

W 2015 roku Liang i wspólnicy zakładają High-Flyer — fundusz ilościowy z siedzibą w Hangzhou. Chińska nazwa, 幻方 (Huanfang), znaczy „magiczny kwadrat" — nawiązanie do starożytnego chińskiego obiektu matematycznego, w którym sumy w każdym wierszu, kolumnie i przekątnej są równe. Metafora jest nieprzypadkowa: w funduszu quantowym chodzi o to, żeby skonstruować układ, który zachowuje równowagę niezależnie od turbulencji.

High-Flyer od początku jest firmą technologiczną, nie finansową. Zatrudnia matematyków, fizyków i informatyków, wielu z olimpijskim doświadczeniem. Używa uczenia maszynowego do predykcji ruchów rynkowych i wykonania transakcji algorytmicznych. Do 2021 roku aktywa pod zarządzaniem High-Flyer przekraczają 100 miliardów juanów, czyniąc go jednym z trzech największych funduszy quantowych w Chinach.

Liang jest niezwykle dyskretny: nie daje wywiadów, nie pojawia się na konferencjach, nie buduje marki osobistej. Ale w cieniu tej powściągliwości dzieje się coś ważnego — Liang obserwuje globalny wyścig komputacyjny i dochodzi do wniosku, że moc obliczeniowa stanie się równie strategiczna jak kapitał.

04 / Tysiące GPU i cisza przed burzą

W latach 2019–2022 High-Flyer systematycznie rozbudowuje infrastrukturę obliczeniową. Według późniejszych raportów analitycznych firma gromadzi dziesiątki tysięcy kart GPU Nvidii — kombinację H100, H800, H20 i A100. Wśród nich H800 — wersja H100 z ograniczoną przepustowością wewnętrznych połączeń, specjalnie zaprojektowaną przez Nvidię tak, by mieściła się w limitach eksportowych USA do Chin. Liang kupuje te karty z wyprzedzeniem, zanim w październiku 2022 roku Departament Handlu USA zacieśnia kontrole eksportowe.

To nie jest przypadek ani szczęście. To kalkulacja człowieka, który rozumie, że ograniczenia zasobów staną się kluczowym czynnikiem w globalnym wyścigu AI — i który chce, żeby jego zespół miał materiał do pracy, zanim korytarz się zamknie.

→ Strategiczne wyprzedzenie Zakupy GPU realizowane przez High-Flyer przed embargiem z 2022 roku to jedna z kluczowych decyzji, które umożliwiły późniejszy skok DeepSeeka. Liang widział nadchodzące ograniczenia i działał z kilkuletnim wyprzedzeniem.

05 / DeepSeek: startup, który nie jest startupem

W maju 2023 roku High-Flyer oficjalnie ogłasza pivot. W lipcu 2023 roku Liang zakłada DeepSeek — formalnie niezależną spółkę, finansowaną wyłącznie przez High-Flyer, bez zewnętrznych inwestorów, bez rundy VC, bez deklarowanej ścieżki do IPO.

Nazwa jest programowa: 深度求索, Shēndù Qiú Suǒ — dosłownie „głębokie szukanie". Siedziba: Hangzhou. Pracownicy: głównie byli pracownicy High-Flyer, absolwenci chińskich uczelni technicznych i badacze z open-source'owych projektów AI. Według danych z 2025 roku firma zatrudnia ok. 160 osób.

DeepSeek jest instytucjonalnie bezprecedensowy. Nie ma presji kwartalnych wyników. Nie ma inwestorów wymagających roadmapy produktowej. Liang projektuje kulturę organizacyjną równie przemyślanie jak architekturę modeli: hierarchia jest płaska, każdy badacz może uzyskać dostęp do klastra GPU bez zatwierdzenia przez przełożonego.

Nasza firma jest całkowicie oddolna. Między zespołami nie ma hierarchii. Każdy odpowiada za to, w czym jest najlepszy. Dopiero kiedy pojawia się nowy postęp, zasoby są rozmieszczane z góry.

06 / DeepSeek-V2: cenowa rewolucja, której nikt nie zauważył

Pierwszym głośnym sukcesem DeepSeek jest model V2, wypuszczony w maju 2024 roku. V2 osiąga wyniki porównywalne z modelami ByteDance, Tencent, Baidu i Alibaba — przy drastycznie niższych kosztach inferencji. Liang ustala ceny tokenów DeepSeek-V2 na poziomie ułamka cen konkurencji.

Efekt jest natychmiastowy: cenowa война na chińskim rynku modeli AI. Wielcy gracze technologiczni są zmuszeni do masowych obniżek cen. Kiedy startup bez zewnętrznego finansowania może zaoferować porównywalną jakość za 1% ceny liderów rynku, cały model biznesowy oparty na „opłacie za dostęp do frontier models" zaczyna dygotać. Ale to jest preludium. Prawdziwy wstrząs nadejdzie pół roku później.

07 / DeepSeek-V3 i R1: moment Sputnika dla AI

20 grudnia 2024 roku DeepSeek publikuje V3 — model z 671 miliardami parametrów, z których jedynie 37 miliardów jest aktywnych jednocześnie, dzięki architekturze Mixture of Experts (MoE). V3 wyprzedza GPT-4o w benchmarkach matematycznych i programistycznych. Koszt treningu: według deklaracji DeepSeeka, poniżej 6 milionów dolarów — wobec setek milionów wydanych przez OpenAI i Google na porównywalne modele.

20 stycznia 2025 roku DeepSeek publikuje R1 — model z wbudowanym wnioskowaniem krok po kroku. R1 osiąga wyniki zbliżone do o1 OpenAI w matematyce, kodowaniu i logice. Tego samego dnia Liang zostaje zaproszony na zamknięte sympozjum w Pekinie, zwoływane przez premiera Li Qianga.

27 stycznia 2025 roku aplikacja DeepSeek staje się najczęściej pobieraną aplikacją w USA w sklepie Apple. Akcje Nvidii spadają o 17% — firma traci w jeden dzień prawie 600 miliardów dolarów kapitalizacji. Jest to największa jednodniowa strata w historii giełd dla pojedynczej spółki. Media na całym świecie piszą o „momencie Sputnika" dla amerykańskiej AI.

→ Skala wstrząsu rynkowego Inwestorzy zaczęli kwestionować, czy ogromne wydatki na infrastrukturę obliczeniową — rdzeń wyceny Nvidii, Microsoftu, Oracle i Broadcoma — są naprawdę konieczne, skoro DeepSeek osiągnął frontier-level quality za ułamek tych kosztów.

08 / Techniczna rewolucja: efektywność jako filozofia

Liang i jego zespół nie odkrywają nowych praw uczenia maszynowego. Dokonują czegoś innego: systematycznie kompresują znane techniki do granic możliwości. Trzy kluczowe innowacje DeepSeek-V3/R1:

Mixture of Experts (MoE) — architektura, w której model ma 671 miliardów parametrów, ale każdy token aktywuje tylko 37 miliardów z nich. Zamiast jednej dużej sieci, dziesiątki wyspecjalizowanych podsieci aktywowane selektywnie przez router. Wynik: dramatycznie niższe koszty inferencji przy zachowaniu jakości.

Multi-Head Latent Attention (MLA) — technika kompresji kluczowych macierzy w mechanizmie uwagi. MLA redukuje rozmiar KV cache, który jest głównym wąskim gardłem pamięci przy obsłudze długich kontekstów. Co znamienne: MLA powstała z osobistego zainteresowania młodego badacza — nie z planowania projektowego. To jest dowód na to, że kultura DeepSeek działa.

Uczenie przez wzmocnienie zamiast polegania wyłącznie na etykietowanych danych. R1 uczy się rozumować przez samodzielne generowanie i weryfikację łańcuchów myślowych — podobnie jak AlphaGo uczyło się Go przez granie ze sobą.

Musimy być oryginalnym innowatorem, nie naśladowcą. Kluczowe technologie AI nie zostaną nam po prostu oddane. Musimy je tworzyć sami.

09 / Kontrowersje: chipy, koszty i geopolityka

Rzeczywiste zasoby obliczeniowe. Liang twierdził, że V3 kosztował mniej niż 6 milionów dolarów w GPU-compute. Firma analityczna SemiAnalysis, powołując się na anonimowe źródła branżowe, szacuje, że High-Flyer posiada łącznie 50 000 kart GPU — w tym H100, oficjalnie objęte embargiem eksportowym USA na Chiny. RAND Corporation zauważa, że paradoks efektywności DeepSeeka może być pozorny: żeby nauczyć się robić dużo za mało, najpierw trzeba mieć dużo.

Dostępność zakazanych chipów. Raporty sugerują, że DeepSeek trenował niektóre modele na H100 — chipach formalnie objętych eksportowymi ograniczeniami USA. Liang ani DeepSeek nie odnieśli się do tych doniesień bezpośrednio. Kwestia pozostaje otwarta, a jej geopolityczne znaczenie jest oczywiste.

Porównywalność wyników. Dario Amodei z Anthropic publicznie kwestionował, czy V3 jest naprawdę na poziomie frontier models. Niezależnie od tej debaty efekt rynkowy był rzeczywisty i trwały. Liang znalazł się w zestawieniu Fortune Most Powerful People 2025 jako nowy wpis — z adnotacją, że był to najbardziej szokujący rozwój AI w tym roku.

10 / Kim jest Liang Wenfeng

Na tle głośnych CEO globalnego AI — Altmana, Muska, Pichai — Liang jest zjawiskiem osobnym. Udziela wywiadów wyłącznie chińskim mediom branżowym, i to rzadko. W wywiadach mówi o sobie jako o badaczu, nie o liderze biznesowym. Czyta papiery naukowe, pisze kod, uczestniczy w dyskusjach grupowych.

Kiedy w lutym 2025 roku wraca do rodzinnej wsi w Guangdong na Chiński Nowy Rok — z obstawą ochroniarzy, bo jest już bohaterem narodowym — sąsiedzi wspominają go jako spokojnego, pracowitego człowieka, który zawsze wracał do domu. Jego filozofia dla DeepSeek jest prosta do sformułowania, trudna do wdrożenia: Chiny muszą przestać być odbiorcą zachodnich innowacji technologicznych i stać się ich współtwórcą. Nie przez kopiowanie. Przez oryginalne badania.

Ekscytująca rzecz nie może być mierzona wyłącznie tym, ile jest warta. Naprawdę ważne pytania nie mają jeszcze odpowiedzi — i właśnie dlatego są naprawdę ważne.
// streszczenie końcowe

Liang Wenfeng to twórca DeepSeek i współzałożyciel High-Flyer — funduszu quantowego, którego infrastruktura obliczeniowa stała się fundamentem laboratorium AI. W styczniu 2025 roku DeepSeek-R1 wywołał globalny wstrząs: stał się najczęściej pobieraną aplikacją w USA i skasował setki miliardów z wyceny Nvidii, podważając dominujący paradygmat skalowania przez kosztowny compute. Jego kluczowe przesłanie — że efektywność algorytmiczna może zastąpić brute-force scaling — jest najważniejszą hipotezą w debacie o przyszłości AI.

Źródła: Wikipedia · Reuters · Fortune Most Powerful People 2025 · Britannica · CSIS · RAND Corporation · SemiAnalysis · ChinaTalk Media · Entrepreneur.com · AI Speakers Agency · Our China Story · FinTech Weekly
← wszystkie artykuły // 13ai.pl · 2026 subskrybuj →