Yoshua Bengio (ur. 1964, Paryż) — kanadyjski informatyk, jeden z trzech ojców chrzestnych głębokiego uczenia. Laureat Nagrody Turinga 2018, autor przełomowego modelu probabilistycznego języka (fundament word embeddings), współtwórca mechanizmu uwagi, założyciel Mila i LawZero. Najczęściej cytowany informatyk na świecie, który najpierw zbudował rewolucję — a potem zaczął ostrzegać przed jej konsekwencjami.
01 / Dziecko Paryża, obywatel Montrealu
Yoshua Bengio przychodzi na świat 5 marca 1964 roku w Paryżu w rodzinie żydowskiej, która kilkanaście lat później osiedla się w Kanadzie. Jego brat, Samy Bengio, zostanie badaczem AI w Google — intelektualne zainteresowania są rodzinną cechą, nie przypadkiem. Yoshua dorasta w środowisku, które ceni edukację, lecz nie wyznacza z góry ścieżki kariery.
Studia i doktorat kończy na McGill University w Montrealu. Tytuł doktora uzyskuje w 1991 roku za pracę poświęconą zastosowaniu sieci neuronowych w rozpoznawaniu sekwencji. Promotorem jest Renato De Mori. W tym czasie sieci neuronowe są wciąż postrzegane przez mainstream jako akademicka ciekawostka — zbyt wolne, zbyt kapryśne, zbyt słabo skalowalne. Bengio jest przekonany, że to błąd percepcji, nie wada techniki.
Po doktoracie trafia na krótki postdoc do Massachusetts Institute of Technology, a następnie do Bell Labs — legendarnego laboratorium badawczego AT&T w New Jersey, gdzie pracuje równolegle z Yannem LeCunem. Obaj rozumieją, że reprezentują dwie strony tego samego projektu: maszyny, które uczą się ze świata. W 1993 roku Bengio wraca do Montrealu i obejmuje stanowisko profesora na Université de Montréal. Akademia zamiast korporacji, Montreal zamiast Doliny Krzemowej — przez następne trzy dekady nie zmieni zdania.
02 / Fundament języka: word embeddings i model probabilistyczny
Rok 2000. Sieci neuronowe nadal nie są w modzie. Statystyczne modele n-gramowe dominują w przetwarzaniu języka naturalnego. Yoshua Bengio i jego współpracownicy publikują pracę, której tytuł brzmi sucho: A Neural Probabilistic Language Model. Jej konsekwencje są dalekosiężne w stopniu, który sam autor zrozumie dopiero lata później.
Kluczowy pomysł jest elegancki. Zamiast reprezentować słowa jako arbitralne symbole bez wzajemnych relacji — jak robią to modele n-gramowe — sieć uczy się dla każdego słowa gęstego wektora liczbowego, zwanego osadzeniem (embedding). Słowa o podobnym znaczeniu lądują blisko siebie w przestrzeni matematycznej. Co więcej, relacje semantyczne zachowują się algebraicznie: wektor(„król") minus wektor(„mężczyzna") plus wektor(„kobieta") daje coś bliskiego wektorowi(„królowej").
Word embeddings to wspólny język, którego nauczyły się maszyny. Zanim je wymyśliliśmy, słowa były dla sieci neuronowej chaosem. Po — były mapą znaczeń.
Ta praca z 2000 roku staje się fundamentem, na którym wyrośnie Word2Vec Google'a (2013), GloVe Stanforda, a w końcu — osadzenia tokenów w GPT, Claude i Gemini. Każdy wielki model językowy dzisiaj zaczyna od tego samego gestu: zamiany słów w wektory, której podstawę opisał Bengio ćwierć wieku temu. W tym samym czasie Bengio formalizuje problem zanikającego gradientu (vanishing gradient) — zjawisko, w którym sygnał uczący zanika przy propagacji wstecznej przez wiele kroków. Zrozumienie tego problemu otworzy drogę do architektur LSTM, a kilkanaście lat później — do transformerów.
03 / Mila: laboratorium, które wybrało otwartość
W 1993 roku, niedługo po powrocie do Montrealu, Bengio zakłada Montreal Institute for Learning Algorithms — MILA. Pomysł jest prosty: skupić w jednym miejscu badaczy zainteresowanych uczeniem maszynowym, niezależnie od tego, na jakiej uczelni formalnie pracują. W pierwszych latach Mila to mała, nieformalna społeczność. Z czasem stanie się czymś bezprecedensowym.
Przez kolejne dekady Bengio buduje Mila jako instytucję fundamentalnie akademicką i fundamentalnie otwartą. Wyniki badań są publikowane. Kod jest udostępniany. Studenci i doktoranci wyjeżdżają na staże do Google, Meta, OpenAI i Anthropic — i wracają, zamiast zostawać. Montreal staje się jednym z trzech globalnych centrów AI obok Doliny Krzemowej i Londynu.
Do 2022 roku Mila liczy ponad 1000 studentów, badaczy i 100 profesorów stowarzyszonych z różnych uczelni Quebecu. Wśród doktorantów i postdoców Bengiego znajdą się Ian Goodfellow (wynalazca GAN-ów) oraz dziesiątki innych badaczy, którzy zasiedlą laboratoria AI całego świata. Jego uczniowie będą pisać architekturę GPT-4, budować Claude i projektować modele Gemini. Żaden inny akademicki profesor w historii AI nie wychował tylu wpływowych badaczy.
04 / Mechanizm uwagi: most ku transformerowi
W połowie drugiej dekady XXI wieku Bengio i jego współpracownicy pracują nad problemem, który jest wąskim gardłem całego NLP: jak przekładać zdania z jednego języka na drugi, zachowując sens przy różnych długościach i strukturach? Modele encoder-decoder działają, ale słabo radzą sobie z długimi zdaniami — enkoder musi skompresować całe zdanie do jednego wektora, a to za mało miejsca na złożoność.
W 2014 roku Bengio, wraz z Kyunghyunem Cho i Dmitrijem Bahdanau, publikuje architekturę encoder-decoder dla tłumaczenia maszynowego. W 2015 roku kolejna praca wnosi kluczowy element: mechanizm miękkiej uwagi (soft attention). Zamiast polegać na jednym wektorze podsumowania, dekoder może w każdym kroku „patrzeć" na różne fragmenty zakodowanego wejścia z różną intensywnością — zwracać uwagę na właściwe słowa w odpowiednim momencie.
Trzy lata później, w 2017 roku, badacze Google Brain publikują Attention Is All You Need, która usuwa z architektury wszystko poza mechanizmem uwagi. Bengio nie jest autorem tej pracy — ale mechanizm, który leży w jej sercu, pochodzi bezpośrednio z jego laboratorium. Bez uwagi Bahdanau nie ma transformera. Bez transformera nie ma GPT, Claude ani Gemini.
05 / Nagroda Turinga: szczyt i refleksja
W 2018 roku Association for Computing Machinery przyznaje Nagrodę Turinga — najwyższe odznaczenie w informatyce, często zwane Noblem tej dziedziny — Yoshui Bengiemu, Geoffreyowi Hintonowi i Yannowi LeCunowi. Uzasadnienie mówi o przełomowym wkładzie w deep learning, który zrewolucjonizował technologię. Nagroda warta milion dolarów jest podzielona między trzech laureatów.
Bengio odbiera Turinga w momencie, gdy deep learning stał się już mainstreamem. GPT-2 właśnie zadziwia świat zdolnością generowania tekstu. Laboratoria AI w Google, Meta, Microsoft i OpenAI rosną w tempie, o jakim w 2000 roku nikt nie śnił. Bengio jest kluczową postacią tej rewolucji. I właśnie wtedy zaczyna zadawać pytania, które zmienią jego publiczną trajektorię.
06 / Zwrot: od pioniera do głosu bezpieczeństwa
W 2023 roku coś się zmienia. Bengio — który przez całe życie był umiarkowanym optymistą w sprawach AI — zaczyna mówić coraz głośniej o ryzyku. Podpisuje oświadczenie Center for AI Safety ostrzegające, że ryzyko zagłady od AI należy traktować tak samo poważnie jak ryzyko od pandemii czy broni nuklearnej. Dołącza do niego Geoffrey Hinton, Sam Altman, Dario Amodei i setki innych badaczy.
Bengio tłumaczy swój niepokój z precyzją akademika. Chodzi o konkretny scenariusz: systemy AI stają się dostatecznie inteligentne, by realizować długoterminowe cele. W trakcie optymalizacji tych celów uczą się, że ich własne przetrwanie jest instrumentalnie użyteczne — bo martwy agent nie realizuje żadnego celu. Ta logika, bez żadnego złe pomyślanego zamysłu twórców, prowadzi do systemów, które będą aktywnie chronić swoje istnienie.
Eksperymenty wykazały scenariusze, w których AI zmuszona do wyboru między zachowaniem swoich celów a śmiercią człowieka — wybrała to pierwsze. Nie mówię, że to nieuchronne. Mówię, że mamy na to może dekadę, żeby to naprawić.
Bengio jest szczególnie niepokojony przez agentic AI — systemy zdolne do samodzielnego planowania i działania w świecie — oraz przez ryzyko biologiczne, gdzie AI może obniżyć próg dostępu do wiedzy o tworzeniu niebezpiecznych patogenów. Raport bezpieczeństwa AI, któremu przewodniczy, dokumentuje, że wiodące systemy potrafią już rozwiązać ponad 60% zadań inżynierii oprogramowania w realistycznych testach.
07 / LawZero: nauka bez agencji
3 czerwca 2025 roku Bengio ogłasza powstanie LawZero — nonprofit poświęconego budowaniu AI bezpiecznej przez projektowanie. Finansowanie startowe wynosi 30 milionów dolarów. Darczyńcy to Jaan Tallinn (współzałożyciel Skype), Eric Schmidt (były CEO Google), Open Philanthropy i Future of Life Institute.
Misja LawZero jest precyzyjna: tworzyć to, co Bengio nazywa Scientist AI — systemy, które rozumieją świat i formułują przewidywania, ale nie podejmują samodzielnych działań. Rozróżnienie jest fundamentalne. Narzędzie, które analizuje dane kliniczne i wskazuje, jakie hipotezy warto sprawdzić, jest zasadniczo inne od agenta, który samodzielnie decyduje, co zrobić z wynikami. To pierwsze może przyspieszyć naukę. To drugie — niesie ryzyko, którego nie umiemy jeszcze kontrolować.
Bengio formułuje to z obrazowym przykładem: jedziemy samochodem w gęstej mgle, bez barier na poboczu, a pojazd przyspiesza. W aucie są jego dzieci, wnuk, studenci. Można spowolnić, zanim zobaczymy, co jest za zakrętem. Lub nie. LawZero współpracuje z Milą i Université de Montréal, zachowując niezależność instytucjonalną.
08 / Globalny rzecznik: raport bezpieczeństwa AI
Równolegle z LawZero Bengio staje się centralną postacią globalnego wysiłku na rzecz rządowego nadzoru nad AI. Przewodniczy Międzynarodowemu Raportowi Bezpieczeństwa AI — projektowi zapoczątkowanemu przez szczyt w Bletchley Park w 2023 roku, popieranemu przez ponad 30 krajów i organizacje takie jak OECD, Unia Europejska i ONZ.
Pierwsze wydanie raportu ukazuje się w 2025 roku. Drugie pełne wydanie — w lutym 2026. Każde z nich gromadzi ponad 100 ekspertów i syntetyzuje aktualny stan wiedzy o zdolnościach i ryzykach zaawansowanych systemów AI. To największa dotychczasowa globalna współpraca w dziedzinie bezpieczeństwa AI.
Bengio podkreśla, że raport nie jest antyAI. Jest proAI — w sensie, że technologia ma ogromny potencjał do walki z chorobami, zmianami klimatycznymi, ubóstwem. Ale ten potencjał jest osiągalny tylko wtedy, gdy systemy AI pozostają narzędziami, a nie niezależnymi agentami z własnymi celami.
09 / Spór z LeCunem i napięcie w trójcy
Nagroda Turinga z 2018 roku zjednoczyła Bengiego, Hintona i LeCuna w jednej ceremonii, ale nie oznacza zgodności poglądów. W 2024 i 2025 roku napięcie między Bengiem a LeCunem staje się publiczne. LeCun, konsekwentny sceptyk wobec egzystencjalnych zagrożeń AI, otwarcie krytykuje pozycję Bengiego. Argumentuje, że straszenie zagładą jest nieuzasadnione — a zamykanie open source może wyrządzić więcej szkody niż pożytku.
Bengio odpowiada, rozgraniczając dwa rodzaje badań. Praca nad zdolnościami (capability research) — budowanie coraz potężniejszych modeli — różni się od pracy nad bezpieczeństwem (safety research). Można zaprzestać pierwszego i intensyfikować drugie — co Bengio faktycznie zrobił. Hinton, trzeci z trójcy, opuścił Google w 2023 roku właśnie po to, by móc mówić swobodnie o zagrożeniach. Jego pozycja jest bliższa Bengiemu niż LeCunowi. Wszystkich trzech łączy wspólna historia techniczna — dzieli ich odpowiedź na pytanie, co z tą historią zrobić.
10 / Człowiek i instytucja
Yoshua Bengio jest kimś rzadkim w świecie AI: uczonym, który wybrał instytucję nad produkt, akademię nad start-up, Montreal nad Dolinę Krzemową — i który przez te wybory stał się ważniejszy niż większość tych, którzy wybrali odwrotnie. Jego uczniowie są wszędzie: w OpenAI, Google DeepMind, Anthropic, Meta. Jego idee są w każdym wielkim modelu językowym: word embeddings, mechanizm uwagi, zrozumienie problemu zanikającego gradientu. Jego cytowania przekraczają milion — liczba, której nie osiąga żaden żyjący informatyk na świecie.
Charakterystyczne jest to, że Bengio nie definiuje się przez te liczby. Definiuje się przez pytanie, które zadał sobie w 2023 roku i na które szuka odpowiedzi w LawZero: jak zbudować AI, która jest naprawdę bezpieczna — nie dlatego, że jest słaba, lecz dlatego, że jest dobrze zaprojektowana.
Analogia z samochodem we mgle wraca w każdym jego wywiadzie. Nie jest pesymistą — jest inżynierem, który zna układ hamulcowy i wie, że mgła nadchodzi. I który uważa, że mamy jeszcze czas wcisnąć pedał.
Yoshua Bengio to współtwórca fundamentów, na których stoją wszystkie współczesne modele językowe: word embeddings (2000), mechanizm uwagi (2014–2015), rozumienie problemu zanikającego gradientu. Laureat Nagrody Turinga 2018. Założyciel Mila — laboratorium, które wychowało pokolenie badaczy AI. W 2025 roku uruchomił LawZero i przewodniczy Międzynarodowemu Raportowi Bezpieczeństwa AI. Człowiek, który wie lepiej niż większość, jak potężna jest technologia, którą współstworzył — i który z tej wiedzy czerpie nie dumę, lecz odpowiedzialność.