Kto założył ElevenLabs i skąd pochodzi firma?

ElevenLabs założyli Mateusz (Mati) Staniszewski i Piotr Dąbkowski — dwaj Polacy, którzy wcześniej pracowali w Google i Palantir. Firma ma biuro w Warszawie i Nowym Jorku. Powstała w 2022 roku.

Jaka jest wycena ElevenLabs w 2026 roku?

ElevenLabs jest wyceniane na ok. 11 mld USD po rundzie finansowania w 2025 roku. Firma osiągnęła ARR powyżej 500 mln USD i jest rentowna. To najszybciej rosnący startup audio AI na świecie.

Do czego służy ElevenLabs?

ElevenLabs to platforma audio AI oferująca: syntezę mowy (text-to-speech) w ponad 30 językach, klonowanie głosu z próbki audio, generowanie muzyki i dźwięków, agentów głosowych dla firm i API do integracji w aplikacjach. Używają jej m.in. Warner Bros., Spotify i dziesiątki tysięcy deweloperów.

Czy ElevenLabs planuje IPO?

ElevenLabs nie ogłosił oficjalnych planów IPO na 2026 rok. Firma jest rentowna i nie potrzebuje natychmiastowego wejścia na giełdę. Analitycy spekulują o możliwym IPO w 2027 roku przy wycenie przekraczającej 20 mld USD.

firmy AI · profil i historia

ElevenLabs: polski głos, który stał się infrastrukturą świata AI

W historii ElevenLabs jest coś filmowego: dwóch przyjaciół z warszawskiego liceum, wspomnienie kiepskiego dubbingu, emigracja edukacyjna do Londynu i Oksfordu, praca w Google i Palantirze — a potem firma, która w cztery lata staje się jednym z najważniejszych głosów globalnej sztucznej inteligencji. Dosłownie.

● Redakcja 13ai.pl ● 23 cze 2026 ● 22 min czytania ● Firmy AI

ElevenLabs historia ElevenLabs Mati Staniszewski Polska w AI audio AI synteza głosu klonowanie głosu ElevenLabs wycena Piotr Dąbkowski firmy AI

ElevenLabs Voice AI Mati Staniszewski Polska · IPO 2026 ElevenAgents AI Lab Poland

ElevenLabs obsługuje ponad 70 języków i 29 systemów pisma — jeden silnik głosowy, cały cyfrowy świat.

// streszczenie

ElevenLabs nie jest już tylko narzędziem do generowania lektorów. To firma, która próbuje zbudować nową warstwę interfejsu między człowiekiem a maszyną: mowę. Nie tekst, nie okno czatu, nie panel administracyjny — naturalną rozmowę. Z obsługą klienta, książką, filmem, infolinią, rządem. W 2026 roku ElevenLabs ma wycenę 11 mld dolarów, ponad 500 mln dolarów ARR i inwestorów od Sequoia Capital, przez NVIDIA, po polski fundusz Vinci z grupy BGK. To opowieść o technologii, kapitale, etyce, polskim talencie — i pytaniu, które będzie wracać coraz częściej: czy w epoce AI głos człowieka stanie się dobrem osobistym, licencjonowanym aktywem czy podstawowym interfejsem cyfrowej gospodarki?

Wielkie firmy technologiczne często zaczynają się od małej frustracji. W przypadku ElevenLabs nie była to ani rakieta, ani wyszukiwarka, ani sieć społecznościowa. Był to dubbing.

Mateusz „Mati" Staniszewski i Piotr Dąbkowski wychowali się w Polsce. Jako nastolatki chodzili do Liceum Kopernika w Warszawie — szkoły z programem International Baccalaureate, w której rozmawia się po angielsku i planuje wyjazd na studia za granicę. Tam też chodzili do kina. I tam kumulowała się irytacja: globalne filmy trafiały do Polaków w wersjach gorszych niż oryginał. Bez emocji z głosu aktora. Z płaskim lektorem. Z utraconą intencją sceny. To był problem nie tłumaczenia, lecz głosu — tego, że żaden ówczesny system nie potrafił przenieść człowieczeństwa mowy przez granicę językową.

Obaj zapamiętali tę frustrację. I dwadzieścia lat później — dojrzali, po studiach w Londynie i Cambridge, z doświadczeniami z Google'a i Palantira — zamienili ją w firmę. Tę firmę nazwali ElevenLabs. Nazwa nie jest przypadkowa: cyfra jedenaście odwołuje się do 11 listopada, polskiego Święta Niepodległości. Firma jest globalnie operacyjna — między Londynem, Nowym Jorkiem i Warszawą — ale jej mit założycielski pozostaje nieodwołalnie polski.

01 / Dwie biografie, jeden pomysł: kto zbudował ElevenLabs

Mateusz „Mati" Staniszewski urodził się w 1995 roku w okolicach Warszawy, wychował w stolicy. Po IB pojechał do Londynu — Imperial College, matematyka. Pracował kolejno w Opera Software, BlackRock (platforma Aladdin Wealth) i Palantirze, gdzie jako Deployment Strategist wdrażał złożone systemy technologiczne dla rządów i korporacji na całym świecie. Nauczył się czegoś bezcennego: jak technologia trafia do rzeczywistości, nie tylko jak działa w laboratorium. W 2025 roku dołączył jako dyrektor niewykonawczy do rady szwedzkiego fintechu Klarna — co dziś okazało się symbolicznym foresightem, bo Klarna stała się jednym z najgłośniejszych wdrożeń ElevenAgents.

Piotr Dąbkowski wychował się w Gdańsku, przeniósł do Warszawy, trafił do tej samej szkoły co Staniszewski i wyjechał do UK. Oxford i Cambridge — AI i uczenie maszynowe. Jego doktorat z wykrywania obrazów za pomocą sieci neuronowych trafił na NeurIPS, jeden z najbardziej prestiżowych kongresów ML na świecie, zanim jeszcze większość ludzi słyszała o dużych modelach językowych. Dąbkowski był inżynierem ML z prawdziwego zdarzenia — człowiekiem od architektury, od budowania modeli od podstaw. Przed ElevenLabs pracował w Google jako inżynier uczenia maszynowego.

→ Mieszanka, która zadziałała Staniszewski rozumie wdrożenia — wie, jak sprzedać technologię rządowi, bankowi i telekomowi. Dąbkowski rozumie modele — wie, jak zbudować coś, co działa lepiej niż konkurencja. To połączenie widać w ElevenLabs do dziś: z jednej strony obsesja jakości głosu, z drugiej bardzo szybkie przesuwanie produktu do klientów enterprise.

W maju 2022 roku, po kilku miesiącach rozmów i eksperymentów, Staniszewski i Dąbkowski rejestrują ElevenLabs. Przez kolejne osiem miesięcy pracują w trybie stealth — bez rozgłosu, bez mediów, bez publicznego produktu. Budują modele, testują, wyrzucają, budują od nowa. Wiedzą, że w głosie AI nie ma drugich szans na pierwsze wrażenie. Jeśli model brzmi sztucznie przez pierwszą sekundę, użytkownik wyłącza i nie wraca.

02 / Styczeń 2023: beta, viral i pierwszy kryzys

Styczeń 2023. ElevenLabs ogłasza rundę pre-seed: 2 miliony dolarów od Credo Ventures i Concept Ventures. Jednocześnie wypuszcza publiczną betę platformy Speech Synthesis. Żadnej kampanii reklamowej. Żadnej konferencji prasowej. Tylko link w internecie.

To, co stało się potem, zaskoczyło nawet założycieli. W ciągu kilku tygodni platforma staje się viralem. Twórcy contentu używają jej do audiobooków. YouTuberzy — do narracji bez konieczności nagrywania. Podcasterzye — do klonowania własnego głosu w wielu językach. Pięć miesięcy po launchu: milion użytkowników.

Moment, który według Staniszewskiego powiedział im, że są na właściwej drodze, był prosty: model zaczął samodzielnie dodawać do syntezy naturalne „yyyy" i przerwy w zdaniach. Nikt go tego nie programował. Nauczył się z danych. „Zaczęliśmy widzieć, że te ludzkie elementy są replikowane" — mówił w wywiadach. Wcześniejsze systemy TTS były użyteczne, ale martwe. ElevenLabs pokazał głos z oddechem, pauzą, napięciem, niedopowiedzeniem.

Ale błyskawiczny wzrost przyniósł też pierwszy kryzys. Już wczesną wiosną 2023 pojawiły się doniesienia o głosach znanych osób generowanych bez ich zgody na forach internetowych. Firma zderzyła się z fundamentalną prawdą rynku generatywnego AI: im bardziej realistyczna technologia, tym większa jej wartość — i tym większe ryzyko nadużyć. Ten epizod był bolesny, ale strategicznie ważny: ElevenLabs musiał zrozumieć, że nie sprzedaje zwykłego narzędzia kreatywnego. Sprzedaje technologię dotykającą tożsamości człowieka.

03 / Architektura głosu: dlaczego ElevenLabs brzmi inaczej

Żeby zrozumieć, dlaczego ElevenLabs wygrało wyścig z konkurencją, trzeba zrozumieć, co jest trudne w syntezie mowy na poziomie, na który celują założyciele. Nie chodzi o to, żeby komputer „powiedział" tekst. Chodzi o to, żeby go przekazał.

Ludzka mowa to nie zestaw fonemów. To ciągły strumień informacji emocjonalnych, intencjonalnych, społecznych. Kiedy ktoś mówi „naprawdę?" z rosnącą intonacją — wyraża zdziwienie. Z opadającą — sarkazm. Z płaską — potwierdzenie. Żaden zapis fonetyczny tego nie odda. Model musi rozumieć kontekst, żeby wiedzieć, jak to powiedzieć.

ElevenLabs rozwiązało to przez kilka warstw innowacji: modele wytrenowane na ogromnych korpusach mowy z naciskiem na emocjonalną wierność; zastosowanie transformerów i modeli dyfuzyjnych specyficznie do audio (w czasie, gdy większość badań skupiała się na tekście i obrazach); autorskie techniki kompresji głosu pozwalające na klonowanie z kilku sekund próbki; oraz system analizy kontekstualnej — model dosłownie czyta treść i decyduje, jaką intonację zastosować.

Efekt był mierzalny od początku: testerzy w ślepych testach regularnie mylili syntezę ElevenLabs z nagraniem prawdziwego człowieka. A w jednym z wewnętrznych testów model spontanicznie dodał do nagrania śmiech — nikt go tego nie uczył. Nauczył się z danych.

04 / Kapitał: od 2 milionów do 11 miliardów w cztery lata

Historia finansowania ElevenLabs jest podręcznikowym przykładem tego, jak działał rynek AI po 2022 roku — ale też czym różniły się najlepsze spółki od czystego hype'u. ElevenLabs rosło szybko nie dlatego, że tak wypadało, lecz dlatego, że miało produkt, który można było usłyszeć.

Styczeń 2023 — Pre-seed: 2 mln USD. Credo Ventures, Concept Ventures. Firma w stealth, bez produktu publicznego.
Czerwiec 2023 — Series A: 19 mln USD, wycena ~100 mln USD. Lead: a16z, Nat Friedman, Daniel Gross. Anioły: Mike Krieger (Instagram), Brendan Iribe (Oculus), Mustafa Suleyman (DeepMind), Tim O'Reilly. a16z dołącza do rady.
Styczeń 2024 — Series B: 80 mln USD, wycena 1,1 mld USD. ElevenLabs osiąga status jednorożca — od launchu beta do unicorn w mniej niż rok. Lead: a16z + Sequoia Capital. Firma ogłasza Voice Marketplace, AI Dubbing Studio i aplikację mobilną.
Styczeń 2025 — Series C: 180 mln USD, wycena 3,3 mld USD. Colead: a16z + ICONIQ Growth. Nowi inwestorzy: NEA, World Innovation Lab, Deutsche Telekom, LG Technology Ventures, HubSpot Ventures, NTT DOCOMO Ventures. NVIDIA wchodzi jako inwestor strategiczny we wrześniu 2025.
Luty 2026 — Series D (pierwsza transa): 500 mln USD, wycena 11 mld USD. Lead: Sequoia Capital (Andrew Reed do rady). a16z czterokrotnie zwiększa pozycję, ICONIQ trzykrotnie. Nowi: Lightspeed Venture Partners, Evantic Capital, BOND. Łączne finansowanie: 781 mln USD.
Maj 2026 — Series D (trzecia transa): BlackRock, Wellington Management, D.E. Shaw, Schroders; strategicznie NVIDIA (NVentures), Salesforce, Santander, KPN, Deutsche Telekom; celebryci Jamie Foxx, Eva Longoria, Matthew McConaughey, Hwang Dong-hyuk (twórca „Squid Game").
Czerwiec 2026 — Polska wraca: fundusz Vinci z grupy BGK zostaje akcjonariuszem ElevenLabs, inwestując ponad 40 mln zł. Zapowiedziano AI Lab Poland — polskie centrum technologii AI.

→ Najbardziej symboliczny ruch: Polska wchodzi kapitałowo Inwestycja Vinci nie jest największym czekiem w historii firmy. Ale politycznie i symbolicznie może być jednym z najważniejszych. Polska nie tylko „ma zdolnych założycieli za granicą" — państwo próbuje wejść kapitałowo i instytucjonalnie w firmę, która stała się globalnym aktywem, i wykorzystać ten most do budowy AI Lab Poland.

Łączne finansowanie przekroczyło 811 milionów dolarów. ARR: 500 mln USD w kwietniu 2026 (wzrost z 200 mln USD w połowie 2025 i 330 mln USD na koniec roku). Przyrost w samym Q1 2026: 100 mln USD netto — jeden z najszybszych kwartalnych wzrostów w historii startupów B2B SaaS.

05 / Najważniejsi udziałowcy: kto za tym stoi

Sequoia Capital poprowadziło rundę Series D w 2026. Andrew Reed z Sequoia — inwestor m.in. w Notion i Figmę — w radzie dyrektorów. To awans ElevenLabs do ligi firm traktowanych nie jako narzędzie, lecz jako platforma infrastrukturalna.

Andreessen Horowitz pojawia się w historii ElevenLabs od Series A i konsekwentnie zwiększa zaangażowanie. „Quadrupled down" w rundzie D. W języku venture capital to sygnał bardzo mocnego przekonania.

ICONIQ Growth współprowadziło Series C i trzykrotnie zwiększyło zaangażowanie w D. Inwestor kojarzony z późnym etapem skalowania i kontaktami w wielkim biznesie.

NVIDIA weszła we wrześniu 2025 jako inwestor strategiczny. Naturalny partner: ElevenLabs trenuje modele na GPU Nvidii i korzysta z jej infrastruktury obliczeniowej. NVIDIA ma interes w tym, by ElevenLabs rosło — każdy nowy model ElevenLabs to więcej zużytych chipów.

BlackRock, Salesforce, Deutsche Telekom, Santander — wejście inwestorów finansowych i strategicznych pokazuje, że ElevenLabs to nie startup — to infrastruktura, w którą warto mieć ekspozycję.

Vinci/BGK/Polska — udział mniejszościowy, ale strategiczny. Sygnał, że państwo chce mieć ekspozycję na jeden z najważniejszych globalnych aktywów AI założonych przez Polaków.

06 / Produkt: od generatora głosu do systemu operacyjnego audio AI

Najprostszy opis ElevenLabs brzmi: firma tworzy realistyczne głosy AI. Ale to już opis niepełny. Dziś jej oferta obejmuje text-to-speech, speech-to-text, voice cloning, dubbing, voice changer, sound effects, narzędzia dla twórców, aplikację ElevenReader, platformy dla wydawców, licencjonowane głosy, muzykę AI oraz ElevenAgents. Przesunięcie jest kluczowe: w pierwszym etapie firma sprzedawała jakość głosu. W drugim — workflow dla twórców. W trzecim — marketplace głosów. W czwartym — infrastrukturę dla przedsiębiorstw.

ElevenReader: konsumencka ambicja

Aplikacja pozwala słuchać artykułów, PDF-ów i e-booków głosami ElevenLabs. W Polsce ważnym ruchem było udostępnienie polskiej wersji z głosem AI Piotra Fronczewskiego, przygotowanym we współpracy z artystą. To przykład strategii „lokalizacji premium": nie tylko obsłużyć język, lecz wejść w kulturę.

Iconic Voice Marketplace

Jeden z najważniejszych ruchów strategicznych firmy. ElevenLabs przeszło od kryzysu wokół nieautoryzowanego klonowania do modelu: zgoda, licencja, wynagrodzenie, kontrola. Partnerstwa z Michaelem Caine'em i Matthew McConaugheyem jako przykład. To próba stworzenia legalnego rynku głosów znanych osób — w tym historycznych. Jeśli zadziała, może być nową klasą praw cyfrowych: głos jako aktywo.

ElevenAgents: największy rynek

Platforma agentów głosowych i czatowych dla firm. Agenci odbierają telefony, odpowiadają na pytania, integrują się z systemami klienta i eskalują sprawy wymagające człowieka. To właśnie tu ElevenLabs może stać się czymś znacznie większym niż „Canva dla głosu" — warstwą komunikacyjną dla przedsiębiorstw. Od kwietnia 2026 firma oferuje też on-premises deployment: wszystko na serwerach klienta, zero danych na zewnątrz. Dla banków i instytucji regulowanych to nie opcja, lecz warunek konieczny.

Darth Vader po raz ostatni: Epic Games użyło modelu ElevenLabs do odtworzenia głosu nieżyjącego Jamesa Earla Jonesa jako żywej, konwersacyjnej postaci w Fortnite — opracowanego w konsultacji z rodziną aktora. Synteza mowy weszła na terytorium, które wcześniej wymagało lat nagrań i milionów dolarów.

07 / Najważniejsze wdrożenia: przypadki, które przekonały rynek

Klarna (luty 2026): ElevenAgents jako pierwsza linia wsparcia telefonicznego dla 35 mln klientów w USA. Wynik: obsługa spraw 10 razy szybciej niż przez ludzkich agentów, 90% redukcja kosztu per ticket. To nie pilot — to produkcja.

Revolut (styczeń 2026): 45+ mln klientów, obsługa w UK i Europie. Wynik: 8-krotne skrócenie czasu rozwiązania w 30+ językach z jednej konfiguracji — bez osobnych modeli, bez osobnych konfiguracji na kraj. Jeden agent, trzydzieści języków.

Deutsche Telekom (marzec 2026): Magenta AI Call Assistant — AI nie jako aplikacja obok telefonu, ale w samej rozmowie. Wdrożenie w infrastrukturze rozmów telefonicznych jednego z największych telekomów Europy.

LOT — Polskie Linie Lotnicze (czerwiec 2026): ElevenAgents do obsługi połączeń przychodzących. Lokalnie symboliczne, biznesowo praktyczne: linie lotnicze mają ogromną liczbę powtarzalnych zapytań, ale też sytuacje wymagające eskalacji do człowieka. To gotowy schemat dla całej branży travel.

Rząd Ukrainy: wdrożenie do obsługi informacyjnej obywateli. W czasie konfliktu, gdy zasoby administracji są ograniczone, automatyzacja obsługi ma bezpośrednią wartość społeczną.

Spotify (maj 2026): partnerstwo pozwalające autorom na bezpośrednią produkcję audiobooków przez platformę. Target: 100 mln dolarów przychodu z audiobooków. ElevenLabs staje się embedded infrastructure dla największego serwisu audio na świecie.

Pełna lista: Washington Post, TIME, HarperCollins, Czech Republic (5 000 połączeń dziennie, 85% rozwiązywanych autonomicznie), Harvey (AI dla AmLaw 100 law firms), Better.com (podwojenie konwersji w hipotekach), Toyota, TVS Motor Company, Immobiliare.it i dziesiątki innych.

08 / Strategia: trzy warstwy, jeden cel

Największy błąd w analizie ElevenLabs polegałby na nazwaniu firmy „startupem od głosów". To tak, jakby w 2008 roku nazwać Apple firmą od telefonów. Produkt jest tylko pierwszym nośnikiem szerszej zmiany.

Warstwa pierwsza — modele audio. Tu liczy się jakość, ekspresja, wielojęzyczność, latencja, sterowalność, emocje, akcenty i koszt generacji. To fundament: bez wyraźnie lepszego modelu nie ma nic innego.

Warstwa druga — narzędzia i marketplace. Twórcy, wydawcy, marki i właściciele praw potrzebują nie tylko modelu, lecz workflow: wygenerować, poprawić, przetłumaczyć, opublikować, rozliczyć, licencjonować. Marketplace tworzy sieciową przewagę — im więcej twórców i głosów, tym większa wartość platformy.

Warstwa trzecia — agenci i wdrożenia enterprise. Największe budżety są tam, gdzie głos rozwiązuje realny problem kosztowy: call center, wsparcie klienta, edukacja, administracja, bankowość, podróże, media. Jeśli ElevenLabs potrafi obsłużyć rozmowy w wielu językach z niską latencją i integracją z systemami — wchodzi do kategorii znacznie większej niż generowanie lektorów.

W tym sensie strategia firmy to ruch od „narzędzia kreatywnego" do „platformy komunikacyjnej". Najpierw głos jako treść. Potem głos jako produkt. Następnie głos jako interfejs. I to ostatnie słowo — interfejs — jest kluczem. ElevenLabs nie chce być tylko tym, co słyszysz. Chce być tym, przez co rozmawiasz ze światem.

09 / Najważniejsze posunięcia strategiczne: mapa decyzji

Jakość przed kategorią. ElevenLabs weszło na rynek nie jako firma od „AI dla enterprise", lecz jako firma z produktem, który działał natychmiastowo. Głos brzmiał lepiej niż konkurencja. To stworzyło viralowy popyt i markę — bez budżetu marketingowego.

Szybkie przejście od twórców do biznesu. Wiele narzędzi generatywnej AI zatrzymało się na prosumentach. ElevenLabs nie — już po wczesnym sukcesie zaczęło budować ofertę dla wydawców, telekomów, banków i administracji.

Rynek zgody. Po kontrowersjach z deepfake'ami firma zrozumiała, że samo „mamy świetną technologię" nie wystarczy. Iconic Voice Marketplace to nie tylko produkt — to odpowiedź na ryzyko regulacyjne i reputacyjne. Zamiana największego ryzyka w kontrollowany rynek licencji.

Wejście w agentów. Naturalny krok: skoro model potrafi mówić naturalnie, kolejne pytanie brzmi — czy potrafi też działać? ElevenAgents to przejście od syntezy mowy do realizacji zadań.

Lokalność i suwerenność. On-device, on-premise, wdrożenia lokalne, huby w Warszawie, Londynie i Nowym Jorku — odpowiedź na coraz ważniejsze pytanie: gdzie są dane, kto kontroluje model, czy firma może używać audio AI bez wysyłania wszystkiego do publicznej chmury?

Partnerstwa z rządami i infrastrukturą. MoU z rządem Wielkiej Brytanii (czerwiec 2026), LOT, Deutsche Telekom, rząd Ukrainy, inwestycja Vinci — ElevenLabs chce być obecne tam, gdzie komunikacja głosowa ma skalę, zaufanie i regulacje.

10 / Ryzyka: deepfake, prawo, koszt, konkurencja

Ryzyko pierwsze: nadużycia. Im lepszy głos, tym większe ryzyko oszustw, podszywania się, manipulacji politycznych i naruszeń dóbr osobistych. Deepfake Joe Bidena w New Hampshire (styczeń 2024) pokazał, że synteza głosu może być narzędziem wpływu politycznego. W 2026 roku: siedmiu dziennikarzy i aktorów głosowych (w tym laureaci Pulitzera i Emmy) złożyło pozew w Illinois. AI Fraud Accountability Act of 2026 jest przed Senatem USA. ElevenLabs wdrożył watermarking, Reality Defender partnership i AI Speech Classifier — ale niezależni oceniają egzekucję jako „bardziej reaktywną niż proaktywną".

Ryzyko drugie: prawa do głosu i danych treningowych. Aktorzy, lektorzy i twórcy będą coraz częściej pytać: czy mój głos był użyty do treningu? Regulacje w USA, UK i UE mogą iść różnymi ścieżkami. Odrębna sprawa zbiorowa stawia firmę obok Google'a, Meta i Microsoftu w podobnym kontekście naruszenia praw autorskich.

Ryzyko trzecie: konkurencja platformowa. OpenAI, Google, Microsoft, Amazon, Meta i Apple nie oddadzą interfejsu głosowego bez walki. Big Tech ma dystrybucję, systemy operacyjne i własne modele. ElevenLabs ma markę jakości i szybkość. Pytanie: czy to wystarczy, gdy głos stanie się standardową funkcją każdego asystenta AI?

Ryzyko czwarte: ekonomika generate-at-scale. Generowanie wysokiej jakości audio w czasie rzeczywistym kosztuje. Jeśli rynek wymusi spadek cen, marże mogą być pod presją — dlatego tak ważne są wdrożenia enterprise, licencje i lokalne modele.

Ryzyko piąte: zaufanie. W głosie zaufanie jest intymniejsze niż w tekście. Ludzie reagują na ton, tempo, akcent i znajomo brzmiącą barwę. To przewaga produktu, ale też powód, dla którego błędy mogą być bardziej dotkliwe niż w jakimkolwiek innym AI.

11 / Ostatnie wydarzenia: co mówią o przyszłości firmy

Wiosna i czerwiec 2026 pokazują, że ElevenLabs przyspiesza na czterech frontach naraz.

Finanse: przekroczenie 500 mln USD ARR stawia firmę w bardzo wąskiej grupie startupów AI, które nie tylko mają imponującą wycenę, ale i realną skalę przychodów. Revenue split: 50/50 enterprise-consumer (grudzień 2025) → planowe 60/40 (grudzień 2026) → 70/30 (2027).

Enterprise: Deutsche Telekom i LOT pokazują, że voice agents wychodzą z pilotaży i wchodzą w procesy. To nie są zabawki do demonstracji — to systemy integrowane z bazami danych i procedurami obsługi klienta.

Sektor publiczny: MoU z rządem Wielkiej Brytanii (czerwiec 2026) — Wielka Brytania bada użycie voice AI w usługach publicznych, w tym walijskojęzycznym wsparciu i dostępności dla osób z niepełnosprawnościami. ElevenLabs zyskuje wiarygodność w sektorze publicznym, ale bierze na siebie większą odpowiedzialność.

Polska: inwestycja Vinci i zapowiedź AI Lab Poland to próba zamiany sukcesu emigracyjnego w element krajowego ekosystemu technologicznego. Jeśli to się uda, ElevenLabs może stać się dla polskiego AI tym, czym Skype był dla Estonii: dowodem, że z regionu można zbudować firmę światowego formatu.

12 / Zakończenie: pięć realnych ścieżek rozwoju

ElevenLabs stoi na rozdrożu charakterystycznym dla firm, które wygrały pierwszą rundę technologiczną i muszą teraz wygrać rundę kapitałową, produktową i regulacyjną jednocześnie.

Scenariusz A — Globalna platforma voice agents

Dalsza ekspansja w obsłudze klienta, call center, telekomach, podróżach, bankowości i e-commerce. ElevenLabs staje się standardowym dostawcą agentów głosowych. W tym scenariuszu firma konkuruje z platformami contact center i Big Tech — wygrywa, jeśli jakość głosu i latencja pozostają wyraźnie lepsze. Warunek: utrzymanie przewagi technologicznej i skalowanie zespołu enterprise.

Scenariusz B — Infrastruktura mediów i rozrywki

ElevenLabs staje się standardem dubbingu, audiobooków, lokalizacji gier i licencjonowanych głosów gwiazd. Spotify-partnership jako zalążek. Iconic Marketplace jako rdzeń nowej klasy praw cyfrowych. Ryzyko: prawne batalie o dane treningowe i właściwość zgody mogą zablokować kluczowe funkcje.

Scenariusz C — Audio app store

Voice Library, Music Marketplace, ElevenReader i ElevenCreative tworzą ekosystem podobny do platformy twórców. Nie tylko generujesz głos — publikujesz, zarabiasz, licencjonujesz, remiksujesz i dystrybuujesz. Im więcej twórców i głosów, tym większa wartość sieci. Klucz: zbudowanie społeczności lojalnych twórców szybciej niż konkurencja.

Scenariusz D — Partner rządów i usług publicznych

Dostępność usług publicznych, tłumaczenia, edukacja, pomoc osobom z niepełnosprawnościami, komunikacja kryzysowa. Jeśli ElevenLabs zbuduje reputację odpowiedzialnego dostawcy, może stać się jednym z niewielu startupów AI dopuszczanych do wrażliwych wdrożeń publicznych. Ryzyko: w tej kategorii każdy błąd jest bardziej polityczny niż produktowy.

Scenariusz E — IPO albo przejęcie strategiczne

Staniszewski wprost mówi o „budowaniu w kierunku IPO". Przy 500 mln USD ARR i ekspansji enterprise — wycena giełdowa mogłaby przekroczyć 20 mld USD. Jednocześnie Apple (bez dobrego głosu dla Siri), Google, Amazon, Adobe lub Salesforce widzą w ElevenLabs strategiczną warstwę audio. Pytanie: czy założyciele chcą sprzedać polską niezależność za globalną skalę?

// streszczenie końcowe

ElevenLabs zaczęło od irytacji na dubbing. Dziś próbuje zdubbingować cały cyfrowy świat. Dla twórców jest narzędziem. Dla mediów — sposobem na lokalizację i audiobooki. Dla aktorów — szansą albo zagrożeniem. Dla firm — redukcją kosztów obsługi. Dla rządów — technologią dostępności, ale też ryzykiem zaufania publicznego. Dla Polski — symbolem, że globalne AI może mieć warszawski początek. Największą siłą ElevenLabs jest to, że rozwiązuje problem bardzo stary: ludzie wolą słuchać i mówić, niż wypełniać formularze. Największym ryzykiem jest to samo — głos jest zbyt ludzki, by traktować go jak zwykły plik audio. A wtedy pytanie „kto mówi?" staje się jednym z najważniejszych pytań gospodarki AI.

Źródła: Wikipedia (ElevenLabs, Mati Staniszewski), ElevenLabs blog (Series D, Amazon partnership, Klarna case study, voice restoration pledge), CNBC, TechCrunch, Sacra Research, Tracxn, Contrary Research, Endeavor.org, GetLatka, Concept.vc, AI for Automation, FinTech Magazine, TechCoffeeHouse (stan: czerwiec 2026).

← wszystkie artykuły // 13ai.pl · 2026 subskrybuj →