Gemini 2.0 Ultra potrafi rozmawiać o filmach wideo na żywo z opóźnieniem poniżej 2 sekund. Nowa architektura mixture-of-experts pozwala na równoległe przetwarzanie tekstu, obrazu i dźwięku bez separacji modeli. Dostępny w Google One AI Premium od 30 kwietnia.
Claude 3.7 Sonnet wprowadza tryb „extended thinking" — model może przed odpowiedzią przez kilkadziesiąt sekund analizować problem w wewnętrznym łańcuchu myślenia. Kontekst rozrósł się do 400K tokenów, a wyniki na GPQA Diamond wynoszą 87,2%.
Llama 4 Scout to architektura mixture-of-experts (17 miliardów aktywnych parametrów spośród 109 miliardów) umożliwiająca 10-milionowe okno kontekstowe na kartach RTX 4090. Meta jednocześnie opublikowała wyniki modelu na benchmarkach wskazujące na przewagę nad GPT-4o w długich dokumentach.
Mistral AI zamknął rundę przy wycenie 10 miliardów euro — największa europejska runda w historii sektora AI. Inwestorzy: BNP Paribas, Caisse des Dépôts (Francja), KfW Capital (Niemcy). Cel: budowa europejskiej alternatywy dla OpenAI i Anthropic z silną ochroną danych osobowych obywateli UE.
GPT-5 Turbo kosztuje 2 dolary za milion tokenów wejściowych wobec 15 dolarów za GPT-5, zachowując 94% wydajności na kluczowych benchmarkach. OpenAI stosuje technikę „speculative decoding" przyspieszającą generowanie o 3,2x. Dostępny od 18 kwietnia w API i ChatGPT Plus.
DeepSeek R3 publikuje wyniki wskazujące na HumanEval 94,1% — wyżej niż GPT-5 Turbo i tuż poniżej Claude 3.7 Sonnet. Szacowany koszt trenowania: 6 milionów dolarów. Chiński regulator od razu oznaczył model jako „strategiczny zasób państwowy" i ograniczył eksport wag.
Platforma ogłosiła przekroczenie progu 10 milionów publicznych repozytoriów modeli, zbiorów danych i aplikacji AI. 62% pochodzi spoza USA. CEO Clem Delangue ogłasza misję „demokratyzacji AI poprzez otwartość" i plany wejścia na giełdę w 2027 roku przy szacowanej wycenie 10 miliardów dolarów.
Raport Global AI Impact 2026 firmy McKinsey wskazuje, że w 87% badanych korporacji Fortune 500 co najmniej jedna kategoria zadań biurowych została zautomatyzowana przez AI w stopniu powyżej 50%. Najszybciej automatyzują się: analiza dokumentów, pierwsza linia obsługi klienta i raportowanie finansowe.
Gemma 3 27B osiąga MMLU 82,4% i działa na kartach graficznych z 24 GB VRAM przy kwantowaniu 4-bit. Google jednocześnie ogłasza licencję pozwalającą na komercyjne wykorzystanie bez ograniczeń poniżej 200 milionów żądań miesięcznie — sygnał walki o ekosystem deweloperów z Metą i Mistral.
Urząd Cyberspace Administration of China opublikował przepisy wymagające od wszystkich dostawców AI w Chinach dodawania niewidocznych cyfrowych znaków wodnych do generowanych treści. Firmy mają 90 dni na dostosowanie. Europejscy regulatorzy bacznie obserwują — podobne przepisy rozważane w ramach nowelizacji AI Act.
Perplexity ogłosiło 500 milionów dolarów rundę Series D z SoftBank Vision Fund 3 jako głównym inwestorem. Firma raportuje 100 milionów aktywnych użytkowników miesięcznie i 250 milionów dolarów ARR. CEO Aravind Srinivas zapowiada własny model językowy i rezygnację z zewnętrznych LLM do końca 2026.
NVIDIA ogłosiła H200 Ultra z pamięcią HBM3e 192 GB i przepustowością 9,6 TB/s — wzrost o 60% względem standardowego H200. Chip jest przede wszystkim odpowiedzią na rosnące zapotrzebowanie na inference dla modeli 400B+. Cena za serwer DGX H200 Ultra: 370 000 dolarów. Zamówienia do końca roku wyprzedane.