★ wyróżnione · Podstawy AI · waga modelu

Waga modelu LLM — co to znaczy i jak wybrać model w ChatGPT, Claude i Gemini

„70B parametrów", „flagowy model", „mały i szybki" — termin waga modelu bywa rozumiany różnie. Wyjaśniamy, co znaczy technicznie, jak wpływa na jakość odpowiedzi i jak praktycznie wybrać właściwy model w każdej z głównych usług AI.

parametry GPT-5.5 Opus 4.7 Sonnet 4.6 Haiku 4.5 wybór modelu

Trzy klasy wagowe modeli LLM — mały, średni, duży. Każda ma swoje miejsce w pracy z AI.

// streszczenie

„Waga modelu LLM" oznacza dwie rzeczy: technicznie — liczbę parametrów (np. 70B = 70 miliardów), praktycznie — klasę modelu, który wybierasz w usłudze. W tym artykule pokazujemy, jak parametry wpływają na jakość, cenę i prędkość, oraz krok po kroku jak ustawić właściwy model w ChatGPT, Claude i innych płatnych usługach. Z konkretnymi rekomendacjami: kiedy mały, kiedy duży.

01 / Czym właściwie jest „waga modelu LLM"?

Termin waga modelu (ang. model weight) pochodzi z matematyki sieci neuronowych. Każdy duży model językowy składa się z miliardów liczb — to są właśnie „wagi". Każda z nich określa, jak silnie jeden „sztuczny neuron" wpływa na drugi. Razem tworzą one mapę połączeń, w której zakodowana jest cała wiedza modelu o języku, świecie i rozumowaniu.

Gdy słyszysz, że Llama ma 70B, a GPT-5.5 — według nieoficjalnych szacunków — przekracza bilion parametrów, mowa właśnie o liczbie tych wag. „B" oznacza billion (miliard po angielsku). Modele dzieli się umownie na trzy klasy:

W codziennym użyciu „waga modelu" jest też synonimem klasy — tego, który wariant wybierasz w aplikacji: Haiku, Sonnet czy Opus w Claude; Instant, Thinking czy Pro w ChatGPT. Obie definicje są poprawne i zazwyczaj idą w parze: cięższy technicznie model = wyższa klasa w usłudze.

02 / Jak parametry wpływają na to, co dostajesz?

Liczba parametrów nie przekłada się liniowo na inteligencję, ale wpływ jest realny i mierzalny. Większy model zazwyczaj:

Cenę płacisz natomiast w czterech walutach: pieniądzu (większy model = wyższa stawka za token), czasie (większy model myśli wolniej), limitach (na płatnych planach limit wiadomości szybciej się wyczerpuje) i energii (większy ślad węglowy). W maju 2026 różnice są wyraźne: Claude Haiku 4.5 generuje około 97 tokenów na sekundę i kosztuje 1 dolara za milion tokenów wejściowych, Claude Opus 4.6 — ten sam zakres pracy potrafi wykonać dokładniej, ale za 5 dolarów i znacznie wolniej.

→ Najważniejsza obserwacja 2026 roku Różnica między klasą średnią a flagową dramatycznie się zmniejszyła. Claude Sonnet 4.6 osiąga 79,6% na benchmarku SWE-bench Verified, Opus 4.6 — 80,8%. To różnica 1,2 punktu procentowego przy pięciokrotnie niższej cenie. W skrócie: dla większości zadań „średni" model w 2026 wystarczy w 95% przypadków.

03 / Konkretne modele i ich rozmiary

OpenAI, Anthropic i Google nie ujawniają oficjalnie liczby parametrów swoich flagowców. To, co podajemy poniżej, to mieszanka faktów (modele open-source) i wiarygodnych szacunków (modele zamknięte):

OpenAI · ChatGPT

Anthropic · Claude

Modele otwarte i alternatywne

04 / Jak wybrać model w ChatGPT — krok po kroku

ChatGPT w 2026 roku ma znacznie prostszy selektor niż rok wcześniej. Cały „zoo" modeli — GPT-4o, o1, o3, o4-mini — został wycofany 13 lutego 2026. Zostały trzy linie: Instant, Thinking, Pro.

Gdzie kliknąć: w aplikacji webowej lub mobilnej, na samej górze okna czatu, znajdziesz nazwę aktualnie używanego modelu. Kliknięcie otwiera model picker — listę dostępnych wariantów dla twojego planu.

Dodatkowy ważny element: ChatGPT ma tryb automatyczny. Gdy zostawisz „Instant", system sam zdecyduje, czy zwykła odpowiedź wystarczy, czy przekierować zapytanie do Thinking. Dla większości użytkowników to optymalny wybór — własnoręcznie wybiera się model tylko, gdy chce się wymusić głębsze rozumowanie albo wprost ograniczyć koszty.

05 / Jak wybrać model w Claude

Claude w 2026 utrzymał trzyklasową strukturę: Haiku, Sonnet, Opus. Każdy z nich oznacza nie tylko inną „wagę", ale też zupełnie inny styl pracy. Selektor znajdziesz w lewym górnym rogu czatu — kliknij nazwę modelu, otwiera się lista.

Claude ma też tryb Auto, który sam dobiera model do zadania. Jest wygodny, ale nieprzewidywalny — Claude potrafi sięgać po Opusa częściej, niż byś chciał, co szybko zjada limit. Doświadczeni użytkownicy ustawiają model ręcznie. Domyślnie wybieraj Sonneta. Po Opusa sięgaj, gdy Sonnet zacznie się mylić w konkretnym zadaniu — to dobry sygnał, że problem wymaga głębszego rozumowania.

W 2025 roku reguła brzmiała: „domyślnie Opus, oszczędnie Sonnet". W 2026 jest odwrotnie — Sonnet 4.6 wystarczy w 95% codziennej pracy, a Opus rezerwujemy na te zadania, gdzie różnica 1–2 punktów jakości naprawdę się liczy.

06 / Gemini, Perplexity i inne — jak to wygląda gdzie indziej

Pozostałe usługi również operują na trzech klasach wagowych, ale każdy nazywa je inaczej.

07 / Praktyczne porady — kiedy mały, kiedy duży

Reguła kciuka: zacznij od modelu lżejszego, zwiększaj wagę dopiero, gdy odpowiedź jest niewystarczająca. Konkretne scenariusze:

Sięgnij po lekki model (Haiku, GPT-5.5 Instant, Flash)

Wybierz średni model (Sonnet, GPT-5.5 Thinking, Gemini Pro)

Włącz flagowiec (Opus, GPT-5.5 Pro, Gemini Ultra)

→ Tip oszczędnościowy Na płatnym planie najszybciej spalisz limit, używając flagowca do zadań poniżej jego klasy. Generowanie pomysłów na nazwę dla bloga w Opusie to marnotrawstwo — w Sonnecie albo Haiku dostaniesz ten sam efekt za 1/5 limitu.

08 / Pułapki i mity wokół „wagi"

Mit 1: większy zawsze lepszy. W 2026 to przestaje być prawdą. Małe modele specjalistyczne (np. wyuczone dokładnie pod jeden zawód) potrafią pokonać flagowce w swojej niszy. Większy model nie zawsze oznacza lepsze odpowiedzi — często znaczy tylko droższe i wolniejsze przy podobnej jakości.

Mit 2: liczba parametrów = inteligencja. Tak samo ważne, a może ważniejsze, są: jakość danych treningowych, technika tuningu, długość treningu i architektura. Mixtral 8x7B z 47 mld aktywnych parametrów pokonuje wiele modeli 70B. DeepSeek V3 ma 671 mld parametrów, ale generuje tokeny używając tylko 37 z nich na raz — bo używa techniki Mixture of Experts.

Mit 3: model „mini" to ten sam model, tylko gorszy. Nieprawda. Wersje mini i Haiku są oddzielnie wytrenowanymi modelami, zaprojektowanymi od początku jako lekkie. Często są szybsze nie dlatego, że „mniej myślą", tylko dlatego, że mają inną architekturę.

Mit 4: kontekst i waga to to samo. Nie. To dwie różne wartości. Kontekst (okno kontekstowe) określa, ile tekstu model może jednocześnie analizować — np. 200K, 1M czy 400K tokenów. Waga mówi, ile rozumowania kryje się w pojedynczym przejściu modelu przez tekst. Możesz mieć ogromne okno kontekstowe w lekkim modelu — i odwrotnie. Optymalnie chcesz mieć oba w równowadze adekwatnej do zadania.

09 / Co zapamiętać i jak zacząć działać

Termin „waga modelu LLM" jest mostem między tym, co dzieje się w sieci neuronowej (miliardy parametrów), a tym, co widzisz w aplikacji (przełącznik Haiku / Sonnet / Opus, Instant / Thinking / Pro, Flash / Pro / Ultra). Zrozumienie tej zależności pozwala podejmować lepsze decyzje o tym, gdzie wydajesz pieniądze, czas i limity.

Praktyczna rekomendacja na najbliższe miesiące jest prosta:

Im świadomiej dobierasz „wagę", tym mniej płacisz za zachwyt, którego nie potrzebujesz, i tym częściej dostajesz odpowiedź na poziomie, na którym naprawdę ci zależy.

→ Reguła kciuka 2026 Domyślnie używaj średniej klasy modelu (Sonnet, GPT-5.5 Thinking, Gemini Pro). Po flagowiec sięgaj wyłącznie wtedy, gdy konkretne zadanie wyraźnie wykracza poza możliwości średniego modelu. Po lekki — gdy liczy się prędkość i koszt, nie jakość rozumowania.
Źródła: OpenAI · Anthropic · Google DeepMind · Meta AI · DeepSeek · Hugging Face · Artificial Analysis · 13ai.pl
← wszystkie artykuły // 13ai.pl · 2026 subskrybuj →