Szczegółowa treść
Czym jest GPT-5.5 i czym różni się od poprzednich modeli OpenAI
GPT-5.5 to model językowy wydany przez OpenAI w kwietniu 2026 roku, stanowiący kolejny krok w rozwoju rodziny GPT. W porównaniu z GPT-5.4 model osiąga wyższe wyniki w testach Terminal-Bench 2.0 (82,7% wobec 75,1%), Expert-SWE (73,1% wobec 68,5%) oraz GDPval (84,9% wobec 83,0%), zachowując przy tym identyczną latencję per-token w rzeczywistym ruchu serwowym. Mniejsza liczba tokenów potrzebna do wykonania tych samych zadań w Codex sprawia, że GPT-5.5 jest nie tylko wydajniejszy, ale i tańszy w użyciu. Na indeksie Artificial Analysis Coding Index model osiąga inteligencję na poziomie state-of-the-art przy połowie kosztu konkurencyjnych modeli frontier do kodowania.
Kodowanie i inżynieria oprogramowania
Największe różnice między GPT-5.5 a poprzednimi wersjami dotyczą programowania. Model radzi sobie z zadaniami wymagającymi planowania, iteracji i koordynacji narzędzi. Na Terminal-Bench 2.0, benchmarku testującym złożone workflow wiersza poleceń, GPT-5.5 osiągnął 82,7%. Na SWE-Bench Pro, mierzącym rozwiązywanie rzeczywistych zgłoszeń z GitHub, model osiągnął 58,6%, rozwiązując więcej zadań end-to-end w jednym przebiegu. Na wewnętrznym benchmarku Expert-SWE, gdzie mediana szacowanego czasu wykonania przez człowieka wynosi 20 godzin, GPT-5.5 również przewyższa GPT-5.4.
Wczesne testy wskazują na lepsze radzenie sobie z utrzymywaniem kontekstu w dużych systemach, rozumowaniem przez niejednoznaczne błędy i weryfikacją założeń za pomocą narzędzi. Inżynierowie z NVIDIA, Lovable i Every potwierdzili, że model wykazuje zauważalnie wyższą autonomię i jakość planowania. Dan Shipper, CEO Every, opisał GPT-5.5 jako pierwszy model kodujący z rzeczywistą jasnością konceptualną. Pietro Schirano, CEO MagicPath, zaobserwował, że model scalił branch z setkami zmian frontendowych i refaktoryzacyjnych w około 20 minut.
Praca z komputerem i automatyzacja zadań
GPT-5.5 wykazuje wyraźny postęp w obsłudze komputera. Na benchmarku OSWorld-Verified, mierzącym zdolność modelu do samodzielnego operowania środowiskami komputerowymi, osiągnął 78,7%. Na GDPval, testującym zdolność agentów do wykonywania pracy biurowej w 44 zawodach, model uzyskał 84,9%. Na Tau2-bench Telecom, oceniającym workflow obsługi klienta, osiągnął 98,0% bez strojenia promptów.
W Codex model generuje dokumenty, arkusze kalkulacyjne i prezentacje lepiej niż GPT-5.4. Wewnątrz OpenAI ponad 85% pracowników korzysta z Codexu co tydzień. Zespół Communications użył GPT-5.5 do analizy danych o wystąpieniach z sześciu miesięcy, budowy systemu scoringowego i walidacji agenta Slack. Zespół Finance przetworzył 24 771 formularzy K-1 obejmujących 71 637 stron, przyspieszając zadanie o dwa tygodnie względem roku poprzedniego.
Badania naukowe i cyberbezpieczeństwo
Model wykazuje postęp w wczesnych etapach badań naukowych. Brandon White, współzałożyciel i CEO Axiom Bio, wskazał na istotne wzrosty dokładności w najtrudniejszych evalach odkrywania leków po zintegrowaniu GPT-5.5 ze swoimi narzędziami. FrontierMath Tier 1-3 daje wynik 51,7% (GPT-5.4: 47,6%), a Tier 4 osiąga 35,4% (GPT-5.4: 27,1%). Na CyberGym model osiągnął 81,8% wobec 79,0% dla GPT-5.4.
W obszarze cyberbezpieczeństwa OpenAI wdrożyło stricter classifiers dla potencjalnych cyberzagrożeń. Zabezpieczenia wprowadzone pierwotnie z GPT-5.2 zostały rozszerzone o bardziej restrykcyjne kontrole wokół aktywności wyższego ryzyka i ochronę przed powtarzanym nadużyciem. OpenAI współpracuje z zewnętrznymi ekspertami i redteamerami od miesięcy przed wydaniem modelu.
Infrastruktura i wydajność serwowania
Utrzymanie latencji GPT-5.4 przy znacznie wyższej inteligencji wymagało przemyślenia wnioskowania jako zintegrowanego systemu. GPT-5.5 został zaprojektowany, trenowany i serwowany na systemach NVIDIA GB200 i GB300 NVL72. Codex pomógł zespołowi szybciej przechodzić od pomysłu do implementacji, a sam GPT-5.5 znalazł i wdrożył kluczowe optymalizacje w stosie serwującym, w tym heurystyki partycjonowania i balansowania obciążenia, które zwiększyły prędkość generowania tokenów o ponad 20%.
Dostępność i plany API
GPT-5.5 trafia do użytkowników Plus, Pro, Business i Enterprise w ChatGPT i Codex. Wersja GPT-5.5 Pro jest dostępna dla użytkowników Pro, Business i Enterprise. Wdrożenia API wymagają innych zabezpieczeń i OpenAI pracuje z partnerami nad wymogami bezpieczeństwa. GPT-5.5 i GPT-5.5 Pro pojawią się w API wkrótce. Więcej o tym, jak wyszukiwanie AI wykorzystuje modele językowe do przetwarzania zapytań, znajdziesz w osobnym artykule. Sposób, w jaki optymalizacja AEO zwiększa widoczność treści w odpowiedziach generowanych przez takie modele, opisano w dedykowanym przewodniku.