Tehnologija
Koliko je moćna nova GPT-5.4: objašnjeno kroz službene OpenAI podatke
Praktična analiza GPT-5.4 temeljena samo na službenim OpenAI izvorima: nove mogućnosti, ključni benchmark skokovi, promjene cijene i contexta te poštena usporedba s GPT-5.3, GPT-5.2 i GPT-5.1.

Ukratko: GPT-5.4 je prvi GPT-5 model koji djeluje kao jedan cjelovit profesionalni stack
Na datum 6. ožujka 2026, službena slika iz OpenAI-ja ovdje je neobično jasna.
• GPT-5.4 je najmoćniji i najučinkovitiji frontier model OpenAI-ja za profesionalni rad, a njegov glavni napredak je kompozicija: reasoning, coding, computer use, tool use i dugi radni tokovi sada žive u jednom mainline modelu. [1][2]
• Najvidljivije novosti su upfront planning u ChatGPT-u, native computer use, tool search, 1.05M context u API-ju, full-fidelity
originalimage detail i viša factuality nego kod GPT-5.2. [1][2][3][4]• Najčišća benchmark priča je ova: GPT-5.4 nadmašuje GPT-5.2 na GDPval, SWE-Bench Pro, OSWorld-Verified, Toolathlon i BrowseComp, a pritom nasljeđuje frontier coding razinu od GPT-5.3-Codexa. [1]
• Važna nijansa je da je GPT-5.3 podijeljen na opću
GPT-5.3 Chatliniju i mnogo bolje izmjerenuGPT-5.3-Codexliniju. Zato najpoštenija usporedba s 5.4 koristi obje, ovisno o tome što se mjeri. [2][5][6]
Kompaktan GPT-5.4 dashboard: novi feature stack, rast u benchmarkima i verzijska ljestvica od 5.1 do 5.4 u jednom kadru.
Snimka zaslona sekcije overviewNove mogućnosti GPT-5.4 i zašto su stvarno važne
Ovdje su promjene koje stvarno mijenjaju workflow, a ne samo lijepo izgledaju u launch tekstu.
1. Upfront planning u ChatGPT-u
GPT-5.4 Thinking može prikazati početni plan prije nego što dovrši dugi odgovor. To je korisno jer omogućuje raniju korekciju smjera i manje izgubljenih iteracija na složenim zadacima. OpenAI također izričito kaže da GPT-5.4 poboljšava deep web research, posebno za precizne upite i duže thinking lance. [1]
2. Native computer use u općoj modelnoj liniji
3. 1.05M context window u API-ju
4. Tool search za velike tool ekosustave
GPT-5.4 uvodi tool search u API. Umjesto da se sve tool definicije odmah uguraju u prompt, model može pronaći potrebne toolove kada su stvarno potrebni. OpenAI kaže da je na 250 MCP Atlas tasks s 36 MCP servera tool search smanjio ukupnu potrošnju tokena za 47% uz istu točnost. [1]
5. Jači high-resolution vision
GPT-5.4 dodaje original image detail mod za full-fidelity percepciju do 10.24M pixela ili 6000 pixela maksimalne dimenzije. I high raste na 2.56M pixela ili 2048 pixela maksimalne dimenzije. To je važno za UI screenshots, guste dokumente, dijagrame i točnost computer use scenarija. [1]
6. Veća factuality na stvarnim error reportovima
OpenAI naziva GPT-5.4 svojim najfaktičnijim modelom do sada na skupu de-identificiranih promptova gdje su korisnici ranije prijavili factual errors. U odnosu na GPT-5.2, pojedinačne tvrdnje su bile 33% rjeđe pogrešne, a puni odgovori 18% rjeđe sadržavali bilo kakvu pogrešku. [1]
Gdje GPT-5.4 stvarno podiže ljestvicu
Najjača strana GPT-5.4 launcha je to što se OpenAI nije sakrio iza jednog evala. Službena release stranica izravno uspoređuje GPT-5.4 s GPT-5.3-Codex i GPT-5.2 kroz professional work, coding, computer use i tool use. [1]
| Eval | GPT-5.4 | GPT-5.3-Codex | GPT-5.2 | Što taj skok znači u praksi |
|---|---|---|---|---|
| GDPval | 83.0% | 70.9% | 70.9% | Velik skok u dobro specificiranom profesionalnom knowledge worku |
| SWE-Bench Pro (Public) | 57.7% | 56.8% | 55.6% | Dobitak u codingu je stvaran, ali nije potpuni blowout |
| OSWorld-Verified | 75.0% | 74.0% | 47.3% | Ogroman skok u computer useu u odnosu na GPT-5.2 |
| Toolathlon | 54.6% | 51.9% | 46.3% | Bolji multi-step tool calling i orchestracija |
| BrowseComp | 82.7% | 77.3% | 65.8% | Jači persistent web research i search behavior |
Poanta nije da GPT-5.4 svugdje razbija GPT-5.3-Codex. To nije točno. Stvarna priča je da se GPT-5.4 jako približava specijaliziranom coding modelu ili ga prelazi, a pritom ostaje mnogo širi model. Upravo zato je ovaj release važan. [1]
Nekoliko važnih službenih detalja lako promakne. GPT-5.4 doseže 75.0% na OSWorld-Verified, a OpenAI kaže da je to iznad ljudske izvedbe na 72.4%. Također podiže BrowseComp za 17 percentage points u odnosu na GPT-5.2, a OpenAI ga pozicionira kao novi state of the art za multi-step tool use. [1]
Službena benchmark ljestvica iz GPT-5.4 releasea, svedena na metrike koje najbolje prate stvaran rad. [1]
Snimka zaslona sekcije benchmarksKako GPT-5.4 izgleda u odnosu na GPT-5.3, GPT-5.2 i GPT-5.1
U ovom dijelu preciznost je najvažnija. Javna evidencija OpenAI-ja nije simetrična kroz sva GPT-5 izdanja, pa poštena usporedba mora odvojiti general-purpose releasove od Codex-specijaliziranih releasova.
| Verzija | Službena uloga u liniji | Context | Max output | Cijena input / output | Najvažnija razlika u odnosu na 5.4 |
|---|---|---|---|---|---|
| GPT-5.4 | Trenutni frontier model za professional work | 1.05M | 128k | $2.50 / $15 | Dodaje native computer use, tool search i veću factuality na frontier coding razini [1][2] |
| GPT-5.3 Chat | ChatGPT snapshot model GPT-5.3 Instant | 128k | 16,384 | $1.75 / $14 | Koristan za testiranje najnovijeg chat ponašanja, ali nije glavna benchmark referenca za coding ili agente [6] |
| GPT-5.3-Codex | Najsposobniji OpenAI agentic coding model te generacije | 400k | 128k | $1.75 / $14 | I dalje ima najjasniji specijalizirani coding profil i jači javni Terminal-Bench rezultat od 5.4 [5][9] |
| GPT-5.2 | Prethodni frontier model za professional work | 400k | 128k | $1.75 / $14 | Snažan model za long-context i knowledge work, ali sada jasno slabiji od 5.4 u computer useu, tool useu i factualityju [1][7] |
| GPT-5.1 | Flagship model za coding i agentic tasks | 400k | 128k | $1.25 / $10 | Jeftiniji i dalje snažan, ali iz ranije tooling generacije prije xhigh reasoninga, tool searcha i 1.05M contexta [8][10] |
Najčišći način da se čita verzijska ljestvica je ovaj.
GPT-5.4 vs GPT-5.3
U odnosu na GPT-5.3 Chat, GPT-5.4 je mnogo ozbiljniji professional model. Ima mnogo veći context, znatno veći max output, eksplicitnu reasoning površinu i daleko bogatiju službenu benchmark priču. U odnosu na GPT-5.3-Codex, GPT-5.4 je šira i uravnoteženija, ali GPT-5.3-Codex i dalje pobjeđuje na službenom Terminal-Bench 2.0 rezultatu s 77.3% naspram 75.1%. [1][5][6]
GPT-5.4 vs GPT-5.2
To je najizravnija službena usporedba i ujedno najjača. GPT-5.4 podiže GDPval s 70.9% na 83.0%, SWE-Bench Pro s 55.6% na 57.7%, OSWorld-Verified s 47.3% na 75.0%, Toolathlon s 46.3% na 54.6% i BrowseComp s 65.8% na 82.7%. Trade-off je cijena: GPT-5.4 je skuplja po tokenu od GPT-5.2. [1][2][7]
GPT-5.4 vs GPT-5.1
Usporedba s GPT-5.1 je dijelom generacijska, a dijelom tooling priča. GPT-5.1 je uvela adaptive reasoning behavior za developere i nove toolove poput apply_patch i shell, dok su OpenAI partneri posebno isticali bolji diff editing i responsiveness. GPT-5.4 ide dalje prema širem professional stacku s 1.05M contextom, xhigh reasoningom, native computer useom, tool searchom i jačim cross-domain benchmark rezultatima. Cijena pritom osjetno raste s $1.25/$10 na $2.50/$15. [2][8][10]
Gdje je GPT-5.4 stvarno najjača i gdje stariji modeli još imaju smisla
Nadogradnja je stvarna, ali i dalje postoje scenariji gdje su starije modelne linije racionalniji izbor.
Gdje GPT-5.4 jasno pobjeđuje
Gdje je GPT-5.3-Codex i dalje važan
Gdje GPT-5.2 i dalje ima smisla
Gdje GPT-5.1 i dalje ima smisla
ČPP
Oboje, i upravo je to poanta ovog releasea. GPT-5.4 nasljeđuje frontier coding razinu od GPT-5.3-Codexa, ali ga OpenAI pozicionira kao širi professional model za dokumente, spreadsheet zadatke, prezentacije, web research, tool use i computer use.
Ne u potpunosti. GPT-5.4 je mnogo cjelovitiji mainline model, ali GPT-5.3-Codex i dalje ima jači službeni Terminal-Bench 2.0 rezultat i ostaje vrlo relevantan za terminal-first coding workflowe.
Ako tvoj workload stvarno dobiva više od većeg contexta, jačeg computer usea, tool searcha i nižeg error ratea, često da. Ako radiš uglavnom standardnu analizu ili coding bez tih zahtjeva, GPT-5.2 i dalje može biti snažan value izbor.
Zato što je najdublja službena benchmark površina OpenAI-ja za generaciju 5.3 objavljena upravo za GPT-5.3-Codex. GPT-5.3 Chat uglavnom je dokumentiran kao snapshot model za ChatGPT, dok GPT-5.3-Codex ima puno snažniji javni benchmark sloj.
Izvori
Samo službeni OpenAI izvori, provjereni 6. ožujka 2026.
Trebaš odlučiti isplati li se GPT-5.4 u tvom proizvodu
Ispravna odluka ovdje ne ovisi samo o jednom benchmark chartu. Ovisi o tome izgleda li tvoj stvarni workload više kao coding, long-form professional work, tool orchestration ili browser i desktop automation.
PAS7 Studio može pomoći procijeniti GPT-5.4 u odnosu na tvoj trenutni stack i utvrditi opravdava li višu cijenu po tokenu.