Koliko je moćna nova GPT-5.4: objašnjeno kroz službene OpenAI podatke

Praktična analiza GPT-5.4 temeljena samo na službenim OpenAI izvorima: nove mogućnosti, ključni benchmark skokovi, promjene cijene i contexta te poštena usporedba s GPT-5.3, GPT-5.2 i GPT-5.1.

06. ožu 2026.· 10 min čitanja· Tehnologija

Razgovaraj s PAS7 Studio o korištenju GPT-5.4 u proizvodima

Naslovna slika GPT-5.4 s fokusom na nove mogućnosti i benchmark rast

Ukratko: GPT-5.4 je prvi GPT-5 model koji djeluje kao jedan cjelovit profesionalni stack

Na datum 6. ožujka 2026, službena slika iz OpenAI-ja ovdje je neobično jasna.

• GPT-5.4 je najmoćniji i najučinkovitiji frontier model OpenAI-ja za profesionalni rad, a njegov glavni napredak je kompozicija: reasoning, coding, computer use, tool use i dugi radni tokovi sada žive u jednom mainline modelu. [1][2]
• Najvidljivije novosti su upfront planning u ChatGPT-u, native computer use, tool search, 1.05M context u API-ju, full-fidelity original image detail i viša factuality nego kod GPT-5.2. [1][2][3][4]
• Najčišća benchmark priča je ova: GPT-5.4 nadmašuje GPT-5.2 na GDPval, SWE-Bench Pro, OSWorld-Verified, Toolathlon i BrowseComp, a pritom nasljeđuje frontier coding razinu od GPT-5.3-Codexa. [1]
• Važna nijansa je da je GPT-5.3 podijeljen na opću GPT-5.3 Chat liniju i mnogo bolje izmjerenu GPT-5.3-Codex liniju. Zato najpoštenija usporedba s 5.4 koristi obje, ovisno o tome što se mjeri. [2][5][6]

Kompaktan GPT-5.4 dashboard: novi feature stack, rast u benchmarkima i verzijska ljestvica od 5.1 do 5.4 u jednom kadru.

Nove mogućnosti GPT-5.4 i zašto su stvarno važne

Ovdje su promjene koje stvarno mijenjaju workflow, a ne samo lijepo izgledaju u launch tekstu.

1. Upfront planning u ChatGPT-u

GPT-5.4 Thinking može prikazati početni plan prije nego što dovrši dugi odgovor. To je korisno jer omogućuje raniju korekciju smjera i manje izgubljenih iteracija na složenim zadacima. OpenAI također izričito kaže da GPT-5.4 poboljšava deep web research, posebno za precizne upite i duže thinking lance. [1]

2. Native computer use u općoj modelnoj liniji

GPT-5.4 je prvi general-purpose model OpenAI-ja s native state-of-the-art computer-use sposobnošću. To je veći skok nego što zvuči. Mainline model više nije samo reasoner koji poziva toolove, nego model koji je pozicioniran za direktan rad kroz web stranice i softverska okruženja. [1][4]

3. 1.05M context window u API-ju

Službena model page za GPT-5.4 navodi 1,050,000 tokena context windowa i 128,000 max output tokena. To je velik skok u odnosu na GPT-5.2 i GPT-5.1, koji ostaju na 400,000 contexta i 128,000 outputa. [2][7][8]

4. Tool search za velike tool ekosustave

GPT-5.4 uvodi tool search u API. Umjesto da se sve tool definicije odmah uguraju u prompt, model može pronaći potrebne toolove kada su stvarno potrebni. OpenAI kaže da je na 250 MCP Atlas tasks s 36 MCP servera tool search smanjio ukupnu potrošnju tokena za 47% uz istu točnost. [1]

5. Jači high-resolution vision

GPT-5.4 dodaje original image detail mod za full-fidelity percepciju do 10.24M pixela ili 6000 pixela maksimalne dimenzije. I high raste na 2.56M pixela ili 2048 pixela maksimalne dimenzije. To je važno za UI screenshots, guste dokumente, dijagrame i točnost computer use scenarija. [1]

6. Veća factuality na stvarnim error reportovima

OpenAI naziva GPT-5.4 svojim najfaktičnijim modelom do sada na skupu de-identificiranih promptova gdje su korisnici ranije prijavili factual errors. U odnosu na GPT-5.2, pojedinačne tvrdnje su bile 33% rjeđe pogrešne, a puni odgovori 18% rjeđe sadržavali bilo kakvu pogrešku. [1]

Praktična mapa onoga što se stvarno promijenilo u GPT-5.4 na temelju službenih OpenAI release notes i model docs. [1][2]

Gdje GPT-5.4 stvarno podiže ljestvicu

Najjača strana GPT-5.4 launcha je to što se OpenAI nije sakrio iza jednog evala. Službena release stranica izravno uspoređuje GPT-5.4 s GPT-5.3-Codex i GPT-5.2 kroz professional work, coding, computer use i tool use. [1]

Eval	GPT-5.4	GPT-5.3-Codex	GPT-5.2	Što taj skok znači u praksi
GDPval	83.0%	70.9%	70.9%	Velik skok u dobro specificiranom profesionalnom knowledge worku
SWE-Bench Pro (Public)	57.7%	56.8%	55.6%	Dobitak u codingu je stvaran, ali nije potpuni blowout
OSWorld-Verified	75.0%	74.0%	47.3%	Ogroman skok u computer useu u odnosu na GPT-5.2
Toolathlon	54.6%	51.9%	46.3%	Bolji multi-step tool calling i orchestracija
BrowseComp	82.7%	77.3%	65.8%	Jači persistent web research i search behavior

Poanta nije da GPT-5.4 svugdje razbija GPT-5.3-Codex. To nije točno. Stvarna priča je da se GPT-5.4 jako približava specijaliziranom coding modelu ili ga prelazi, a pritom ostaje mnogo širi model. Upravo zato je ovaj release važan. [1]

Nekoliko važnih službenih detalja lako promakne. GPT-5.4 doseže 75.0% na OSWorld-Verified, a OpenAI kaže da je to iznad ljudske izvedbe na 72.4%. Također podiže BrowseComp za 17 percentage points u odnosu na GPT-5.2, a OpenAI ga pozicionira kao novi state of the art za multi-step tool use. [1]

Službena benchmark ljestvica iz GPT-5.4 releasea, svedena na metrike koje najbolje prate stvaran rad. [1]

Kako GPT-5.4 izgleda u odnosu na GPT-5.3, GPT-5.2 i GPT-5.1

U ovom dijelu preciznost je najvažnija. Javna evidencija OpenAI-ja nije simetrična kroz sva GPT-5 izdanja, pa poštena usporedba mora odvojiti general-purpose releasove od Codex-specijaliziranih releasova.

Verzija	Službena uloga u liniji	Context	Max output	Cijena input / output	Najvažnija razlika u odnosu na 5.4
GPT-5.4	Trenutni frontier model za professional work	1.05M	128k	$2.50 / $15	Dodaje native computer use, tool search i veću factuality na frontier coding razini [1][2]
GPT-5.3 Chat	ChatGPT snapshot model GPT-5.3 Instant	128k	16,384	$1.75 / $14	Koristan za testiranje najnovijeg chat ponašanja, ali nije glavna benchmark referenca za coding ili agente [6]
GPT-5.3-Codex	Najsposobniji OpenAI agentic coding model te generacije	400k	128k	$1.75 / $14	I dalje ima najjasniji specijalizirani coding profil i jači javni Terminal-Bench rezultat od 5.4 [5][9]
GPT-5.2	Prethodni frontier model za professional work	400k	128k	$1.75 / $14	Snažan model za long-context i knowledge work, ali sada jasno slabiji od 5.4 u computer useu, tool useu i factualityju [1][7]
GPT-5.1	Flagship model za coding i agentic tasks	400k	128k	$1.25 / $10	Jeftiniji i dalje snažan, ali iz ranije tooling generacije prije xhigh reasoninga, tool searcha i 1.05M contexta [8][10]

Najčišći način da se čita verzijska ljestvica je ovaj.

GPT-5.4 vs GPT-5.3

U odnosu na GPT-5.3 Chat, GPT-5.4 je mnogo ozbiljniji professional model. Ima mnogo veći context, znatno veći max output, eksplicitnu reasoning površinu i daleko bogatiju službenu benchmark priču. U odnosu na GPT-5.3-Codex, GPT-5.4 je šira i uravnoteženija, ali GPT-5.3-Codex i dalje pobjeđuje na službenom Terminal-Bench 2.0 rezultatu s 77.3% naspram 75.1%. [1][5][6]

GPT-5.4 vs GPT-5.2

To je najizravnija službena usporedba i ujedno najjača. GPT-5.4 podiže GDPval s 70.9% na 83.0%, SWE-Bench Pro s 55.6% na 57.7%, OSWorld-Verified s 47.3% na 75.0%, Toolathlon s 46.3% na 54.6% i BrowseComp s 65.8% na 82.7%. Trade-off je cijena: GPT-5.4 je skuplja po tokenu od GPT-5.2. [1][2][7]

GPT-5.4 vs GPT-5.1

Usporedba s GPT-5.1 je dijelom generacijska, a dijelom tooling priča. GPT-5.1 je uvela adaptive reasoning behavior za developere i nove toolove poput apply_patch i shell, dok su OpenAI partneri posebno isticali bolji diff editing i responsiveness. GPT-5.4 ide dalje prema širem professional stacku s 1.05M contextom, xhigh reasoningom, native computer useom, tool searchom i jačim cross-domain benchmark rezultatima. Cijena pritom osjetno raste s $1.25/$10 na $2.50/$15. [2][8][10]

Verzijska ljestvica od GPT-5.1 do GPT-5.4 sastavljena samo iz službenih OpenAI release stranica i model docs. [1][2][5][6][7][8][10]

Gdje je GPT-5.4 stvarno najjača i gdje stariji modeli još imaju smisla

Nadogradnja je stvarna, ali i dalje postoje scenariji gdje su starije modelne linije racionalniji izbor.

Gdje GPT-5.4 jasno pobjeđuje

Ako tvoj rad kombinira reasoning, coding, web research, dokumente, spreadsheet zadatke, prezentacije i tool-heavy agent loops, GPT-5.4 je najčišća službena preporuka. To je prvi GPT-5 release u kojem dokumentacija i benchmark slika OpenAI-ja gotovo bez dvosmislenosti pokazuju u isti smjer. [1][2]

Gdje je GPT-5.3-Codex i dalje važan

Ako je tvoj workflow gotovo potpuno terminal-first i coding-agent driven, GPT-5.3-Codex ostaje strateški važan. Njegov službeni Terminal-Bench 2.0 rezultat i dalje je viši od GPT-5.4, a OpenAI ga još opisuje kao most capable agentic coding model to date. [1][5][9]

Gdje GPT-5.2 i dalje ima smisla

GPT-5.2 ostaje dobar value izbor ako želiš snažan frontier model, ali ti ne trebaju veći context, skok u computer useu ili tool-search učinkovitost GPT-5.4. Jeftiniji je, i dalje podržava xhigh reasoning i ostaje vrlo solidan za duge dokumente i profesionalnu analizu. [1][7]

Gdje GPT-5.1 i dalje ima smisla

GPT-5.1 je i dalje razuman izbor za timove kojima treba niži trošak i jak coding-and-agents baseline. API stranica ga i dalje pozicionira kao najbolji model za coding i agentic tasks s podesivim reasoning effortom, a njegova tool priča već je bila snažna za developere. [8][10]

ČPP

Je li GPT-5.4 više coding upgrade ili opći upgrade za profesionalni rad?

Oboje, i upravo je to poanta ovog releasea. GPT-5.4 nasljeđuje frontier coding razinu od GPT-5.3-Codexa, ali ga OpenAI pozicionira kao širi professional model za dokumente, spreadsheet zadatke, prezentacije, web research, tool use i computer use.

Zamjenjuje li GPT-5.4 potpuno GPT-5.3-Codex?

Ne u potpunosti. GPT-5.4 je mnogo cjelovitiji mainline model, ali GPT-5.3-Codex i dalje ima jači službeni Terminal-Bench 2.0 rezultat i ostaje vrlo relevantan za terminal-first coding workflowe.

Vrijedi li GPT-5.4 više API cijene u odnosu na GPT-5.2?

Ako tvoj workload stvarno dobiva više od većeg contexta, jačeg computer usea, tool searcha i nižeg error ratea, često da. Ako radiš uglavnom standardnu analizu ili coding bez tih zahtjeva, GPT-5.2 i dalje može biti snažan value izbor.

Zašto se usporedba s GPT-5.3 djelomično temelji na GPT-5.3-Codex, a ne samo na GPT-5.3 Chat?

Zato što je najdublja službena benchmark površina OpenAI-ja za generaciju 5.3 objavljena upravo za GPT-5.3-Codex. GPT-5.3 Chat uglavnom je dokumentiran kao snapshot model za ChatGPT, dok GPT-5.3-Codex ima puno snažniji javni benchmark sloj.

Izvori

Samo službeni OpenAI izvori, provjereni 6. ožujka 2026.

• 1. Introducing GPT-5.4
• 2. GPT-5.4 model page
• 3. OpenAI API pricing
• 4. GPT-5.4 Thinking system card
• 5. Introducing GPT-5.3-Codex
• 6. GPT-5.3 Chat model page
• 7. Introducing GPT-5.2
• 8. GPT-5.1 model page
• 9. GPT-5.3-Codex model page
• 10. Introducing GPT-5.1 for developers
• 11. GPT-5.2 model page

Podijeli