Kontekst: zakaj je ta študija prelomna
Pred objavo te raziskave je bila "GEO" oziroma "AI search optimization" bolj marketinški pojem kot disciplina z znanstveno podlago. Industrijski blogi so ponujali kontradiktorne nasvete, ni bilo merljivih metrik in ni obstajal nobeden javno dostopen benchmark. Princetonova študija je vse to spremenila — formalizirala je definicijo, ponudila metriko in javno objavila evalvacijski sklop (GEO-bench), ki ga lahko vsak ponovi.
Pomembnost: ko nekdo razpravlja o GEO v 2026, najpogosteje implicitno ali eksplicitno citira to delo. Vse industrijske platforme, ki danes ponujajo "GEO" storitve (vključno z agencijami v Sloveniji), gradijo na ogrodju, ki ga je predstavil ta papir.
O študiji in avtorjih
Glavna akademska institucija je Princeton University, kjer trije od šestih avtorjev opravljajo doktorski oziroma profesorski cikel (Vishvak Murahari, Karthik Narasimhan, Ameet Deshpande). Karthik Narasimhan je vodja Princeton NLP Group in eden najvidnejših raziskovalcev na področju LLM-jev. Sodelavci z drugih institucij prinašajo komplementarno ekspertizo: Allen Institute for AI (avtoritativna AI raziskovalna ustanova v Seattlu) prek Ashwina Kalyana, in Georgia Tech prek Tanmay Rajpurohit.
Delo je bilo predstavljeno na KDD 2024 — 30. ACM SIGKDD Conference on Knowledge Discovery and Data Mining, eni najprestižnejših konferenc na področju strojnega učenja in data mining. Sprejem na KDD pomeni peer review s strani aktivnih raziskovalcev v polju.1
Metodologija — kako je bilo merjeno
Avtorji so razvili GEO-bench: benchmark z približno 10.000 raznolikimi uporabniškimi queryji v 9 domenah (od trgovine in popotovanj do tehničnih in akademskih tem). Vsak query so podali generativnim iskalnikom dvakrat: (1) z osnovno, neoptimizirano vsebino, in (2) z vsebino, optimizirano z eno od 9 GEO metod.
Vidnost so merili z dvema komplementarnima metrikama:
- Position-Adjusted Word Count — koliko teksta iz vašega vira AI vključi v odziv in na kateri poziciji odziva (prej v odzivu = pomembneje)
- Subjective Impression — kompozit subjektivnih faktorjev, ki ocenjujejo, kako prominentno je vir omenjen, ali ima ime, ali AI eksplicitno potrdi avtoriteto
Pomembna posebnost: avtorji niso testirali samo na enem generativnem iskalniku, ampak so vključili tudi Perplexity.ai, kar omogoča primerjavo stabilnosti rezultatov čez različne sisteme.
Glavne ugotovitve
1. Klasični SEO ne pomaga, lahko škodi
Med 9 testiranimi metodami so avtorji vključili tudi tradicionalne SEO tehnike. Najbolj presenetljiv rezultat za marketinški svet: keyword stuffing (gostota ključnih besed) je v generativnih iskalnikih ne deluje — pogosto celo zmanjša vidnost vsebine.2
Razlog je strukturen: tradicionalni Google iskalnik rangira strani po algoritmu, ki ocenjuje pojavnost ključnih besed (med drugim). Generativni iskalniki pa ne rangirajo — povzemajo. Ko AI gradi odziv, izbere vir, ki ima najbolj jedrnato, faktografsko gosto, citatno verodostojno vsebino. Ponavljanje ključne besede pri tem ne pomaga; lahko celo signalizira, da vsebina ni resna.
2. Tri najmočnejše GEO metode
Tri metode so se izkazale za bistveno učinkovitejše od ostalih:
| Metoda | Kaj naredi | Učinek |
|---|---|---|
| Statistics Addition | Dodaj konkretne statistike in številčne podatke v vsebino | do +40 % |
| Cite Sources | Citiraj avtoritativne zunanje vire (z linki) | do +30 % |
| Quotation Addition | Vključi neposredne citate strokovnjakov | do +28 % |
| Fluency Optimization | Izboljšaj slogovno tekočnost in jasnost stavkov | +15–25 % |
| Keyword Stuffing (SEO) | Poveča gostoto ključnih besed | ~0 % ali negativen |
Kombinacija prvih treh metod (statistike + citacije + citati) je dosegla najboljše rezultate skozi cel benchmark.
3. Kontekstualna občutljivost
Pomembna sekundarna ugotovitev je, da učinek metode variira glede na tematsko domeno. V tehničnih in faktografskih queryjih (npr. zdravstvo, pravo, znanost) so statistike in citacije najmočnejše. V kreativnih ali konverzacijskih queryjih je njihova prednost manjša, čeprav še vedno pozitivna.
Zakaj generativni iskalniki tako delujejo
Princetonova študija ne razlaga samo "kaj" — razlaga tudi "zakaj". Avtorji povezujejo svoje rezultate z mehaniko velikih jezikovnih modelov:
- LLM-i so trenirani na podatkih, ki cenijo navedene vire. Wikipedia, znanstvene revije, novičarski portali — vse to so vsebine, ki imajo veliko citacij in statistik. Model je torej naučen, da je vsebina s tovrstnimi signali bolj verodostojna.
- Faktografska gostota = lažja ekstrakcija. Ko AI gradi odziv, mora iz vira potegniti konkretne podatke. Vsebina, ki ima eksplicitne številke in datume, je za AI lažje "razčlenljiva" kot prozno besedilo brez konkretnih trditev.
- Citation chain = signal verodostojnosti. Če vaš članek citira Eurostat, in Eurostat citira vsa znanstvena dela, je vaš članek implicitno v "verodostojni verigi". AI-ji to prepoznajo.
Kaj to pomeni za slovenska podjetja
Trije konkretni operativni zaključki za slovensko poslovno okolje:
1. Spletna stran iz 2022 je v ChatGPT odzivih verjetno nevidna
Če je vaša spletna stran iz obdobja 2018–2022, je verjetno optimizirana za Google klasično (keyword density, backlinks, meta descriptions). Niti ena od teh tehnik ni v Princetonovi študiji dosegla pomembnih izboljšav za generativne iskalnike. Posledica: ko nekdo v 2026 vpraša ChatGPT "katera podjetja v Sloveniji ponujajo X", vaše ime se verjetno ne pojavi — niti če ste v Google rezultatih na prvem mestu.
2. Strateška vsebina mora vsebovati statistike + citacije + citate
Vsak landing page, blog članek ali storitvena stran, ki jo želite videti v ChatGPT odzivih, naj sledi formuli:
- Vsaj 3–5 konkretnih statistik z viri (Eurostat, EU Commission, ugledne študije)
- Vsaj 2–3 zunanji citacij na avtoritativne strani (z
rel="nofollow", da preprečite authority leakage) - Vsaj 1 neposreden citat strokovnjaka ali študije (kratek, pod 15 besed za upoštevanje copyright-a)
3. Struktura matters — schema markup, FAQ, jasna hierarhija
Princetonova študija eksplicitno ne testira strukturiranih podatkov (Schema.org JSON-LD), ampak vrsta drugih študij potrjuje, da tehnično strukturirana vsebina (z dobro hierarhijo H1/H2/H3, FAQ block-i, jasnimi citacijami) ima podoben učinek kot vsebinski signali. Pri Eflitte je ravno to del osnovne implementacije AI-pripravljene strani: schema markup, FAQ schema, BreadcrumbList in vsebinske GEO metode skupaj.
Slovenska prednost: v slovenščini je konkurence za citacije v generativnih iskalnikih bistveno manj kot v angleščini. Slovensko podjetje, ki sistematično aplicira GEO metode na slovenskih queryjih, lahko dokaj hitro doseže visok delež citacij — predvsem v nišnih panogah, kjer angleški dominantni viri (Wikipedia, večji ameriški blogi) ne pokrivajo lokalne specifike.
Omejitve študije
Tri pomembne omejitve, ki jih je treba upoštevati:
- Hitro spreminjajoč se ekosistem. Generativni iskalniki (ChatGPT, Perplexity, Google AI Overviews, Claude) se nenehno posodabljajo. Metode, ki so delovale leta 2024, se v 2026 lahko različno odzivajo. Mehanizmi (faktografska gostota, citacije) ostajajo robustni — taktične mikro-prilagoditve pa zastarajo.
- Sintetični benchmark. GEO-bench je raznolik, ampak še vedno sintetičen — pravi komercialni queryji v različnih jezikih (vključno s slovenščino) niso pokriti.
- Etika optimizacije. Avtorji v zaključku odprejo vprašanje: če vsi začnejo aplicirati GEO metode, ali se bo signal-to-noise razmerje v generativnih iskalnikih poslabšalo? To je odprto raziskovalno vprašanje za nadaljnja leta.
Nadaljnje raziskave
Po objavi tega papirja je nastala vrsta sorodnih del — vključno z raziskavo Kumar & Lakkaraju (2024) o adversarial napadih na LLM iskalnike in serije študij o "citation failures" v generativnih iskalnikih. Discipline GEO se torej razvija akademsko, ne samo industrijsko.
Zaključek
Aggarwal et al. (2024) so dokazali, da je Generative Engine Optimization realna, merljiva disciplina, ki se bistveno razlikuje od klasičnega SEO. Tri najmočnejše metode — statistike, citacije in citati — so univerzalno aplikabilne, vključno na slovenske spletne strani. Podjetja, ki bodo te metode sistematično vključila v svojo vsebinsko strategijo, bodo med prvimi citirana v ChatGPT, Perplexity in podobnih sistemih, kjer se trenutno odvija prerazporeditev iskalnega prometa.