22. april 2026 11 min branja Povzetek akademske študije

Generative Engine Optimization: zakaj klasični SEO ne deluje za ChatGPT — analiza Princetonove študije

Skupina raziskovalcev s Princeton University in soavtorjev z IIT Delhi, Georgia Tech in Allen Institute for AI je leta 2024 na konferenci ACM SIGKDD predstavila prvo akademsko formalizacijo discipline "Generative Engine Optimization" (GEO). Testirali so 9 optimizacijskih metod na ~10.000 queryjih in pokazali, da klasične SEO tehnike (kot je keyword stuffing) v generativnih iskalnikih kot sta ChatGPT in Perplexity ne delujejo — najboljše GEO metode pa lahko izboljšajo vidnost vsebine za do 40 %. Spodaj povzemamo ugotovitve in pojasnjujemo, kaj to pomeni za slovenska podjetja, ki želijo biti citirana v AI odzivih.

Predmet analize
GEO: Generative Engine Optimization
Avtorji: Pranjal Aggarwal (IIT Delhi), Vishvak Murahari (Princeton), Tanmay Rajpurohit (Georgia Tech), Ashwin Kalyan (Allen Institute for AI), Karthik Narasimhan (Princeton), Ameet Deshpande (Princeton)
Vir: Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '24), str. 5–16
Datum: Pred-print arXiv november 2023, končna konferenčna verzija avgust 2024
Vzorec: ~10.000 queryjev v 9 različnih domenah (benchmark "GEO-bench"), testirano na produkcijskih generativnih iskalnikih vključno z Perplexity.ai
TL;DR — Ključne ugotovitve

Kontekst: zakaj je ta študija prelomna

Pred objavo te raziskave je bila "GEO" oziroma "AI search optimization" bolj marketinški pojem kot disciplina z znanstveno podlago. Industrijski blogi so ponujali kontradiktorne nasvete, ni bilo merljivih metrik in ni obstajal nobeden javno dostopen benchmark. Princetonova študija je vse to spremenila — formalizirala je definicijo, ponudila metriko in javno objavila evalvacijski sklop (GEO-bench), ki ga lahko vsak ponovi.

Pomembnost: ko nekdo razpravlja o GEO v 2026, najpogosteje implicitno ali eksplicitno citira to delo. Vse industrijske platforme, ki danes ponujajo "GEO" storitve (vključno z agencijami v Sloveniji), gradijo na ogrodju, ki ga je predstavil ta papir.

O študiji in avtorjih

Glavna akademska institucija je Princeton University, kjer trije od šestih avtorjev opravljajo doktorski oziroma profesorski cikel (Vishvak Murahari, Karthik Narasimhan, Ameet Deshpande). Karthik Narasimhan je vodja Princeton NLP Group in eden najvidnejših raziskovalcev na področju LLM-jev. Sodelavci z drugih institucij prinašajo komplementarno ekspertizo: Allen Institute for AI (avtoritativna AI raziskovalna ustanova v Seattlu) prek Ashwina Kalyana, in Georgia Tech prek Tanmay Rajpurohit.

Delo je bilo predstavljeno na KDD 2024 — 30. ACM SIGKDD Conference on Knowledge Discovery and Data Mining, eni najprestižnejših konferenc na področju strojnega učenja in data mining. Sprejem na KDD pomeni peer review s strani aktivnih raziskovalcev v polju.1

Metodologija — kako je bilo merjeno

Avtorji so razvili GEO-bench: benchmark z približno 10.000 raznolikimi uporabniškimi queryji v 9 domenah (od trgovine in popotovanj do tehničnih in akademskih tem). Vsak query so podali generativnim iskalnikom dvakrat: (1) z osnovno, neoptimizirano vsebino, in (2) z vsebino, optimizirano z eno od 9 GEO metod.

Vidnost so merili z dvema komplementarnima metrikama:

Pomembna posebnost: avtorji niso testirali samo na enem generativnem iskalniku, ampak so vključili tudi Perplexity.ai, kar omogoča primerjavo stabilnosti rezultatov čez različne sisteme.

Glavne ugotovitve

+41 % izboljšanje (Position-Adjusted Word Count)
+37 % na Perplexity.ai (Subjective Impression)
9 testiranih metod
~10k queryjev v benchmarku

1. Klasični SEO ne pomaga, lahko škodi

Med 9 testiranimi metodami so avtorji vključili tudi tradicionalne SEO tehnike. Najbolj presenetljiv rezultat za marketinški svet: keyword stuffing (gostota ključnih besed) je v generativnih iskalnikih ne deluje — pogosto celo zmanjša vidnost vsebine.2

Simple methods like Keyword Stuffing traditionally used in SEO don't perform well.
— Aggarwal et al. (KDD 2024)

Razlog je strukturen: tradicionalni Google iskalnik rangira strani po algoritmu, ki ocenjuje pojavnost ključnih besed (med drugim). Generativni iskalniki pa ne rangirajo — povzemajo. Ko AI gradi odziv, izbere vir, ki ima najbolj jedrnato, faktografsko gosto, citatno verodostojno vsebino. Ponavljanje ključne besede pri tem ne pomaga; lahko celo signalizira, da vsebina ni resna.

2. Tri najmočnejše GEO metode

Tri metode so se izkazale za bistveno učinkovitejše od ostalih:

Metoda Kaj naredi Učinek
Statistics Addition Dodaj konkretne statistike in številčne podatke v vsebino do +40 %
Cite Sources Citiraj avtoritativne zunanje vire (z linki) do +30 %
Quotation Addition Vključi neposredne citate strokovnjakov do +28 %
Fluency Optimization Izboljšaj slogovno tekočnost in jasnost stavkov +15–25 %
Keyword Stuffing (SEO) Poveča gostoto ključnih besed ~0 % ali negativen

Kombinacija prvih treh metod (statistike + citacije + citati) je dosegla najboljše rezultate skozi cel benchmark.

3. Kontekstualna občutljivost

Pomembna sekundarna ugotovitev je, da učinek metode variira glede na tematsko domeno. V tehničnih in faktografskih queryjih (npr. zdravstvo, pravo, znanost) so statistike in citacije najmočnejše. V kreativnih ali konverzacijskih queryjih je njihova prednost manjša, čeprav še vedno pozitivna.

Zakaj generativni iskalniki tako delujejo

Princetonova študija ne razlaga samo "kaj" — razlaga tudi "zakaj". Avtorji povezujejo svoje rezultate z mehaniko velikih jezikovnih modelov:

  1. LLM-i so trenirani na podatkih, ki cenijo navedene vire. Wikipedia, znanstvene revije, novičarski portali — vse to so vsebine, ki imajo veliko citacij in statistik. Model je torej naučen, da je vsebina s tovrstnimi signali bolj verodostojna.
  2. Faktografska gostota = lažja ekstrakcija. Ko AI gradi odziv, mora iz vira potegniti konkretne podatke. Vsebina, ki ima eksplicitne številke in datume, je za AI lažje "razčlenljiva" kot prozno besedilo brez konkretnih trditev.
  3. Citation chain = signal verodostojnosti. Če vaš članek citira Eurostat, in Eurostat citira vsa znanstvena dela, je vaš članek implicitno v "verodostojni verigi". AI-ji to prepoznajo.

Kaj to pomeni za slovenska podjetja

Trije konkretni operativni zaključki za slovensko poslovno okolje:

1. Spletna stran iz 2022 je v ChatGPT odzivih verjetno nevidna

Če je vaša spletna stran iz obdobja 2018–2022, je verjetno optimizirana za Google klasično (keyword density, backlinks, meta descriptions). Niti ena od teh tehnik ni v Princetonovi študiji dosegla pomembnih izboljšav za generativne iskalnike. Posledica: ko nekdo v 2026 vpraša ChatGPT "katera podjetja v Sloveniji ponujajo X", vaše ime se verjetno ne pojavi — niti če ste v Google rezultatih na prvem mestu.

2. Strateška vsebina mora vsebovati statistike + citacije + citate

Vsak landing page, blog članek ali storitvena stran, ki jo želite videti v ChatGPT odzivih, naj sledi formuli:

3. Struktura matters — schema markup, FAQ, jasna hierarhija

Princetonova študija eksplicitno ne testira strukturiranih podatkov (Schema.org JSON-LD), ampak vrsta drugih študij potrjuje, da tehnično strukturirana vsebina (z dobro hierarhijo H1/H2/H3, FAQ block-i, jasnimi citacijami) ima podoben učinek kot vsebinski signali. Pri Eflitte je ravno to del osnovne implementacije AI-pripravljene strani: schema markup, FAQ schema, BreadcrumbList in vsebinske GEO metode skupaj.

Slovenska prednost: v slovenščini je konkurence za citacije v generativnih iskalnikih bistveno manj kot v angleščini. Slovensko podjetje, ki sistematično aplicira GEO metode na slovenskih queryjih, lahko dokaj hitro doseže visok delež citacij — predvsem v nišnih panogah, kjer angleški dominantni viri (Wikipedia, večji ameriški blogi) ne pokrivajo lokalne specifike.

Omejitve študije

Tri pomembne omejitve, ki jih je treba upoštevati:

  1. Hitro spreminjajoč se ekosistem. Generativni iskalniki (ChatGPT, Perplexity, Google AI Overviews, Claude) se nenehno posodabljajo. Metode, ki so delovale leta 2024, se v 2026 lahko različno odzivajo. Mehanizmi (faktografska gostota, citacije) ostajajo robustni — taktične mikro-prilagoditve pa zastarajo.
  2. Sintetični benchmark. GEO-bench je raznolik, ampak še vedno sintetičen — pravi komercialni queryji v različnih jezikih (vključno s slovenščino) niso pokriti.
  3. Etika optimizacije. Avtorji v zaključku odprejo vprašanje: če vsi začnejo aplicirati GEO metode, ali se bo signal-to-noise razmerje v generativnih iskalnikih poslabšalo? To je odprto raziskovalno vprašanje za nadaljnja leta.

Nadaljnje raziskave

Po objavi tega papirja je nastala vrsta sorodnih del — vključno z raziskavo Kumar & Lakkaraju (2024) o adversarial napadih na LLM iskalnike in serije študij o "citation failures" v generativnih iskalnikih. Discipline GEO se torej razvija akademsko, ne samo industrijsko.

Zaključek

Aggarwal et al. (2024) so dokazali, da je Generative Engine Optimization realna, merljiva disciplina, ki se bistveno razlikuje od klasičnega SEO. Tri najmočnejše metode — statistike, citacije in citati — so univerzalno aplikabilne, vključno na slovenske spletne strani. Podjetja, ki bodo te metode sistematično vključila v svojo vsebinsko strategijo, bodo med prvimi citirana v ChatGPT, Perplexity in podobnih sistemih, kjer se trenutno odvija prerazporeditev iskalnega prometa.

Viri

  1. Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., Deshpande, A. (2024). GEO: Generative Engine Optimization. In Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '24), pp. 5–16. DOI: 10.1145/3637528.3671900. arXiv: arxiv.org/abs/2311.09735.
  2. Aggarwal et al. (2024), Table 6: Absolute impression metrics of GEO methods on GEO-bench. arXiv pred-print, str. 13.
  3. GEO-bench in spremljevalna koda na GitHub: github.com/GEO-optim/GEO.
Pogosto zastavljena vprašanja

Vprašanja o GEO

Termin Generative Engine Optimization (GEO) so formalizirali Pranjal Aggarwal, Vishvak Murahari, Tanmay Rajpurohit, Ashwin Kalyan, Karthik Narasimhan in Ameet Deshpande v študiji "GEO: Generative Engine Optimization", objavljeni na konferenci KDD 2024. Glavna avtorska institucija je Princeton University, sodelovali pa so še IIT Delhi, Georgia Tech in Allen Institute for AI. GEO je disciplina, ki strukturira spletno vsebino tako, da jo generativni iskalniki (ChatGPT, Perplexity, Google AI Overviews, Claude) prepoznajo, povzamejo in citirajo v svojih odgovorih.

Princetonova študija je preverila tudi tradicionalne SEO tehnike, vključno z "keyword stuffing". Rezultat: keyword stuffing pri generativnih iskalnikih NE izboljša vidnosti — pogosto jo celo zniža. Razlog: generativni iskalniki ne ocenjujejo strani po pojavnosti ključnih besed, ampak po faktografski gostoti, kvaliteti virov in strukturni jasnosti. Spletna stran, optimizirana izključno za Google z metodami iz leta 2018, je lahko v ChatGPT odzivih popolnoma nevidna.

Avtorji so testirali 9 metod. Tri so se izkazale za najmočnejše: (1) Statistics Addition — dodajanje konkretnih statistik in številčnih podatkov, (2) Cite Sources — citiranje avtoritativnih virov z linki, (3) Quotation Addition — vključevanje neposrednih citatov strokovnjakov. Najboljše kombinacije so dosegle do 40 % izboljšanje vidnosti v primerjavi z neoptimiziranim baseline-om. Metoda Fluency Optimization je prav tako pokazala učinkovitost.

Avtorji so razvili GEO-bench — benchmark s približno 10.000 raznolikimi uporabniškimi queryji čez 9 domen. Vidnost so merili z dvema metrikama: (1) Position-Adjusted Word Count — koliko besedila iz vašega vira AI pošteje uporablja in na kateri poziciji odgovora, (2) Subjective Impression — kompozitna ocena, ki upošteva več subjektivnih faktorjev citatne pomembnosti.

Študija je bila izvedena v angleščini, ampak mehanizmi (faktografska gostota, citacije virov, strukturna jasnost) so neodvisni od jezika. Slovenska podjetja, ki ciljajo na slovenske queryje v ChatGPT in Perplexity, imajo dejansko strukturno prednost: konkurence za citacije v slovenščini je manj kot v angleščini. Pomembno je, da je vsebina napisana z avtoritativnimi viri, statistikami in citati.

Tri ključne omejitve: (1) Generativni iskalniki se hitro spreminjajo — metode, ki so delovale v 2024, se v 2026 lahko različno odzivajo. (2) Študija je bila izvedena na sintetičnem GEO-bench-u, ne na pravih komercialnih queryjih. (3) Avtorji so testirali predvsem na tematikah z visoko strukturo (faktografskih); ali isto delujejo za kreativne ali subjektivne queryje, ni docela jasno.

Tri konkretni koraki: (1) Vsak strateški članek ali landing page naj vsebuje vsaj 3–5 konkretnih statistik z virom in linkom. (2) Vključujte neposredne citate strokovnjakov ali strank — to so "quotation addition" signali za AI. (3) Linkajte na avtoritativne vire (Eurostat, EU Commission, ugledni mediji), ne na lastne strani. To je "cite sources" metoda, ki je dosegla največje izboljšanje.

Papir je javno dostopen v dveh različicah: KDD 2024 konferenčna verzija prek ACM Digital Library (DOI: 10.1145/3637528.3671900) in pred-printna različica na arXiv (arxiv.org/abs/2311.09735). Spremljevalna koda in GEO-bench dataset sta dostopna na GitHub-u (github.com/GEO-optim/GEO).

Vašo stran vidi Google. Kako pa ChatGPT?

Pri 490 € Pregledu spletne strani testiramo, ali in kako se vaše podjetje pojavlja v ChatGPT, Claude in Perplexity odzivih. Brez obveznosti glede nadaljevanja.

Pišite nam →