Google,  Mesterséges intelligencia

Google szerint nincs szükség külön Markdown vagy JSON oldalak létrehozására az LLM-ek számára

Az utóbbi időben egyre többen vetették fel, hogy az LLM-ek (nagy nyelvi modellek) számára érdemes lenne speciális, csak nekik készült Markdown vagy JSON formátumú oldalakat létrehozni. A Google Search Advocate-je, John Mueller azonban nemrégiben egyértelműen elutasította ezt az elképzelést, és hangsúlyozta, hogy az LLM-ek már most is jól értik és feldolgozzák a hagyományos HTML oldalakat. Véleménye szerint a jobb mesterséges intelligencia teljesítmény nem a fájlformátumtól, hanem inkább a tiszta kódolástól és a megfelelő struktúrált adatoktól függ.

John Mueller véleménye az LLM-specifikus oldalakkal kapcsolatban

Az ötlet egy online beszélgetés során merült fel, amikor Lily Ray kérdésére válaszolt a Google szakembere. Ray arra volt kíváncsi, hogy a Google mit gondol azokról a gyakorlatokról, amelyek során kiadók külön Markdown vagy JSON oldalakat hoznak létre kizárólag az LLM-ek számára, és ezeket a botoknak szolgálják ki. Mueller erre azt válaszolta, hogy nincs tudomása olyan Google oldali igényről vagy megoldásról, amely ezt megkövetelné. Kiemelte, hogy az LLM-ek már az első pillanattól fogva képesek dolgozni a normál weboldalakkal, hiszen ezekből tanultak, így nincs értelme olyan oldalakat készíteni, amelyeket a felhasználók soha nem látnak.

Kifejtette továbbá, hogy ha a fájlformátum valóban számítana az AI válaszok minőségében, akkor az AI rendszereket fejlesztő cégek ezt már nyilvánosan is kommunikálnák, hiszen ezek a vállalatok nem titkolják az előnyös megoldásokat. Bár előfordulhat, hogy bizonyos oldalak jobban megfelelnek az AI-k számára, de ezt nem elsősorban a HTML vagy Markdown közötti különbség határozza meg, és általánosítható megoldás nincs ezen a téren.

A strukturált adatok szerepe és a jövő kilátásai

Az online beszélgetés résztvevői között többen is felhívták a figyelmet arra, hogy bár az általános tartalmak esetében nincs szükség külön formátumokra, bizonyos szűkebb területeken – például e-kereskedelmi termékadatoknál – a strukturált adatok és specifikus JSON sémák már ma is kulcsszerepet játszanak. Egy példa erre az OpenAI e-kereskedelmi termékfeedje, ahol a pontosan előírt JSON formátum segíti a ChatGPT-t abban, hogy hatékonyan kezelje és jelenítse meg a termékadatokat.

Ez az irány jól mutatja, hogy a strukturált adatok és a szabványosított formátumok akkor igazán fontosak, ha egy adott platform konkrét előírásokat tesz közzé és elvárja azok betartását. Ilyen esetekben a SEO szakembereknek érdemes fókuszálniuk a szabványoknak megfelelő adatok implementálására.

Mit tanulhatnak a weboldal-tulajdonosok ebből?

Ha valaki azon gondolkodik, hogy érdemes-e „LLM-optimalizált” Markdown vagy JSON verziókat létrehozni a tartalmaiból, John Mueller kommentárjai segíthetnek visszatérni a lényeghez. Az LLM-ek már régóta képesek értelmezni a hagyományos HTML oldalakat, így a legtöbb esetben érdemes inkább az oldalbetöltési sebesség, az olvashatóság és a tartalmi struktúra fejlesztésére koncentrálni. Emellett a strukturált adatok bevezetése akkor hasznos, ha egy adott platform egyértelműen megadja, milyen sémát kell követni.

Az AI-specifikus formátumok egyelőre inkább szűk területeken jelennek meg, és nem általános szabályként érvényesülnek. A technológia gyors fejlődésével azonban érdemes figyelemmel kísérni az újabb fejlesztéseket és ajánlásokat.

Következtetés

A jelenlegi helyzetben a SEO és fejlesztő csapatoknak az a legjobb stratégia, ha a weboldalak HTML kódját tisztán tartják, minimalizálják a fölösleges JavaScript használatot, és ahol van rá lehetőség, alkalmazzák a strukturált adatokat a platformok által ajánlott sémák szerint. A Google álláspontja szerint nem szükséges külön, csak LLM-eknek szánt Markdown vagy JSON oldalakkal foglalkozni, mert a mesterséges intelligencia rendszerek már most is jól boldogulnak a hagyományos weboldalakkal.

Az AI és keresőoptimalizálás összefonódása egyre komplexebb terület, de a jelenlegi legjobb gyakorlatokra alapozva biztosítható, hogy a tartalmak mindenki számára könnyen értelmezhetők legyenek, legyen szó emberi felhasználókról vagy mesterséges intelligenciáról.

Forrás: az eredeti angol cikk itt olvasható