Mesterséges intelligencia,  Technikai SEO

Új korszak a mesterséges intelligencia ügynökök számára: dinamikus eszközhasználat és programozható vezérlés

A mesterséges intelligencia (MI) ügynökök jövője egy olyan világot vetít elő, ahol a modellek zökkenőmentesen működnek együtt akár több száz vagy ezer különböző eszközzel. Legyen szó fejlesztői környezeti asszisztensről, amely git műveleteket, fájlkezelést, csomagkezelőket, tesztelési keretrendszereket és telepítési folyamatokat egyesít, vagy műveleti koordinátorról, amely egyszerre kapcsolódik Slackhez, GitHubhoz, Google Drive-hoz, Jira-hoz, vállalati adatbázisokhoz és több MCP szerverhez – a hatékony ügynököknek képesnek kell lenniük az eszközök végtelen könyvtárával dolgozni, anélkül, hogy minden definíciót előre be kellene tölteniük a kontextusba.

Az új fejlesztések pontosan ezen a területen hoznak áttörést, lehetővé téve, hogy az MI-ügynökök dinamikusan fedezzék fel és töltsék be az eszközöket igény szerint, csak az adott feladathoz szükséges információkat kezelve. Ezzel a megközelítéssel jelentősen csökken a kontextus terhelése, nő az eszközválasztás pontossága, és javul a működés hatékonysága.

Tool Search Tool: intelligens eszközkeresés a kontextus megőrzéséért

Az egyik legnagyobb kihívás a nagyszámú eszköz definíciójának kezelése. Egy közepes méretű rendszerben, amely több szervert és eszközt használ, az előzetesen betöltött definíciók akár több tízezer tokennyi szöveget is elfoglalhatnak – ami a modell kontextusának jelentős részét leköti, még mielőtt elindulna a valódi feladat feldolgozása.

Az új Tool Search Tool funkció lehetővé teszi, hogy az MI-ügynök csak az adott feladathoz szükséges eszközöket töltse be, így az előzetes betöltött definíciók helyett dinamikusan keressen és hívjon meg eszközöket. Ez akár 85%-os token-megtakarítást eredményez, miközben az eszköztár teljes funkcionalitása elérhető marad. A belső tesztek során az eszközválasztás pontossága jelentősen javult, ami a komplex rendszerekben kritikus előnyt jelent.

Programmatic Tool Calling: programozható eszközvezérlés a hatékonyabb munkafolyamatokért

A hagyományos eszközhasználat során az MI minden eszközhívásnál újabb értelmezési lépést hajt végre, és az eszközök által visszaadott részletes, köztes eredmények felhalmozódnak a kontextusban, ami gyorsan túlterhelheti azt. Például egy több ezer soros Excel táblázat elemzése során az egész adatállomány bekerül a modell kontextusába, holott csak összegzett vagy szűrt információkra lenne szükség.

A Programmatic Tool Calling megoldásként lehetővé teszi, hogy az MI kód formájában írja meg az eszközök orchesztrációját. Így a kód egy sandbox környezetben fut, ahol az eszközök párhuzamosan hívhatók, az intermediate adatok pedig nem kerülnek be a modell kontextusába, csak a végső eredmény. Ez jelentős mértékben csökkenti a token-felhasználást, gyorsítja a válaszadást, és növeli az eredmények pontosságát, különösen összetett, többlépéses munkafolyamatok esetén.

Tool Use Examples: minták a helyes eszközhasználathoz

A JSON sémák ugyan meghatározzák az eszközök struktúráját, de gyakran nem adják vissza a használati mintákat, például hogy mikor és milyen paramétereket érdemes megadni, vagy milyen kombinációk elfogadhatóak. Ez hibás hívásokhoz és pontatlan eredményekhez vezethet.

Az új Tool Use Examples funkcióval konkrét, valós példákat lehet megadni az eszközhasználatról. Így az MI-ügynök megtanulja a helyes paraméterezési szokásokat és a domain-specifikus konvenciókat, ami jelentősen növeli a helyes hívások arányát. Belső tesztek során akár 72%-ról 90%-ra nőtt a komplex paraméterkezelés pontossága.

Hogyan érdemes alkalmazni az új funkciókat?

Az új megoldások egymást kiegészítve segítik az MI-ügynökök hatékonyabbá tételét. Érdemes először az adott rendszer legnagyobb korlátját azonosítani – legyen az a kontextus túlterhelése, a köztes eredmények kezelése vagy a paraméterezési hibák – és az erre leginkább alkalmas új funkcióval kezdeni.

Például nagy eszközkönyvtár és sok hasonló nevű eszköz esetén a Tool Search Tool jelent nagy előnyt. Komplex, több lépésből álló munkafolyamatoknál a Programmatic Tool Calling segít a hatékonyabb végrehajtásban. Több opcionális paraméterrel és összetett API-konvenciókkal dolgozó rendszereknél a Tool Use Examples biztosítja a helyes használatot.

Összegzés

Az MI-ügynökök jövője a dinamikus eszközhasználatban, a programozható vezérlésben és a helyes használati minták beépítésében rejlik. Az Anthropic által bevezetett új eszközök – a Tool Search Tool, a Programmatic Tool Calling és a Tool Use Examples – forradalmasítják az MI és eszközkönyvtárak együttműködését. Ezek segítségével a modellek hatékonyabban, pontosabban és gyorsabban képesek kezelni a komplex, sokrétű feladatokat, megnyitva az utat az intelligensebb, skálázhatóbb AI-ügynökök előtt.

Az új funkciók jelenleg béta változatban érhetők el, és már számos fejlesztői platformon kipróbálhatók, amelyek dokumentációja és példakódjai is rendelkezésre állnak. Az innováció folyamatos, és izgalmas látni, hogy a közösség miként használja majd ki ezeket az új lehetőségeket a jövő intelligens megoldásainak megalkotásához.

Forrás: az eredeti angol cikk itt olvasható