Lühike vastus: Praktikas toimiva tehisintellekti agendi loomiseks käsitle seda kontrollitud tsüklina: võta sisend vastu, otsusta järgmine toiming, kutsu kitsa ulatusega tööriist, jälgi tulemust ja korda, kuni selge „tehtud“ kontroll läbib. See teenib oma koha, kui ülesanne on mitmeastmeline ja tööriistapõhine; kui üksainus viip lahendab selle, jätke agent vahele. Lisage ranged tööriistaskeemid, sammupiirangud, logimine ja valideerija/kriitik, et tööriistade rikke või sisendite ebaselguse korral agent eskaleeruks tsükli asemel.
Peamised järeldused:
Kontrolleri tsükkel : Rakenda sisend→toiming→korduse jälgimine selgesõnaliste peatumistingimuste ja maksimaalsete sammudega.
Tööriistade disain : Hoidke tööriistad kitsad, tüübitud, lubadega ja valideeritud, et vältida „midagi tegema” kaost.
Mäluhügieen : kasutage kompaktset lühiajalist olekut koos pikaajalise otsinguga; vältige täielike transkriptide dumpinguvõimaluste loomist.
Väärkasutuse vältimine : lisage riskantsete toimingute jaoks lubatud loendid, kiirusepiirangud, idempotentsus ja „proovikatsetus“.
Testitavus : Säilitage stsenaariumide komplekt (tõrked, ebaselgus, süstid) ja käivitage see iga muudatuse korral uuesti.

🔗 Kuidas tehisintellekti jõudlust mõõta
Õpi praktilisi mõõdikuid kiiruse, täpsuse ja töökindluse võrdlemiseks.
🔗 Kuidas tehisintellektiga rääkida
Paremate vastuste saamiseks kasutage vihjeid, konteksti ja järelküsimusi.
🔗 Kuidas tehisintellekti mudeleid hinnata
Võrdle mudeleid testide, rubriikide ja reaalsete ülesannete tulemuste abil.
🔗 Kuidas tehisintellekti mudeleid optimeerida
Paranda kvaliteeti ja kulusid häälestamise, kärpimise ja jälgimise abil.
1) Mis on tehisintellekti agent tavainimese mõistes 🧠
Tehisintellekti agent on tsükkel. LangChaini „Agentide” dokumentatsioon
See on kõik. Aas, mille keskel on aju.
Sisend → mõtle → tegutse → jälgi → korda . ReAct paber (arutle + tegutse)
Kus:
-
Sisend on kasutaja päring või sündmus (uus e-kiri, tugiteenuse pilet, anduri ping).
-
„Mõtle“ on keelemudel, mis arutleb järgmise sammu üle.
-
Act kutsub tööriista (otsi sisedokumentatsioonist, käivita koodi, loo päring, kirjuta vastus). OpenAI funktsioonide kutsumise juhend
-
Observe loeb tööriista väljundit.
-
Kordus on see osa, mis muudab teksti pigem agendilikuks kui jutukalt jutukaks. LangChaini „Agentide” dokumendid
Mõned agendid on põhimõtteliselt nutikad makrod. Teised toimivad pigem nagu nooremad operaatorid, kes suudavad ülesannetega žongleerida ja vigadest taastuda. Mõlemad loevad.
Samuti ei vaja sa täielikku autonoomiat. Tegelikult... sa ilmselt ei tahagi seda 🙃
2) Millal peaksite agendi looma (ja millal mitte) 🚦
Loo agent, kui:
-
Töö on mitmeastmeline ja muutub olenevalt sellest, mis vahepeal toimub.
-
Töö nõuab tööriistade kasutamist (andmebaasid, CRM-id, koodi käivitamine, failide genereerimine, brauserid, sisemised API-d). LangChaini tööriistade dokumentatsioon.
-
Sa tahad korratavaid tulemusi koos piiretega, mitte ainult ühekordseid lahendusi.
-
Saate defineerida „valmis“ viisil, mida arvuti saab kontrollida, isegi lõdvalt.
Ärge looge agenti, kui:
-
Lihtne küsimus + vastus lahendab probleemi (ära pinguta üle, sa vihkad ennast hiljem).
-
Teil on vaja täiuslikku determinismi (agendid võivad olla järjepidevad, aga mitte robotlikud).
-
Sul pole ühenduse loomiseks mingeid tööriistu ega andmeid – siis on see enamasti vaid vibratsioon.
Olgem ausad: pooled „tehisintellekti agendi projektidest” võiksid olla töövood mõne hargnemisreegliga. Aga noh, vahel on ka õhkkond oluline 🤷♂️
3) Mis teeb tehisintellekti agendi heaks versiooniks ✅
Siin on see osa „Mis teeb hea versiooni millestki”, mida sa palusid, aga ma ütlen nüüd veidi otsekohene välja:
Hea tehisintellekti agendi versioon ei see, mis kõige rohkem mõtleb. See on see, mis:
-
Teab, mida on lubatud teha (ulatuspiirid)
-
Kasutab tööriistu usaldusväärselt (struktureeritud kõned, uuestikatsed, ajalõpud) OpenAI funktsioonide kutsumise juhend AWS „Ajalõpud, uuestikatsed ja tagasilöök värinaga”
-
Hoiab oleku puhtana (mälu, mis ei lagune) LangChain „Mälu ülevaade”
-
Selgitab oma tegevusi (auditeerimisjäljed, mitte salajased arutluskäigud) NIST AI RMF 1.0 (usaldusväärsus ja läbipaistvus)
-
Peatub sobivalt (täidetavuskontrollid, maksimaalsed sammud, eskalatsioon) LangChaini „agentide” dokumendid
-
Ebaõnnestub ohutult (palub abi, ei hallutsineeri autoriteeti) NIST AI RMF 1.0
-
On testitav (saate seda käivitada valmis stsenaariumide korral ja tulemusi skoorida)
Kui su agenti ei saa testida, on see põhimõtteliselt väga enesekindel mänguautomaat. Lõbus pidudel, hirmutav tootmises 😬
4) Agendi põhilised ehitusplokid („anatoomia” 🧩)
Enamikul tahketel ainetel on need tükid:
A) Kontrolleri silmus 🔁
See on orkestreerija:
-
löö värav
-
küsi modellilt järgmise tegevuse kohta
-
käivita tööriist
-
lisa vaatlus
-
korda kuni LangChaini „agentide” dokumendid
B) Tööriistad (ehk võimed) 🧰
Tööriistad on need, mis muudavad agendi tõhusaks: LangChaini tööriistade dokumentatsioon
-
andmebaasipäringud
-
e-kirjade saatmine
-
failide tõmbamine
-
töötav kood
-
sisemiste API-de kutsumine
-
kirjutamine arvutustabelitesse või kliendisuhete haldussüsteemidesse
C) Mälu 🗃️
Kaks liiki on olulised:
-
lühiajaline mälu : praegune jooksu kontekst, viimased sammud, praegune plaan
-
pikaajaline mälu : kasutaja eelistused, projekti kontekst, hangitud teadmised (sageli manustuste ja vektorsalvestuse kaudu) RAG-paber
D) Planeerimis- ja otsustuspoliitika 🧭
Isegi kui sa seda "planeerimiseks" ei nimeta, vajad meetodit:
-
kontrollnimekirjad
-
ReAct-stiilis „mõtle ja siis kasuta” ReAct-töö
-
ülesannete graafikud
-
juhendaja-töötaja mustrid
-
juhendaja-töötaja mustrid Microsoft AutoGen (mitme agendi raamistik)
E) Piirded ja hindamine 🧯
-
õigused
-
Ohutute tööriistade skeemid OpenAI struktureeritud väljundid
-
väljundi valideerimine
-
sammude piirangud
-
metsaraie
-
testid NIST AI RMF 1.0
Jah, see on pigem inseneritöö kui õhutamine. Mis ongi... omamoodi mõte.
5) Võrdlustabel: populaarsed viisid agendi loomiseks 🧾
Allpool on realistlik „võrdlustabel“ – mõne veidrusega, sest päris meeskonnad on veidrad 😄
| Tööriist / raamistik | Sihtrühm | Hind | Miks see toimib | Märkmed (pisike kaos) | |
|---|---|---|---|---|---|
| LangChain | ehitajad, kellele meeldivad lego-stiilis komponendid | tasuta-vähe + infrapuna | suur tööriistade, mälu ja kettide ökosüsteem | võib saada spagetikiiresti, kui sa asju selgelt ei nimeta | |
| LlamaIndex | RAG-rasked meeskonnad | tasuta-vähe + infrapuna | tugevad otsingumustrid, indekseerimine, konnektorid | suurepärane, kui teie agent põhimõtteliselt otsib ja tegutseb... mis on tavaline | |
| OpenAI assistentide stiilis lähenemine | meeskonnad, kes soovivad kiiremat seadistamist | kasutuspõhine | sisseehitatud tööriista kutsumismustrid ja käitusolek | mõnes nurgas vähem paindlik, kuid paljude rakenduste jaoks puhas | OpenAI Runs API OpenAI Assistantsi funktsioonide kutsumine |
| Semantiline tuum | arendajad, kes soovivad struktureeritud orkestreerimist | vabameelne | oskuste/funktsioonide puhas abstraktsioon | tundub „ettevõtte kombel korralik“ – vahel on see isegi kompliment 😉 | |
| AutoGen | mitme agendiga eksperimenteerijad | vabameelne | agentidevahelise koostöö mustrid | võib üle rääkida; kehtestada ranged lõpetamise reeglid | |
| Meeskonna tehisintellekt | "Agentide meeskondade" fännid | vabameelne | Rollid + ülesanded + üleandmised on kergesti väljendatavad | toimib kõige paremini siis, kui ülesanded on selged, mitte lögased | |
| Heinakuhja | otsing + müügikanalid, inimesed | vabameelne | tahked torujuhtmed, otsing, komponendid | vähem „agentide teatrit“, rohkem „praktilist tehast“ | |
| Veereta ise (kohandatud silmus) | kontrollifriikid (hell-friigid) | sinu aeg | minimaalne maagia, maksimaalne selgus | tavaliselt parim pikaajaline... kuni sa kõik uuesti leiutad 😅 |
Ühte võitjat pole. Parim valik sõltub sellest, kas teie agendi peamine ülesanne on andmete otsimine , tööriistade käivitamine , mitme agendi koordineerimine või töövoo automatiseerimine .
6) Kuidas samm-sammult tehisintellekti agenti luua (tegelik retsept) 🍳🤖
See on osa, mille enamik inimesi vahele jätab, ja seejärel imestab, miks agent käitub sahvris nagu kährik.
1. samm: määratle töö ühe lausega 🎯
Näited:
-
„Koostage kliendile vastus, kasutades poliitikat ja pileti konteksti, ning seejärel küsige kinnitust.“
-
"Uuri veateadet, reprodutseeri see ja paku välja parandus."
-
„Muutke ebatäiuslikud koosoleku märkmed ülesanneteks, omanikeks ja tähtaegadeks.“
Kui sina ei suuda seda lihtsalt defineerida, siis ei suuda seda ka sinu agent. Ma mõtlen, et saab küll, aga improviseerib ja improvisatsioonis eelarved kaovad.
2. samm: Määrake autonoomsuse tase (madal, keskmine, vürtsikas) 🌶️
-
Madal autonoomia : soovitab samme, inimene klõpsab nupul „Kinnita“
-
Keskmine : käivitab tööriistad, koostab väljundi mustandi, eskaleerub ebakindluse korral
-
Kõrge : teostab otsast lõpuni, saadab inimestele pingi ainult erandite korral
Alusta madalamalt kui soovid. Hiljem saad alati suuremaks keerata.
3. samm: valige oma mudelistrateegia 🧠
Tavaliselt valid:
-
üks tugev mudel kõige jaoks (lihtne)
-
üks tugev mudel + väiksem mudel odavate sammude jaoks (klassifitseerimine, freesimine)
-
Vajadusel spetsiaalsed mudelid (nägemine, kood, kõne)
Samuti otsustage:
-
maksimaalne arv märke
-
temperatuur
-
kas lubate pikki arutlusjälgi sisemiselt (võite, aga ärge avaldage toorest mõtteahelat lõppkasutajatele)
4. samm: määratlege tööriistad rangete skeemidega 🔩
Tööriistad peaksid olema:
-
kitsas
-
trükitud
-
lubatud
-
valideeritud OpenAI struktureeritud väljundid
do_anything(input: string) asemel tehke:
-
search_kb(päring: string) -> tulemused[] -
create_ticket(pealkiri: string, sisu: string, prioriteet: enum) -> ticket_id -
send_email(saaja: string, teema: string, sisu: string) -> statusOpenAI funktsiooni kutsumise juhend
Kui annad agendile mootorsae, siis ära ehmu, kui ta hekki pügades ka aia eemaldab.
5. samm: loo kontrolleri silmus 🔁
Minimaalne tsükkel:
-
Alusta eesmärgist + esialgsest kontekstist
-
Küsi modellilt: „Järgmine tegevus?“
-
Kui tööriista kutsutakse, siis käivita tööriist
-
Lisa vaatlus
-
Kontrollige peatumistingimust
-
Korda (maksimaalse sammuga) LangChaini „Agentide” dokumentatsiooni
Lisa:
-
ajalõpud
-
uuestikatsed (ettevaatust – uuestikatsed võivad tsüklisse minna) AWS „Ajalõpud, uuestikatsed ja tagasilöök värinaga”
-
tööriista vea vormindamine (selge, struktureeritud)
6. samm: lisage mälu ettevaatlikult 🗃️
Lühiajaline: hoidke kompaktset „oleku kokkuvõtet“, mida igal sammul uuendatakse. LangChain „mälu ülevaade“.
Pikaajaline: salvestage püsivaid fakte (kasutaja eelistused, organisatsiooni reeglid, stabiilsed dokumendid).
Rusikareegel:
-
kui see sageli muutub - hoidke see lühiajalisena
-
kui see on stabiilne - hoidke pikaajaliselt
-
kui see on tundlik - hoidke minimaalselt (või üldse mitte)
7. samm: lisage valideerimine ja kriitika läbimine 🧪
Odav ja praktiline muster:
-
agent genereerib tulemuse
-
valideerija kontrollib struktuuri ja piiranguid
-
Valikuline kriitilise mudeli ülevaade puuduvate sammude või eeskirjade rikkumiste osas NIST AI RMF 1.0
Mitte täiuslik, aga tabab šokeerivalt palju jama.
8. samm: logige kõik, mille logimata jätmist te kahetsete 📜
Logi:
-
tööriistakutsed + sisendid + väljundid
-
tehtud otsused
-
vead
-
lõppväljundid
-
märgid ja latentsus OpenTelemetry jälgitavuse alus
Tulevik - sa tänad sind. Olevik - sa unustad. See on lihtsalt elu 😵💫
7) Tööriistade kasutamine, mis ei murra su hinge 🧰😵
Tööriistakutse on see, kus „Kuidas luua tehisintellekti agenti“ saab tõeliseks tarkvaratehnikaks.
Tee tööriistad töökindlaks (töökindel on hea)
Usaldusväärsed tööriistad on:
-
deterministlik
-
kitsa ulatusega
-
lihtne testida
-
Stripe'i „Idempotentsete päringute” uuesti käivitamine on ohutu
Lisa tööriistakihile kaitsepiirded, mitte ainult viipasid
Küsimused on viisakad soovitused. Tööriista valideerimine on lukustatud uks. OpenAI struktureeritud väljundid.
Tee:
-
lubatud nimekirjad (milliseid tööriistu saab käivitada)
-
sisendi valideerimine
-
kiiruspiirangud OpenAI kiiruspiirangute juhend
-
lubade kontrollid kasutaja/organisatsiooni kohta
-
„Kuivkäivitusrežiim” riskantsete tegevuste jaoks
Osalise rikke projekteerimine
Tööriistad ebaõnnestuvad. Võrgud kõikuvad. Autoriseerimine aegub. Agent peab:
-
tõlgendada vigu
-
uuesti proovimine koos vajadusel taganemisega Google Cloudi uuesti proovimise strateegia (taganemine + värin)
-
vali alternatiivsed tööriistad
-
eskaleeruda, kui see on kinni jäänud
Vaikselt tõhus nipp: tagastage struktureeritud vead, näiteks:
-
tüüp: autentimisviga -
tüüp: ei_leitud -
tüüp: rate_limited
Nii saab mudel paanika asemel arukalt reageerida.
8) Mälu, mis aitab sind kummitamise asemel 👻🗂️
Mälu on võimas, aga sellest võib saada ka rämpsuhunnik.
Lühiajaline mälu: hoia see kompaktsena
Kasutamine:
-
viimased N sammu
-
jooksev kokkuvõte (värskendatakse iga tsükli järel)
-
praegune plaan
-
praegused piirangud (eelarve, aeg, poliitika)
Kui kõik konteksti asetada, siis saadakse:
-
kõrgem hind
-
aeglasem latentsus
-
rohkem segadust (jah, isegi siis)
Pikaajaline mälu: taastamine "toppimise" asemel
Enamik „pikaajalisest mälust” on pigem selline:
-
manustused
-
vektoripood
-
otsingu täiustatud genereerimine (RAG) RAG-paber
Agent ei jäta meelde. See otsib käitusajal kõige olulisemad koodijupid. LlamaIndex „Sissejuhatus RAG-i”
Praktilised mälureeglid
-
Salvesta „eelistused” otseste faktidena: „Kasutajale meeldivad täpploendid ja ta vihkab emotikone” (lol, aga mitte siin 😄)
-
Salvesta „otsused” ajatemplite või versioonidega (muidu kuhjuvad vastuolud)
-
Ära hoia saladusi, kui sa seda tõesti ei pea tegema
Ja siin on minu ebatäiuslik metafoor: mälu on nagu külmkapp. Kui sa seda kunagi ei puhasta, maitseb su võileib lõpuks sibula ja kahetsuse järele.
9) Planeerimismustrid (lihtsast uhkeni) 🧭✨
Planeerimine on lihtsalt kontrollitud lagunemine. Ära tee sellest müstilist.
Muster A: Kontrollnimekirja planeerija ✅
-
Mudel väljastab sammude loendi
-
Teostub samm-sammult
-
Kontrollnimekirja oleku värskendused
Suurepärane sisseelamiseks. Lihtne, testitav.
Muster B: ReAct tsükkel (põhjus + tegu) 🧠→🧰
-
mudel otsustab järgmise tööriista kutsumise
-
jälgib väljundit
-
kordab ReAct paberit
See on klassikaline agenditunne.
Muster C: Juhendaja-töötaja 👥
-
juhendaja jagab eesmärgi ülesanneteks
-
töötajad täidavad spetsialiseeritud ülesandeid
-
juhendaja ühendab tulemused Microsoft AutoGenis (mitme agendi raamistik)
See on väärtuslik, kui ülesandeid saab paralleelselt teostada või kui soovite erinevaid "rolle", näiteks:
-
teadlane
-
kodeerija
-
toimetaja
-
Kvaliteedikontrollija
Muster D: Planeeri ja seejärel teosta koos ümberplaneerimisega 🔄
-
loo plaan
-
hukkama
-
Kui tööriista tulemused muudavad tegelikkust, planeerige uuesti
See takistab agendil kangekaelselt halba plaani järgimast. Inimesed teevad seda ka, välja arvatud juhul, kui nad on väsinud, sellisel juhul järgivad nad samuti halbu plaane.
10) Ohutus, usaldusväärsus ja vallandamata jätmine 🔐😅
Kui teie agent saab tegutseda, vajate ohutusdisaini. Mitte "hea, et on". Vajadus. NIST AI RMF 1.0
Jäigad piirangud
-
maksimaalne sammude arv jooksu kohta
-
tööriistakõnede max minutis
-
maksimaalne kulutus seansi kohta (tokeni eelarve)
-
piiratud tööriistad heakskiidu taga
Andmetöötlus
-
tundlike sisendite eemaldamine enne logimist
-
eraldi keskkonnad (arendus- vs. tootmiskeskkonnad)
-
vähimõigustega tööriistaõigused
Käitumuslikud piirangud
-
sundige agenti viitama sisemistele tõendite katkenditele (mitte välistele linkidele, vaid ainult sisemistele viidetele)
-
nõuda ebakindluse märgistamist, kui usaldus on madal
-
nõuda „esitada selgitav küsimus”, kui sisend on mitmetähenduslik
Usaldusväärne agent ei ole kõige enesekindlam. See on see, kes teab, millal ta arvab... ja ütleb selle välja.
11) Testimine ja hindamine (osa, mida kõik väldivad) 🧪📏
Sa ei saa paremaks muuta seda, mida sa ei saa mõõta. Jah, see lause on küll klišeelik, aga tüütult tõsi.
Koostage stsenaariumide komplekt
Loo 30–100 testi:
-
õnnelikud teed
-
äärejuhtumid
-
„Tööriista rikke” juhtumid
-
ebamäärased taotlused
-
Vastandlikud küsimused (kiire süstimise katsed) OWASP 10 parimat LLM-rakenduste jaoks OWASP LLM01 kiire süstimine
Skooride tulemused
Kasutage selliseid mõõdikuid nagu:
-
ülesande edukuse määr
-
valmimisaeg
-
tööriistavigade taastamise määr
-
hallutsinatsioonide määr (väited ilma tõenditeta)
-
inimeste heakskiidu määr (jälgitava režiimi korral)
Regressioonitestid küsimuste ja tööriistade jaoks
Iga kord, kui muudate:
-
tööriista skeem
-
süsteemi juhised
-
otsinguloogika
-
Mälu vormindamine
Käivitage komplekt uuesti.
Agentid on tundlikud loomad. Nagu toalilled, aga kallimad.
12) Juurutamismustrid, mis ei sulata teie eelarvet 💸🔥
Alusta ühe teenusega
-
agendi kontrolleri API
-
tööriistateenused selle taga
-
logimine + jälgimine OpenTelemetry jälgitavuse alus
Lisage kulukontrollid varakult
-
otsingutulemuste vahemällu salvestamine
-
vestluse oleku tihendamine kokkuvõtetega
-
väiksemate mudelite kasutamine freesimiseks ja ekstraheerimiseks
-
„sügava mõtlemise režiimi“ piiramine kõige raskemate sammudega
Levinud arhitektuurivalik
-
olekuta kontroller + väline oleku salvestus (andmebaas/redis)
-
Tööriistakutsed on võimaluse korral idempotentsed Stripe'i „Idempotentsed taotlused”
-
pikkade ülesannete järjekord (nii et te ei hoia veebipäringut igavesti avatuna)
Samuti: ehitage "tapmislüliti". Te ei vaja seda enne, kui teil seda tõesti, tõesti vaja läheb 😬
13) Lõppsõna - lühike versioon teemal "Kuidas luua tehisintellektiga agenti" 🎁🤖
Kui sa midagi muud ei mäleta, siis pea meeles järgmist:
-
Tehisintellekti agendi loomine seisneb peamiselt mudeli ümber turvalise ahela loomises. LangChaini „agentide” dokumentatsioon.
-
Alusta selge eesmärgi, vähese autonoomia ja rangete tööriistadega. OpenAI struktureeritud väljundid
-
Lisa mälu otsingu, mitte lõputu konteksti täitmise kaudu. RAG-paber
-
Planeerimine võib olla lihtne – kontroll-nimekirjad ja ümberplaneerimine viivad kaugele.
-
Logimine ja testid muudavad agentide kaose millekski, mida saate edastada. OpenTelemetry jälgitavuse juhend
-
Kaitsepiirded kuuluvad koodi, mitte ainult käskudesse. OWASP 10 parimat LLM-rakendust
Agent ei ole maagia. See on süsteem, mis teeb piisavalt sageli häid otsuseid, et olla väärtuslik... ja tunnistab lüüasaamist enne, kui see kahju tekitab. Vaikselt lohutav, omamoodi 😌
Ja jah, kui see õigesti üles ehitada, tundub see nagu pisikese digipraktikandi palkamine, kes kunagi ei maga, aeg-ajalt paanitseb ja armastab paberimajandust. Seega põhimõtteliselt praktikant.
KKK
Mis on tehisintellekti agent lihtsustatult öeldes?
Tehisintellekti agent on põhimõtteliselt korduv tsükkel: võtab sisendi vastu, otsustab järgmise sammu, kasutab tööriista, loeb tulemuse ja kordab, kuni see on tehtud. „Agentne“ osa tuleneb tegutsemisest ja jälgimisest, mitte ainult vestlemisest. Paljud agendid on lihtsalt nutikas automatiseerimine tööriistadele juurdepääsuga, samas kui teised käituvad pigem nagu noorem operaator, kes suudab vigadest taastuda.
Millal peaksin looma tehisintellekti agendi, mitte lihtsalt viipa kasutama?
Loo agent, kui töö on mitmeastmeline, muutub vahetulemuste põhjal ja vajab usaldusväärsete tööriistade kasutamist (API-d, andmebaasid, piletimüük, koodi käivitamine). Agendid on kasulikud ka siis, kui soovite korratavaid tulemusi koos turvapiiretega ja viisiga kontrollida, kas töö on tehtud. Kui lihtne kiire reageerimine toimib, on agent tavaliselt ebavajalik lisakulu ja lisatõrkerežiimid.
Kuidas luua tehisintellekti agent, mis ei jää tsüklitesse kinni?
Kasutage järskude peatamiste tingimusi: maksimaalne sammude arv, maksimaalne tööriistakutsete arv ja selged lõpetamise kontrollid. Lisage struktureeritud tööriistaskeemid, ajalõpud ja uuestikatsed, mis ei kordu igavesti. Logige otsused ja tööriista väljundid, et näeksite, kus see rööbastelt maha jookseb. Levinud turvaventiil on eskalatsioon: kui agent on ebakindel või kordab vigu, peaks ta abi küsima, mitte improviseerima.
Milline on tehisintellekti agendi loomise minimaalne arhitektuur?
Minimaalselt on vaja kontrolleri tsüklit, mis annab mudelile eesmärgi ja konteksti, küsib järgmist toimingut, käivitab tööriista, kui seda küsitakse, lisab vaatluse ja kordab. Samuti on vaja tööriistu, millel on ranged sisend-/väljundkujud ja „valmis“ kontroll. Isegi „ise-üles-tsükkel“ võib hästi toimida, kui hoiad oleku puhtana ja jõustad sammupiirangud.
Kuidas peaksin tööriista kutsumise kavandama nii, et see oleks tootmises usaldusväärne?
Hoidke tööriistad kitsalt valitud, tüübitud, lubatud ja valideeritud – vältige üldist „tee_kõike” tööriista. Eelistage rangeid skeeme (nagu struktureeritud väljundid/funktsioonide kutsumine), et agent ei saaks sisendeid käsitsi edastada. Lisage tööriistakihile lubatud loendid, kiirusepiirangud ja kasutaja/organisatsiooni õiguste kontrollid. Kujundage tööriistad nii, et neid oleks võimaluse korral ohutu uuesti käivitada, kasutades idempotentsuse mustreid.
Kuidas on kõige parem mälu lisada ilma agenti halvemaks muutmata?
Käsitle mälu kahe osana: lühiajaline käitusseisund (hiljutised sammud, praegune plaan, piirangud) ja pikaajaline otsing (eelistused, stabiilsed reeglid, asjakohased dokumendid). Hoia lühiajaline mälu kompaktsena ja kasuta jooksvaid kokkuvõtteid, mitte täielikke transkripte. Pikaajalise mälu puhul on otsing (manused + vektori salvestamine/RAG-mustrid) tavaliselt parem kui kõige konteksti "toppimine" ja mudeli segadusse ajamine.
Millist planeerimismustrit peaksin kasutama: kontroll-lehte, ReActi või juhendaja-töötaja plaani?
Kontrollnimekirja planeerija on suurepärane, kui ülesanded on etteaimatavad ja soovite midagi hõlpsasti testitavat. ReAct-stiilis tsüklid on head, kui tööriista tulemused muudavad teie edasisi samme. Juhendaja-töötaja mustrid (nagu AutoGen-stiilis rollide eraldamine) on abiks, kui ülesandeid saab paralleelselt teostada või kui need saavad kasu erinevatest rollidest (teadlane, kodeerija, kvaliteedikontroll). Planeeri-siis-teosta koos ümberplaneerimisega on praktiline kesktee kangekaelsete halbade plaanide vältimiseks.
Kuidas muuta agent turvaliseks, kui see saab ette võtta reaalseid toiminguid?
Kasutage minimaalsete õiguste õigusi ja piirake riskantsete tööriistade kasutamist kinnitamise või prooviperioodi režiimide abil. Lisage eelarveid ja piiranguid: maksimaalne sammude arv, maksimaalne kulutus ja minutipõhised tööriistakutse piirangud. Eemaldage tundlikud andmed enne logimist ja eraldage arenduskeskkond tootmiskeskkondadest. Nõuage ebamäärasuse märgistamist või selgitavaid küsimusi, kui sisendid on mitmetähenduslikud, selle asemel, et lasta kindlusel tõendeid asendada.
Kuidas ma saan tehisintellekti agenti testida ja hinnata, et see aja jooksul paremaks muutuks?
Loo stsenaariumide komplekt, mis sisaldab õnnestunud teid, äärmusjuhtumeid, tööriistade tõrgete, mitmetähenduslike taotluste ja viipsüstimise katseid (OWASP-stiilis). Hinda tulemusi, nagu ülesande edukus, täitmisaeg, tööriistavigadest taastumine ja tõenditeta väited. Iga kord, kui muudad tööriistaskeeme, viipasid, otsingut või mälu vormindamist, käivita komplekt uuesti. Kui sa ei saa seda testida, ei saa sa seda usaldusväärselt tarnida.
Kuidas ma saan agenti juurutada ilma latentsusaega ja kulusid suurendamata?
Levinud muster on olekuteta kontroller välise olekusalvestusega (andmebaas/Redis), selle taga olevate tööriistateenuste ja tugeva logimise/monitoorimisega (sageli OpenTelemetry). Kulusid saab kontrollida otsingu vahemällu salvestamise, kompaktsete oleku kokkuvõtete, väiksemate marsruutimis-/ekstraktimismudelite ja „süvamõtlemise“ piiramisega kõige raskemate sammudega. Kasutage pikkade ülesannete jaoks järjekordi, et te ei hoiaks veebipäringuid avatud. Lisage alati tapmislüliti.
Viited
-
Riiklik Standardite ja Tehnoloogia Instituut (NIST) - NIST AI RMF 1.0 (usaldusväärsus ja läbipaistvus) - nvlpubs.nist.gov
-
OpenAI – struktureeritud väljundid – platform.openai.com
-
OpenAI – funktsioonide kutsumise juhend – platform.openai.com
-
OpenAI – kiirusepiirangute juhend – platform.openai.com
-
OpenAI – käitab API – platform.openai.com
-
OpenAI – assistentide funktsioonide kutsumine – platform.openai.com
-
LangChain - Agentide dokumendid (JavaScript) - docs.langchain.com
-
LangChain - Tööriistade dokumentatsioon (Python) - docs.langchain.com
-
LangChain - Mälu ülevaade - docs.langchain.com
-
arXiv - ReActi töö (põhjendus + tegu) - arxiv.org
-
arXiv - RAG-i dokument - arxiv.org
-
Amazon Web Services'i (AWS) Builders' Library - ajalõpud, uuestikatsed ja tagasilükkamine jitteri abil - aws.amazon.com
-
OpenTelemetry - Jälgitavuse alustus - opentelemetry.io
-
Stripe - Idempotentsed taotlused - docs.stripe.com
-
Google Cloud – uuesti proovimise strateegia (tagasitõmbumine + värin) – docs.cloud.google.com
-
OWASP - 10 parimat suurte keelemudelite rakenduste jaoks - owasp.org
-
OWASP - LLM01 kiirsüst - genai.owasp.org
-
LlamaIndex - Sissejuhatus RAG-i - developers.llamaindex.ai
-
Microsoft - semantiline tuum - learn.microsoft.com
-
Microsoft AutoGen - Mitmeagendiline raamistik (dokumentatsioon) - microsoft.github.io
-
CrewAI – agentide kontseptsioonid – docs.crewai.com
-
Haystack (sügaval istutatud) - Retriiverite dokumentatsioon - docs.haystack.deepset.ai