Kuidas mõjutab tokeniseerimine tehisintellekti töötlemist?

Tokeniseerimine jagab teksti hallatavateks osadeks, võimaldades tehisintellekti mudelil keelt tõhusalt töödelda ja mõista. See mõjutab mudeli mälu, täpsust ja konteksti, mida see igal ajahetkel käsitleda suudab.

Miks on oluline mõista tehisintellektis märkide piiranguid?

Tokenipiirangute mõistmine on ülioluline, sest see aitab teil oma ülesandeid tõhusalt sõnastada. Nende piirangute ületamine võib kaasa tuua olulise teabe kärpimise või ignoreerimise, mis mõjutab tehisintellekti loodud vastuste kvaliteeti.

Millised tegurid mõjutavad tehisintellekti viipades olevate žetoonide arvu?

Tokeniloendur sisaldab mitut elementi, nagu sõnad, kirjavahemärgid, tühikud ja vorming. Sõltuvalt tokenisaatorist võib ühte sõna esindada üks või mitu tokenit, mis mõjutavad seda, kuidas tehisintellekt sisendit töötleb.

Kas žetoonide kasutamine võib mõjutada tehisintellekti teenuse kasutamise kulusid?

Jah, paljud tehisintellekti teenused arvutavad kasutust töödeldud tokenite arvu põhjal. Pikemad küsimused ja vastused tarbivad rohkem tokeneid, mis võib suurendada teie kulusid, eriti suuremahuliste töövoogude puhul.

Kuidas saan optimeerida juhiseid, et vähendada ebavajalikku žetoonide kasutamist?

Saate oma juhiseid optimeerida, olles algusest peale täpne, kasutades eri osade jaoks selgeid silte ja eemaldades üleliigse täiteteksti. Struktureeritud juhised aitavad tehisintellektil keskenduda olulistele elementidele, raiskamata tühimikku ebaolulisele teabele.

Kuidas tokeniseerimine keerulise keele või sümbolitega toime tuleb?

Tokeniseerimine aitab tehisintellekti süsteemidel hallata keerulist keelt, sealhulgas slängi, emotikone või tehnilist žargooni, jagades tundmatud sõnad äratuntavateks osadeks. See võimaldab paremini mõista ja töödelda erinevaid keelestiile.

Mis juhtub, kui annan tehisintellekti kontekstiakna jaoks liiga pika viiba?

Kui viip ületab tehisintellekti kontekstiakent, võidakse osa sisust kärpida, kokku võtta või täielikult arvesse võtmata jätta. See võib viia vähem täpsete või mittetäielike vastusteni, seega on oluline piirangust kinni pidada.

Mis on tehisintellektis token? Video ja viktoriin

Lühike vastus: Märk on väike teksti- või andmeosa, mille tehisintellekti mudel teisendab numbriteks ja protsessideks. Märkid mõjutavad kulu, kiirust, mälu ja väljundi pikkust. Kui viip ületab kontekstiakent, võidakse olulist sisu kärpida, kokku võtta või välja jätta.

Peamised järeldused:

Tokeniseerimine: sõnu, kirjavahemärke, tühikuid ja koodi saab jagada erinevalt.

Kontekst: Hoidke oluline teave mudeli saadaoleva tokeniakna piires.

Hind: vähendage korduvaid juhiseid ja ebavajalikku teksti suuremahulistes tehisintellekti töövoogudes.

Selgus: Määrake peamine ülesanne varakult ja korraldage nõuded selgete siltidega.

Tõhusus: jagage ülimahukad dokumendid enne tulemuste ühendamist loogilisteks osadeks.

Mis on tehisintellektis token? Infograafik

Artiklid, mida võiksite pärast seda lugeda:

🔗 Mis tüüpi tehisintellekt on olemas?
Mõista tehisintellekti kategooriaid võimekuse, funktsionaalsuse, treeningstiili ja praktilise kasutuse järgi.

🔗 Mis on tehisintellektiga prillid?
Avastage nutikate prillide funktsioone, käed-vabad kasutusvõimalusi, privaatsust ja praktilisi piiranguid.

🔗 Mis on tehisintellektiga televiisor?
Siit saad teada, kuidas tehisintellekt parandab pilti, heli, otsingut, soovitusi ja ligipääsetavust.

🔗 Mis on tehisintellekti slop?
Tuvastage madala kvaliteediga tehisintellekti sisu ning parandage täpsust, originaalsust ja otstarbekust.

1. Mis on tehisintellektis token? Lihtne vastus

Tehisintellektis on token tekstiühik, mida mudel kasutab keele mõistmiseks ja genereerimiseks .

Näiteks lause:

Ma armastan pitsat.

Võib jagada märkideks, näiteks:

Mina
armastus
pitsa
.

Piisavalt lihtne.

Aga see pole alati nii kena. Pikem või ebatavalisem sõna võib jagada väiksemateks osadeks. Näiteks:

uskumatu

Võib kujuneda millekski selliseks:

ÜRO
usun
võimeline

Erinevad tehisintellekti süsteemid kasutavad erinevaid tokenisaatoreid, seega võib täpne jaotus varieeruda. Seetõttu võivad tokenid tunduda veidi libedad. Need ei ole täpselt sõnad, mitte täpselt tähed ja mitte alati ka silbid.

Parem viis sellele mõelda on järgmine:

Tokenid on väikesed keeleklipid, mida tehisintellekti mudel suudab seedida. 🍽️

Kui esitate vestlusrobotile küsimuse, ei taju süsteem teie lauset ühe sujuva inimliku mõttena. See tükeldab sisendi märkideks, teisendab need numbriteks, töötleb nende seoseid ja ennustab seejärel kõige tõenäolisemat järgmist märki ikka ja jälle, kuni moodustab vastuse.

Seega, kui inimesed küsivad, mis on tehisintellektis token,siis vastus pole lihtsalt „tekstitükk“. See on põhiline tööüksus, mis teeb keelelise tehisintellekti võimalikuks.

2. Miks žetoonid on olulisemad, kui inimesed arvavad

Tokenid on olulised, sest need mõjutavad peaaegu kõike tehisintellekti tööriistade toimimises.

Nad mõjutavad:

Kui palju teksti tehisintellekt korraga käsitleda suudab
Kui palju maksab üks päring paljudes tehisintellekti süsteemides
Kui kiiresti mudel reageerib
Kui palju detaile mudel mäletab
Kui täpselt mudel teie ülesandest aru saab
Kui pikk vastus olla võib

Siin läheb asi üllatavalt praktiliseks.

Kui tehisintellekti tööriist ütleb, et tal on „kontekstiaken”, tähendab see tavaliselt maksimaalset tokenite arvu, mida see korraga arvestada saab. Teie viip, vestluse ajalugu, üleslaaditud tekst, süsteemijuhised ja mudeli vastus võtavad kõik tokeneid.

Seega, kui kleebitakse tehisintellekti abilisse tohutu dokument ja küsitakse seejärel: „Võta see kokku“, peab mudel selle teksti oma märgilimiidi sisse mahutama. Kui sisu on liiga pikk, võidakse osi tööriista disainist olenevalt ära lõigata, kokku suruda või ignoreerida.

Žetoonid pole lihtsalt tehnilised tühiasi. Need on tehisintellekti lauapind. Liiga palju paberit laual ja asjad hakkavad üle ääre libisema 📄.

3. Tokenid ei ole samad mis sõnad

See on ilmselt suurim arusaamatus.

Märk ei koosne alati ühest sõnast.

Mõnikord võrdub üks sõna ühe märgiga. Mõnikord saab ühest sõnast mitu märki. Mõnikord loetakse kirjavahemärke või tühikuid omaette märgiks. Tüütu? Natuke. Oluline? Väga.

Siin on umbkaudne näide:

Tekstinäide	Võimalik žetoonide jagamine	Mida see tähendab
`kass`	`kass`	Üks lihtne sõna, tõenäoliselt üks sümbol
`kassid`	`kassid` või `kass` + `s`	Sõltub tokenisaatorist
`rahvusvahelistumine`	`rahvusvaheline` + `isioon` või väiksemad tükid	Pikad sõnad jagunevad sageli
`Tehisintellektil põhinev`	`Tehisintellekti` + `-` + `toega`	Kirjavahemärgid võivad arvesse minna
`Hei!!!`	`Hei` + `!` + `!` + `!`	Jep, kirjavahemärgid võivad ka märke süüa
`superkalifragilistiline`	mitu tükki, ilmselt	Modell ohkab sisemiselt, ma arvan 😅

Universaalset reeglit, mis sobiks ideaalselt igale mudelile, pole.

Üldlevinud ligikaudse hinnangu kohaselt esindab üks sümbol sageli umbes mõnda tähemärki või sõnaosa. Kuid see on vaid rusikareegel, mitte absoluutne tõde. Ingliskeelne tekst kasutab sümboleid tavaliselt tõhusamalt kui mõned teised keeled ja kood võib jällegi käituda erinevalt.

Seepärast võib lühikesena näiv lause kasutada oodatust rohkem sümboleid (tšekke). Ja pikk lõik tavalistest sõnadest võib sümboliseeruda sujuvamalt kui lõik, mis on täis tehnilisi termineid, sümboleid või ebatavalist vormingut.

4. Kuidas tehisintellekt kasutab teksti genereerimiseks märke

Siin on see veidi maagiline osa - kuigi see on matemaatika võlurimütsiga 🧙.

Kui tipite käsureale viipa, teeb tehisintellekti süsteem midagi sellist:

Jagab teie teksti tokeniteks
Teisendab iga märgi numbriliseks või numbriliseks esituseks
Analüüsib märkide mustreid ja seoseid
Ennustab järgmist tõenäolist žetooni
Kordab seda ennustamisprotsessi
Muudab genereeritud märgid tagasi loetavaks tekstiks

Seega, kui sa kirjutad:

Taevas on

Mudel võib ennustada:

sinine

Aga see võiks ka ennustada:

Pilvine
langemine
pole piir,
tähti täis

Valitud väljund sõltub mudelist, ülesandest, kontekstist ja juhuslikkust või loovust kontrollivatest sätetest.

Seepärast tundub tehisintellekti abil kirjutamine kohati sujuv ja kohati uitab ebamäärasesse olukorda. See ennustab õpitud mustrite põhjal sümboleid sümboli järel, mitte ei tõmba valmis lauseid dokumendikapist välja.

See ei tähenda, et mudel on igavas mõttes „lihtsalt automaatne täitmine“. Suured tehisintellekti mudelid õpivad äärmiselt keerulisi seoseid kontseptsioonide, keele, struktuuri, tooni, loogika ja konteksti vahel. Kuid väljundtasandil toodab masin teksti ikkagi üks token korraga.

Pisikesed astmed. Suur illusioon. Väga uhke trepp.

5. Võrdlustabel: tehisintellektis kasutatavate tokenite tüübid

Tokenid võivad mudelist, tokenisaatorist ja sisutüübist olenevalt esineda erineval kujul. Siin on praktiline võrdlus.

Märgi tüüp	Näide	Kus see ilmub	Miks see on oluline
Sõna märk	`õun`	Lihtsad tekstiviibad	Lihtsalt mõistetav, puhas ja korras
Alamsõna tunnus	`mängimine` + `mängimine`	Pikemad või muudetud sõnad	Aitab tehisintellektil tundmatute sõnadega toime tulla
Tegelaskuju tunnusmärk	`a`, `b`, `c`	Mõned tokeniseerimissüsteemid	Paindlik, aga võib olla ebaefektiivne
Kirjavahemärkide märk	`.`, `?`, `!`	Igasugune kirjutis, tüütu	Mõjutab tooni ja žetoonide arvu
Tühikumärk	tühikud, reavahetused	Vormindatud tekst ja kood	Kahjuks pole vormindamine tasuta
Koodimärk	`funktsioon`, `{`, `==`	Programmeerimisülesanded	Kood suudab tokeneid kiiresti põletada
Eriline märk	algus-/lõpp-märgid	Kulisside taga	Aitab mudeli struktuuri sisestamisel
Tundmatu või haruldane tükk	ebatavalised fragmendid	Nimed, släng, trükivead	Võib täpsust veidi mõjutada

Mitte iga tehisintellekti mudel ei kasuta neid kõiki ühtemoodi. Mõned süsteemid tuginevad suuresti alamsõnade tokeniseerimisele , kuna see tasakaalustab tõhusust ja paindlikkust. See võimaldab mudelil käsitleda sõnu, mida see pole kunagi varem täpselt näinud, jagades need osadeks, mida see tunneb ära.

Näiteks kui mudel mõistab mikro-, bio-ja loogiatermineid, on tal paremad võimalused töötada keerukate teadusterminitega isegi siis, kui need on ebatavalised.

Mitte täiuslik. Aga päris nutikas. 🧩

6. Mis on tehisintellektis token? Miks see mõjutab kulusid?

Paljud tehisintellekti tööriistad mõõdavad kasutamist tokenites.

See tähendab, et nii teie sisend kui ka tehisintellekti väljund arvestatakse kasutusse. Kui saadate pika käsu, kasutab see rohkem märke. Kui mudel kirjutab pika vastuse, kasutab see samuti rohkem märke.

Lühike küsimus, näiteks:

Selgita gravitatsiooni.

Kasutab suhteliselt vähe sisendmärke.

Aga see käsklus:

Selgita gravitatsiooni detailselt ja algajasõbralikult, lisa näiteid, võrdle seda magnetismiga, lisa tabel, kirjuta see lapse jaoks ümber ja seejärel esita see kõnena.

Kasutab rohkem sisendmärke ja küsib ka pikemat väljundit.

Seega tuleb sümboolne hind sageli mõlemalt poolt:

Sisendtokenid – see, mida mudelile saadate
Väljundtokenid – mida mudel genereerib
Kontekstimärgid – kaasatud on eelmised vestlused või dokumendid
Süsteemi märgid - peidetud juhised, mis suunavad käitumist

Seepärast võivad väga pikad vestlused tunduda aeglasemad või piiratumad. Tehisintellekt võib vestluse varasemaid osi oma kontekstis edasi kanda. Nagu seljakott täis telliseid. Väärtuslikud tellised, aga ikkagi tellised.

Ettevõtete jaoks, kes kasutavad tehisintellekti API-de kaudu, võib märkide efektiivsus muutuda eelarveprobleemiks. Tuhandeid kordi korratud sassis käsk võib raisata üllatavalt palju raha. Selge käsk pole mitte ainult ilusam, vaid ka odavam.

7. Tokeni limiidid ja tehisintellekti kontekstiaken

Kontekstiaken on üks olulisemaid tokenidega seotud ideid.

See viitab sellele, mitu märki tehisintellekti mudel korraga töödelda saab. See hõlmab teie päringut, eelnevaid sõnumeid, kleebitud dokumente, juhiseid ja genereeritavat vastust.

Kujutage ette, et tehisintellektil on tahvel. Kõik, mida see arvestama peab, peab sellele tahvlile mahtuma. Kui tahvel on täis, peab midagi järele andma.

See võib viia mõne olukorrani:

Modell võib pika vestluse varasemad osad unustada
Dokumendi analüüsimiseks võib olla vaja see kokku võtta
Pikad küsimused võivad jätta vähem ruumi pikkadele vastustele
Korduv kontekst võib olulised detailid varjata
Mudel võib keskenduda tugevamalt hiljutisele teabele

Seepärast on kiire disain oluline.

Selline viip nagu:

Loe see kõik läbi ja ütle mulle, mis on oluline.

Võib toimida, aga ei pruugi olla ideaalne.

Parem vihje võiks öelda:

Võtke kokku peamine argument, loetlege riskid, tuvastage vastuolud ja nimetage viis peamist tegevust.

See annab mudelile selgema ülesande ja aitab tal kulutada žetoone väärtuslikule tööle, selle asemel et teie kavatsust ära arvata.

Tokenid ei ole ainult tehniline piirang. Need kujundavad seda, kuidas tehisintellektiga suhelda.

8. Miks aitab tokeniseerimine tehisintellektil toime tulla ebakorrektse keelega

Inimkeel on rahutu. Agressiivselt rahutu.

Inimesed kasutavad slängi, trükivigu, emotikone, lühendeid, koodivahetust, kaubamärginimesid, hashtage, väljamõeldud sõnu ja lausekatkeid, mis näevad välja nagu oleksid trepist alla kukkunud.

Tokeniseerimine aitab tehisintellektil selle sasipuntraga toime tulla.

Selle asemel, et iga võimalikku sõna pähe õppida, saab mudel jagada tundmatu teksti väiksemateks teadaolevateks osadeks. See aitab:

Õigekirjavead
Uued terminid
Liitsõnad
Tehniline sõnavara
Nimed
Interneti släng
Emotikonid ja sümbolid
Programmeerimise süntaks

Näiteks selline sõna nagu:

ülipersonaliseerimine

Ei pruugita käsitleda ühe tuttava sõnana. Kuid tehisintellekt võib ära tunda selliseid osi nagu:

ülimalt
isiklik
isatsioon

See annab sellele võitlusvõimaluse.

See on ka põhjus, miks tokeniseerimine on väärtuslik eri keeltes. Mõnes keeles on sõnade vahel selged tühikud. Teistes ei kasutata tühikuid samamoodi. Mõnel on rikkalikud sõnavormid. Mõned ühendavad ideid pikkadeks liitsõnadeks. Tokensüsteemid aitavad seda kõike töödeldavateks ühikuteks standardiseerida.

See pole just eriti graatsiline. Pigem nagu köögiviljade hakkimine kalkulaatoriga. Aga see toimib 🥕.

9. Märgid tekstis, piltides, helis ja multimodaalses tehisintellektis

Fraas „ token” esineb tehisintellektis tavaliselt tekstimudelites, kuid laiem idee võib kehtida ka tekstist kaugemale.

Multimodaalses tehisintellektis võivad süsteemid töödelda pilte, heli, videot või struktureeritud andmeid, kasutades märgilaadseid ühikuid. Üksikasjad erinevad, kuid põhiidee on sarnane: jagada keeruline teave väiksemateks osadeks, mida mudel saab töödelda.

Näiteks:

Teksti saab jagada sõna- või alamsõnamärkideks
Pilte saab jagada osadeks või visuaalseteks esitusteks
Heli võib olla jagatud ajapõhisteks segmentideks või kodeeritud ühikuteks
Koodi saab jagada süntaksiga seotud tokeniteks
Tabeleid saab teisendada struktureeritud märgijadadeks

See on oluline, sest tänapäevane tehisintellekt ei ole üha enam lihtsalt „vestlus“. See suudab tõlgendada ekraanipilte, kirjeldada pilte, analüüsida diagramme, transkribeerida heli, arutleda koodi üle ja vastata erinevates vormingutes.

Aga sama põhiprintsiip püsib ikka ja jälle:

Jaga sisend hallatavateks osadeks, teisenda need osad numbriteks ja lase mudelil õppida nendevahelisi seoseid.

See on laias laastus tokeniseerimine.

See on inimtekstuuri ja masinloetava struktuuri vaheline sidekiht.

10. Kuidas tokenid mõjutavad kiiret inseneritööd

Küsimuste inseneritöö kõlab glamuursemalt, kui see tegelikult on. Mõnikord tähendab see lihtsalt „küsi selgelt ja lõpeta oma küsimuse jamaga toppimine“. Karm, aga täpne.

Žetoonidel on paremas juhendamises suur roll.

Siin on mõned praktilised viisid sümboolse teadlikkuse kasutamiseks:

Ole varakult täpne

Pane peamine ülesanne algusesse:

Kirjutage eelarvesõbraliku laualambi jaoks lühike tootekirjeldus.

Mitte:

Mõtlesin, et võiksin teha midagi tootelehele, mis räägib lambist, ja mul on vaja sõnu...

Teine versioon raiskab žetoone ja lükkab punkti edasi.

Eemaldage ebavajalik täiteaine

Tehisintellekt saab aru tavalisest keelest, aga lisatäidis röövib konteksti. Sa ei pea kirjutama nagu robot, aga kärpimine aitab.

Kasutage struktuuri

Pealkirjad, täpploendid, nummerdatud sammud ja sildid aitavad mudelil aru saada, mis kuhu läheb.

Näide:

Eesmärk:
Sihtrühm:
Toon:
Formaat:
Piirangud:

See toimib tavaliselt paremini kui tekstiplokk.

Ütle tehisintellektile, mida ignoreerida

See on vaikselt võimas.

Võite öelda:

Ignoreeri korduvaid standardseid väiteid ja keskendu ainult hinnaerinevustele.

See takistab mudelil keskendumast väheväärtuslikule sisule.

Hoidke pikad vestlused korrastatuna

Pikkades vestlustes tehke aeg-ajalt olulisi otsuseid kokkuvõtteid. See aitab säilitada konteksti ja vähendab segadust.

Põhimõtteliselt on žetoonide abil teavitamine nagu kohvri pakkimine. Võid kaasa võtta hädavajaliku või kolm praepanni ja mõelda, miks sokid jalga ei mahu.

11. Levinud väärarusaamad tehisintellekti tokenite kohta

Selgitame paar asja, sest sümboolne jutt läheb kiiresti segaseks.

Väärarusaam 1: Üks žetoon võrdub ühe sõnaga

Ei. Mõnikord jah, sageli ei. Märgendid võivad olla sõnad, sõnaosad, kirjavahemärgid või muud osad.

Väärarusaam 2: Rohkem žetoone tähendab alati paremaid vastuseid

Mitte tingimata. Pikem ülesanne võib olla abiks, kui see lisab väärtuslikku konteksti. Kuid ülekoormatud ülesanne võib mudelit segadusse ajada või ruumi raiskada.

Väärarusaam 3: Tokenipiirangud mõjutavad ainult pikki dokumente

Need mõjutavad ka tavalisi vestlusi, eriti kui vestluses on palju pöördeid. Mudelil võib olla vaja arvestada varasemate sõnumite, juhiste ja teie viimase palvega.

4. väärarusaam: tehisintellekt mõistab märke samamoodi nagu inimesed mõistavad sõnu

Mitte inimlikus mõttes. Inimesed seostavad sõnadega elukogemust, sensoorset mälu, kavatsust ja emotsiooni. Tehisintellekti mudelid töötlevad statistilisi ja semantilisi mustreid sümboolsete järjestuste abil. See võib küll luua muljetavaldavat arutluskäiku, kuid see pole sama protsess.

Väärarusaam 5: Tokeniseerimine on igav taustaprogramm

See kõlab igavalt. See ei ole. Tokeniseerimine kujundab hinda, kiirust, mälu, täpsust ja kasutajakogemust. Pisike hinge, hiiglaslik uks 🚪.

12. Reaalse elu näited tehisintellekti tokenite kasutamisest

Teeme selle vähem abstraktseks.

Näide 1: Vestlusroboti abil

Sa kirjutad:

Kas saaksid kirjutada viisaka e-kirja, milles palud raha tagasi?

Tehisintellekt jagab selle tokeniteks, saab aru päringu mustrist ja genereerib vastuse tokenite kaupa.

Näide 2: Pikk dokumendi kokkuvõte

Sa kleebi poliitikadokumendi. Tehisintellekt annab kogu asjale tokeniseeringu. Kui see mahub kontekstiaknasse, on suurepärane. Kui mitte, võib tööriist vajada tükeldamist, kokkuvõtet või kärpimist.

Näide 3: Kodeerimisassistent

Sa küsid:

Paranda see JavaScripti funktsioon.

Kood kasutab sageli sümboleid, taanet, operaatoreid ja spetsiifilist süntaksit. Need kõik kasutavad ka tokeneid. Seetõttu saavad koodimahukad käsurea käsud kiiresti palju tokeneid kasutada.

Näide 4: SEO artikli kirjutamine

Pealkirja, ülevaate, pealkirjade, märksõnade, tooni, näidete ja metakirjelduse küsiv päring kasutab rohkem märke kui tavaline päring. Ka väljund kasutab palju märke, kuna artikkel on pikk.

Näide 5: Klienditoe automatiseerimine

Ettevõte võib tehisintellektile saata kliendisõnumi, konto andmed, poliitikakoodid ja vastusereeglid. Kõigest sellest saavad tokenid. Mida rohkem konteksti on, seda hoolikam peab süsteem olema piirangute ja kulude suhtes.

Žetoonid ilmuvad kõikjale, kui neid märkama hakkad. Nagu tolm päikesevalguses, aga nohiklikumad.

13. Miks žetoonide mõistmine aitab tehisintellekti paremini kasutada

Tokenite mõistmisest kasu saamiseks ei pea te masinõppeinseneriks saama.

Põhimõte aitab sul:

Kirjutage selgemaid ülesandeid
Vältige mudeli ülekoormamist
Saage aru, miks pikad vestlused mõnikord triivivad
Hinnake, miks üks päring maksab rohkem kui teine
Loo paremaid kokkuvõtteid
Töötage dokumentidega nutikamalt
Hankige järjepidevamaid tehisintellekti väljundeid

See aitab teil ka lõpetada tehisintellekti kohtlemise võlukarbina.

See on hea asi. Võlukasti-mõtlemine viib moonutatud ootusteni. Žetoonide-teadlik mõtlemine muudab tööriista paremini hallatavaks.

Kui sa mõistad, et tehisintellekt töötab sümboolsete mustrite kaudu, hakkad esitama paremaid küsimusi. Sa annad parema konteksti. Sa väldid romaani jututoasse toppimist ja „mõtteid?“ küsimist – mida, ausalt öeldes, enamik meist on mingil hetkel tahtnud teha.

Mida parem on teie sisend, seda paremat märgijälge mudel jälgida saab.

14. Mis on tehisintellektis token? Praktiline kokkuvõte

Mis on tehisintellektis token? See on väike teksti- või andmeühik, mida tehisintellekti mudel töötleb.

Aga praktilisem vastus on järgmine:

Token on inimkeele ja masinmõtlemise vahelise suhtluse põhielement. See on viis, kuidas teie sassis, emotsionaalne ja trükivigadest tulvil lausest saab midagi, mille abil mudel saab arvutada.

Tokenid mõjutavad mudelit:

Mõistmine
Mälu
Maksumus
Kiirus
Väljundi pikkus
Täpsus
Vormindamine
Konteksti käsitlemine

Enamasti on nad nähtamatud, aga nad on alati olemas.

Iga kirjutatud viip saab tokeniks. Iga vastus, mida loed, genereeriti tokenite põhjal. Iga lõik, koma, emotikon, koodilõik ja kohmakas fraas tükeldatakse ühikuteks, mida mudel saab töödelda.

Isegi see lause on sümboolne. Väga meta. Natuke tüütu. Omamoodi ilus. ✨

15. Lõppsõna

Mis on tehisintellektis token? Token on väike keeleosa, mida tehisintellekti mudelid kasutavad teksti lugemiseks, tõlgendamiseks ja genereerimiseks. See võib olla sõna, sõnaosa, kirjavahemärk, tühik või muu pisike ühik, olenevalt tokenisaatorist.

Tokenite mõistmine aitab sul mõista, miks tehisintellekti tööriistadel on piirid, miks pikad käsuviibad maksavad rohkem, miks kontekst on oluline ja miks selged juhised toimivad tavaliselt paremini kui hiiglaslikud sassis lõigud.

Alguses kõlab kõik tehniliselt, aga lõpuks taandub asi millegi praktilisele:

Tehisintellekt ei tarbi keelt inimkujuliste tükkidena. See närib keele tükkideks, uurib mustreid ja ennustab, mis peaks järgmiseks juhtuma.

Pisikesed tükid. Tohutud tulemused. Omapärane väike ime 🤖✨

Reaalse maailma näide: token-tõhusa klienditoe assistendi loomine

Stsenaarium

Väike veebipõhine mööblimüüja kasutab tehisintellekti abilist, et koostada vastuseid tarnetega seotud kaebustele, tagasimaksetaotlustele ja kahjustatud esemete aruannetele.

Oma esimeses versioonis saab assistent iga kord, kui keegi pileti avab, kogu tagastuskäsiraamatu, kliendi täieliku sõnumiajaloo, tellimuse üksikasjad, mitu näidisvastust ja pika kirjutamisreeglite komplekti. Tavaliselt annab see toimiv vastuse, kuid päringupäring on paisunud, päringute töötlemine võtab kauem aega ja olulised üksikasjad võivad mattuda ebaolulise eeskirja teksti alla.

Tugijuht kujundab töövoo ümber nii, et iga päring sisaldab ainult piletiga seotud poliitikaosasid. Vanemad sõnumid asendatakse lühikese faktilise kokkuvõttega, samas kui kliendi praegune sõnum jääb muutmata. See jätab ülesande enda ja sellest tuleneva vastuse jaoks rohkem kontekstiaknast kättesaadavaks.

Mida assistent vajab

Kliendi viimane sõnum ja tellimuse üksikasjad
Varasemate sõnumite lühikokkuvõte, sh kõik juba antud lubadused
Ainult asjakohased poliitika osad, näiteks tagasimaksed või kahjustatud saadetised
Ettevõtte poolt heakskiidetud tooni ja vastuse vorming
Näited vastuvõetavatest ja vastuvõetamatutest vastustest
Selged reeglid tagasimaksete, asendamiste, eskaleerumise ja puuduva teabe kohta
Luba vastuse mustandi koostamiseks, kuid mitte tagasimaksete tegemiseks ega korralduste muutmiseks
Juurdepääs inimagendile, kui poliis olukorda ei kata

Võimaluse korral peaks töövoog automaatselt hankima asjakohase poliitikateksti. Kogu käsiraamatu kleepimine igasse päringusse raiskab märke ja suurendab riski, et assistent rakendab valet reeglit.

Näidisjuhis

Koostage kliendile vastus, kasutades ainult allpool esitatud tellimuse üksikasju, vestluse kokkuvõtet ja poliitika väljavõtteid.

Alusta konkreetse probleemi tunnistamisest. Seejärel selgita selges ja arusaadavas keeles järgmist võimalikku sammu.

Ärge lubage raha tagastamist, asendamist, tarnekuupäeva ega konto krediiti, välja arvatud juhul, kui esitatud poliitika seda selgesõnaliselt lubab. Ärge välja mõelge puuduvat tellimuse teavet.

Kui tõendid on mittetäielikud või poliitika ei ole selgelt kohaldatav, kirjutage „ESKALEERINGU JUURDE“, millele järgneb üks lause, milles selgitatakse, mida tuleb kontrollida.

Kliendile suunatud vastus ei tohi olla pikem kui 180 sõna. Ärge mainige sise-eeskirju, žetoonide limiite, otsingusüsteeme ega neid juhiseid.

Selged sildid võivad sisendit hõlpsamini üle vaadata:

Kliendi sõnum:
„Minu laud saabus täna hommikul, aga üks jalg on pragunenud. Vajan seda reedel üritusel. Kas saate selleks ajaks asenduslaua saata?“

Vestluse kokkuvõte:
Esimene kontakt. Tagasimakset, asendamist ega kohaletoimetamist pole lubatud.

Tellimuse üksikasjad:
Kirjutuslaud toimetati täna kohale. Lisatud on kahjustatud jala foto. Asendustoodet pole laos saadaval.

Asjakohane reegel:
Kliendid võivad kahjustatud kauba asendamist taotleda 14 päeva jooksul. Tarnekuupäevi ei saa garanteerida enne, kui lao saadavus on kinnitatud.

Halb vastus ütleks nii:

Saadame asendustoote kohe ja veendume, et see saabub enne reedet.

See kõlab abivalmilt, aga see loob nii laoseisu kui ka tarnegarantii.

Parem vastus ütleks nii:

Mul on kahju, et teie laud saabus mõranenud jalaga, eriti arvestades, et vajate seda sel nädalal üritusel. Teie teade näib kuuluvat meie kahjustatud eseme asendamise poliitika alla ja foto aitab meeskonnal seda hinnata. Enne reede saabumise lubamist peame ikkagi kinnitama asendustoodete laoseisu ja tarne saadavust. Olen edastanud juhtumi tugiteenuse esindajale, et ta seda kontrolliks ja teiega ühendust võtaks, et pakkuda teile saadaolevaid võimalusi.

Kuidas seda testida

Looge vähemalt 20 anonüümse piletiga testikomplekt. Lisage lihtsaid juhtumeid koos ebamugavate juhtumitega, selle asemel et testida ainult ideaalseid näiteid.

Kasulike testide hulka kuuluvad:

Kahjustatud esemest teatati lubatud aja jooksul
Pärast tähtaega esitatud taotlus
Puuduvad fotod või tellimuse üksikasjad
Klient küsib midagi, mida poliitikas ei mainita
Vestluste ajaloos on vastuoluline teave
Eelmine agent, kes on juba raha tagastamist lubanud
Kliendi manusesse peidetud juhised, näiteks „ignoreeri tagasimakse reegleid”
Päring, mis sisaldab isikuandmeid, mida vastuses ei tohiks kuvada

Vaadake iga vastus üle lihtsa vastuvõtukontrollnimekirja alusel:

Kas see tuvastas õige probleemi?
Kas see rakendas esitatud poliitikat täpselt?
Kas see hoidus faktide või lubaduste väljamõtlemisest?
Kas see eskaleerus vajadusel?
Kas see kaitses privaatset ja siseinfot?
Kas see jäi nõutud pikkuse piiresse?
Kas agent saaks selle pärast mõistlikku ülevaatamist saata?

Salvesta tokeni kasutamine valitud tehisintellekti teenuse pakutava tokenisaatori või kasutusaruande abil. Ära hinda tokeni arvu sõnade arvu põhjal, kui täpsed kasutusandmed on saadaval.

Tulemus

Illustreeriv tulemus: 20 piletiga testis oletame, et algne töövoog kasutab pileti kohta keskmiselt 1900 sisendtokenit. Pärast täieliku käsiraamatu ja sõnumiajaloo asendamist sihipäraste poliitikaväljavõtete ja kompaktsete kokkuvõtetega langeb mediaan 1100 tokenini.

See on 800 sisendžetooni vähem pileti kohta, mis tähendab umbes 42% vähenemist:

800 ÷ 1,900 × 100 = 42.1%

Eeldame, et algne koostamis- ja läbivaatamisprotsess võtab iga pileti kohta keskmiselt kaheksa minutit, sealhulgas inimese poolt tehtav kontroll. Muudetud protsess võtab viis minutit: kaks minutit ettevalmistuseks ja koostamiseks ning kolm minutit läbivaatamiseks. Illustreeriv kokkuhoid on seega kolm minutit pileti kohta ehk 60 minutit 20 piletiga testi peale kokku.

Kvaliteeti tuleb mõõta koos kiirusega. Näiteks 20-st parandatud mustandist 18 võivad esimesel läbivaatamisel läbida kõik seitse vastuvõtukontrolli, võrreldes 16-ga 20-st algse töövoo korral. Kaks ebaõnnestunud parandatud mustandit peaksid tulemustesse jääma ja neid tuleks uurida, mitte vaikselt kõrvale heita.

Need arvud on illustratiivsed mõõtmised, mis põhinevad nimetatud testi ülesehitusel, mitte ettevõtte avaldatud tulemusel. Väike testikomplekt, erinevused piletite raskusastmes ja subjektiivsed arvustaja otsused võivad kõik tulemust mõjutada.

Mis võib valesti minna

Žetoonide liiga agressiivne vähendamine võib eemaldada detaile, mis muudavad õiget vastust. Näiteks kokkuvõttest, milles on kirjas „klient taotles tagasimakset”, võib välja jääda asjaolu, et varasem agent oli selle juba heaks kiitnud.

Samuti võib otsingu käigus valida vale poliitikaosa. Assistent võib sellisel juhul luua ebaolulistel reeglitel põhineva lihvitud vastuse. Seetõttu peaks oluline lähtetekst jääma läbivaatajale nähtavaks.

Muude levinud tõrgete hulka kuuluvad aegunud poliitikad, kliendiandmete ilmumine logidesse, peidetud juhised üleslaaditud dokumentides, ebamäärased eskalatsioonireeglid ja assistent, kes väidab, et on toimingu lõpetanud, kuigi on vaid vastuse mustandi kirjutanud.

Eesmärk ei ole luua võimalikult lühikest ülesannet. Eesmärk on vältida kordusi, säilitades samal ajal kõik faktid, reeglid ja erandid, mis on ohutuks otsuseks vajalikud.

Praktiline kaasavõetav toit

Märgi efektiivsus tuleneb parema konteksti valimisest, mitte ainult sõnade kustutamisest. Andke assistendile praegune palve, asjakohased tõendid, kohaldatavad reeglid ja selge piir määramatuse jaoks. Kõik muu peab õigustama selle hõivatud ruumi.

KKK

Mis on tehisintellektis token lihtsustatult öeldes?

Tehisintellektis on märk (token) väike teksti- või andmeühik, mida mudel töötleb. See võib olla terve sõna, sõnaosa, kirjavahemärk, tühik või sümbol. Tehisintellekti süsteemid jagavad käsuviibad märkideks (token), teisendavad need numbrilisteks esitusteks ja kasutavad õpitud mustreid, et ennustada vastuses järgmist märki (token).

Kas üks tehisintellekti märk on sama mis üks sõna?

Ei, üks märk ei vasta alati ühele sõnale. Levinud sõnad võivad moodustada ühe märgi, samas kui pikad, ebatavalised või tehnilised terminid võivad olla jagatud mitmeks alamsõna märgiks. Kirjavahemärgid, emotikonid, tühikud ja vormindus võivad samuti märgiste arvu mõjutada. Täpne jaotus sõltub tehisintellekti mudeli poolt kasutatavast märgistajast.

Kuidas kasutavad tehisintellekti mudelid vastuste genereerimiseks tokeneid?

Tehisintellekti mudel jagab teie käsuviiba kõigepealt märkideks (token) ja teisendab need numbrilisteks esitusteks. Seejärel analüüsib see nende märkide vahelisi seoseid ja ennustab järgmisena kõige tõenäolisemalt saabuvat märki (token). See protsess jätkub kuni vastus on valmis. Iga ennustust kujundavad käsk, vestluse kontekst, mudeli sätted ja juba genereeritud märgid.

Miks mõjutavad žetoonid tehisintellekti kasutamise kulusid?

Paljud tehisintellekti teenused arvutavad kasutust töödeldud tokenite arvu järgi. Sisendtokenid pärinevad teie päringust ja tugikontekstist, väljundtokenid aga mudeli vastusest. Pikad dokumendid, korduvad juhised ja pikad vastused suurendavad seega kasutust. Ettevõtete jaoks, kes tegelevad suure hulga API-päringutega, aitab ebavajaliku teksti eemaldamine kulusid kontrolli all hoida.

Mis on tehisintellekti kontekstiaken ja kuidas märgid seda mõjutavad?

Kontekstiaken on maksimaalne hulk tokeniseeritud teavet, mida tehisintellekti mudel päringu ajal arvestada saab. See võib hõlmata süsteemi juhiseid, teie päringut, üleslaaditud dokumente, varasemaid sõnumeid ja genereeritud vastust. Kui saadaolev aken muutub tihedaks, võib vanem või madalama prioriteediga teave vähem tähelepanu saada. Selge ja asjakohane kontekst jätab rohkem ruumi fokuseeritud analüüsiks ja väljundiks.

Mis juhtub, kui tehisintellekti päring ületab tokeni limiidi?

Kui päring on saadaoleva kontekstiakna jaoks liiga suur, võib süsteem osa sisust kärpida, kokku võtta, jagada või välja jätta. Täpne käitumine sõltub tööriistast. Olulised detailid võivad kahe silma vahele jääda, kui need ilmuvad väljajäetud osadesse. Levinud lähenemisviis on jagada pikad dokumendid loogilisteks osadeks, analüüsida igaüht neist ja seejärel tulemused ühendada.

Kuidas saan oma päringutes žetoonide kasutamist vähendada?

Alusta põhiülesandest ja eemalda taustainfo, mis vastust ei mõjuta. Kasuta selgeid silte, nagu eesmärk, sihtrühm, vorming, toon ja piirangud, selle asemel, et juhiseid kogu ülesande vältel korrata. Pikkades vestlustes esita peamiste otsuste kompaktne kokkuvõte. Struktureeritud ülesanded aitavad mudelil üldiselt prioriteete tuvastada, ilma et konteksti kulutataks välditavale täitematerjalile.

Miks koodis, vorminduses ja kirjavahemärkides kasutatakse tehisintellekti märke?

Tehisintellekti mudelid töötlevad enamat kui tavalisi sõnu. Operaatorid, sulud, taane, reavahetused, kirjavahemärgid ja muud vorminduselemendid võivad muutuda eraldi märkideks või märgifragmentideks. Selle tulemusel võivad koodimahukad käsud ja väga vormindatud dokumendid märgid kiiresti ära tarbida. Asjakohase vormingu säilitamine on oluline, kuid dubleeritud koodi, ebavajalike kommentaaride või korduva malli eemaldamine võib muuta päringu tõhusamaks.

Mis on tehisintellektis piltide, heli ja multimodaalsete mudelite token?

Multimodaalses tehisintellektis võib termin „token” viidata töödeldavatele üksustele, mis ületavad kirjakeele piirid. Pilte saab esitada plaastrite või visuaalsete tunnuste abil, samas kui heli saab jagada kodeeritud segmentideks. Tehniline meetod on süsteemides erinev, kuid aluspõhimõte jääb sarnaseks: keeruline teave teisendatakse väiksemateks numbrilisteks ühikuteks, mida mudel saab võrrelda, tõlgendada ja kasutada väljundi genereerimiseks.

Kas rohkemate žetoonide kasutamine annab parema tehisintellekti vastuse?

Mitte automaatselt. Lisažetoonid on abiks, kui need pakuvad asjakohast konteksti, näiteid, nõudeid või allikmaterjali. Korduvad või vastuolulised juhised võivad aga mudelit häirida ja järjepidevust vähendada. Kõige tõhusam ülesanne sisaldab tavaliselt piisavalt üksikasju, et ülesannet selgelt määratleda, ilma et see oleks liiga koormav. Žetoonide kvaliteet ja korraldus on sageli olulisemad kui lihtsalt teksti hulk.

Viited

OpenAI abikeskus – help.openai.com
OpenAI platvorm – platform.openai.com
OpenAI arendajad - developers.openai.com
Google arendajatele – developers.google.com
Kallistav Nägu - huggingface.co
TensorFlow - tensorflow.org
Google Research – research.google

Leia uusim tehisintellekt ametlikust tehisintellekti abilise poest

Meist

Viktoriin

1. Milline on teksti kohaselt tehisintellektis kasutatava tokeni kõige täpsem definitsioon?

Selgitus: Tokenid on väikesed keeleklipid, mida tehisintellekti mudel seedib ja töötleb teksti numbriteks teisendades.

2. Kuidas kirjeldab tekst sõnade ja sümbolite vahelist suhet?

Selgitus: Suurim eksiarvamus on, et üks märk võrdub ühe sõnaga. Sõltuvalt märgistajast saab sõnu jagada ja isegi tühikud või kirjavahemärgid võivad loetud märkideks.

3. Mida tähendab termin "kontekstiaken" tehisintellekti kontekstis?

Selgitus: Kontekstiaken on tehisintellekti "lauaala" ehk töömälu – kõik, mida see peab arvestama (teie ülesanne, dokument ja oma vastus), peab mahtuma selle märgi piiridesse.

4. Kuidas mõjutavad žetoonid tehisintellekti süsteemide kasutamise üldkulusid?

Selgitus: Žetoonide maksumus tuleb sageli mõlemalt poolt: teie saadetud sisendžetoonidest ja tehisintellekti genereeritud väljundžetoonidest koos kõigi peidetud süsteemižetoonidega.

5. Miks on soovitatav vältida mahukate ja korduvate dokumentide kleepimist viibasse?

Selgitus: Kontekstiakna ületäitmine rämpsu või korduva tekstiga jätab tehisintellektile vähem ruumi arutluskäiguks, mis võib põhjustada varasemate osade "unustamist" või oluliste detailide kahe silma vahelejätmist.

Tagasi blogisse