De mest avancerede AI-modeller besidder skjulte evner, der rækker langt ud over det umiddelbart synlige. I denne artikel ser vi nærmere på, hvordan du kan afdække og udnytte disse indlejrede funktioner til at løse komplekse, veldefinerede og nyttige opgaver.
Generativ AI-modeller – og særligt de store sprogmodeller ChatGPT, Gemini og Claude – har nu igennem et par år imponeret folk med deres evne til at gå på tværs af etablerede domæner og skabe noget nyt. Det føles som rigtig, kreativ intelligens, når vi får beskrevet komplekse regnskabsbegreber i et Andeby-sprog, eller når billedgenereringsmodeller laver nye møbler inspireret af store bløde tegnefilmsbamser.
Denne manglende begrænsning, når de går til kanten af ét domæne, og modellerne i stedet infererer på tværs til andre domæner, er forståeligt nok utroligt fascinerende. Det er det, der gør, at modellerne altid kan svare, også selvom de egentlig er på kanten af deres viden. De kan gætte sig til det usagte, de kan springe til andre vidensområder og skabe inferens via rent sprog-statistisk logiske sammenhænge.
Det er bare ikke det, der skaber den helt store produktive gennemslagskraft, når teknologien skal sættes til at arbejde for os.
Bredde og dybde
Helt grundlæggende kan du anskue de (meget) store modeller ud fra to parametre: bredde og dybde. Hvor bredden i modellernes træningsdata og træning har været det, der har været afgørende i langt de fleste første forsøg og implementeringer, og også er det, der har skabt ovennævnte fascination, er det ganske overset – eller anses som trivielt – hvor dybt modellerne også er trænet inden for enkelte områder.
Udfordringen har her været, at vi netop har været nødsaget til at anse dybden som triviel, fordi vi ikke har kunnet verificere den – vi kender ikke træningsdataene, så vi ved ikke, hvad og hvor meget af dette eller hint modellerne er trænet på. På den måde har vores tilgang til dem været mere i retning af at spørge en uudgrundelighed, hvor netop bredden og de skæve sammenhænge blev spændende.
Alligevel er det dybden i modellerne – den specialiserede funktion – der har afstedkommet den største, direkte identificerbare optimering: kodning. Udviklere har taget de store sprogmodeller til sig i et omfang, så de ikke længere kan forestille sig at arbejde uden. Modellerne er nemlig trænet på enorme mængder kodedata, så de forstår sig helt enormt godt på kode
Generativ AI i supportfunktioner
Hvad forstår en sprogmodel?
Spørgsmålet bliver derfor: “Hvad forstår modellerne ellers?”
Tech-virksomheden Anthropic, som laver sprogmodellen Claude, der er en af de mest direkte konkurrenter til ChatGPT, udgav i forsommeren 2024 et større studie, hvor de havde undersøgt, hvilke funktioner (i artiklen kaldet ‘features’, grupperinger, sammenhænge) der fandtes i en sprogmodels hjerne.
Ved at køre modellen på en særlig måde over millioner af gange kunne de identificere funktioner, der fx omhandlede Golden Gate Bridge. Der var en masse viden tilknyttet broen – rød, San Francisco, beton og lign. – og dette betød, at modellen havde et sprogligt koncept om, hvad Golden Gate Bridge var. Ved at forstærke denne funktion – altså ved hjælp af kode øge sandsynligheden for, at modellen brugte Golden Gate Bridge i sine svar – oplevede de også, at modellen begyndte at opføre sig anderledes end før. Fx begyndte den at tro, at den var en stor rød bro og ikke en sprogmodel. Og der var utallige af disse funktioner gemt i modellen. Disse funktioners eksistens betyder, at der ligger skjult ekspertise i modellerne.
Og det er denne ekspertise, vi skal afdække og bygge med.
For modellerne har fx også en funktion, der omhandler fakturaer. De har set så mange forskellige fakturaer, at de ved, hvordan de ser ud, og også, hvordan en outlier-faktura kan fortolkes som en ordinær – der er logikker i modellerne, der på en særlig måde kan rationalisere, at det her er kundenummer, dette er kontaktperson osv. Ligesom de også kan se, hvad der er en autosignatur i en mail om fx adresseændring, så to adresser i samme mail ikke forveksles. Fordi de også har en funktion, der omhandler mailstrukturer og formater.
Ved at afdække disse funktioner opnås der også forudsigelighed. Prøv fx at bede ChatGPT afslutte denne sætning “To be or not to be; that is …”, og du vil altid få “the question”. Men hvis du i stedet beder den afslutte denne sætning, “CFO’en tog til Mars, fordi …”, får du kaotiske svar hver gang. Simpelthen fordi den dér bruger sin bredde til at gætte på noget, den egentlig ikke har dybde nok til. Der er i en sprogmodel en Hamlet-funktion gemt, men ikke en astronaut-CFO.
Indkredsning af funktioner er en gamechanger
Når vi prompt engineerer – altså designer spørgsmål og opgaver til en AI-model – forsøger vi altid at ramme opgaven og konteksten ind. Det er hele humlen. Og det gør vi, fordi vi ikke vil have den til at svare i bredden, men ned i en dybere kontekst. Udviklere, der bruger modellerne, forstår dette intuitivt, men det skal også forstås på et analytisk idéniveau.
De opgaver, vi sætter en sprogmodel til at arbejde på, skal derfor være to ting: definerbare, så en funktion kan identificeres eller afvises, og grundlæggende alment kendte, så vi kan forvente, at modellerne evt. har en funktion, der kan tjene vores formål. Det betyder også, at vi kortvarigt skal se bort fra chatbotten, der kan svare på alt, og i stedet søge at afdække skarpe funktioner, der kan løse kendte problemer. I stedet for AI-agenter, som der tales meget om på AI-markedet lige nu, ligger gevinsten for de fleste virksomheder i at definere og udvikle AI-roller. Forskellen er simpelthen, at en agent forventes at kunne gøre alt, hvad du beder den om, og være egenrådig, mens en rolle kun kommer på scenen på rette tid og med præcise replikker.
Ved at indkredse rollen får vi forudsigelighed tilbage og opgaveløsninger, vi kan måle på. Vi får også mulighed for at bruge modellerne til det, vi aldrig før har kunnet løse så nemt med teknologi: at strukturere det ustrukturerede. Gennem roller, der bygger på identificerede funktioner, og som kan kontekstualisere og logisk fortolke forskelligt input, kan en sprogmodel skabe orden i data, der ellers er vilkårlig. Og dét er den virkelige gamechanger, når det kommer til den nye bølge af AI, for det udvider hele det digitale spillebræt.
Podcast: The Only Contant
Det korte budskab: Ved at fokusere de store AI-modeller får du konkrete gevinster
Efter nu i nogle år at have afprøvet og spredt budskabet om AI rundt i organisationerne står virksomheder over for udfordringen om, hvordan der skabes reel værdi med generativ AI. Sandheden er, at hvor modellerne først imponerede ved at ligne en C3PO, der kunne svare på alt, ligger gevinsten i at finde modellernes indre funktioner og lægge dem i en spændetrøje omkring disse funktioner. Modellerne ved enormt meget, men det interessante er at finde ud af, hvor meget de ved om ét emne og én opgave, og ikke hvor meget de kan brede sig ud over irrelevante områder.
Behandl dem som en medarbejder, der skal ansættes: Personens viden om de konkrete opgaver er altid vigtigere end anden almen viden. Identifikation af præcise (ofte ustrukturerede) opgaver og test af modellernes skarphed på disse er derfor helt afgørende for at høste værdi af de store sprogmodeller.
Kompetencer hele vejen rundt
Finance IT Services' digitaliseringscirkel viser de kompetenceområder vi kan bringe i spil, når de finansielle processer i din virksomhed skal digitaliseres med et holistisk udgangspunkt.
Når vi hjælper med at digitalisere og automatisere en finansfunktion, gør vi en dyd ud af at sammensætte de applikationer og værktøjer, der møder netop dit behov. På en måde, så løsningen understøtter data, processer og de mennesker, der knokler bag linjerne.
Du kan klikke på de forskellige områder i figuren herunder, hvis du vil læse mere om de mange kompetencer, der fremgår af Finance IT Services’ digitaliseringscirkel.
Vil du forstå mere om både dybden og bredden i generativ AI?
Så giv vores AI Lead, Lasse Rindom, et kald. Hans levende foredrag skal nok efterlade AI-stof til eftertanke. Og søger du inspiration til, hvordan du kan bruge og implementere generativ AI, så det passer ind i din virksomheds formål, vision og strategi? Så er han også manden, du leder efter.