Fra bred chat til specialiseret og nyttig AI-funktion

De mest avancerede AI-modeller besidder skjulte evner, der rækker langt ud over det umiddelbart synlige. I denne artikel ser vi nærmere på, hvordan du kan afdække og udnytte disse indlejrede funktioner til at løse komplekse, veldefinerede og nyttige opgaver.

Generativ AI-modeller – og særligt de store sprogmodeller ChatGPT, Gemini og Claude – har nu igennem et par år imponeret folk med deres evne til at gå på tværs af etablerede domæner og skabe noget nyt. Det føles som rigtig, kreativ intelligens, når vi får beskrevet komplekse regnskabsbegreber i et Andeby-sprog, eller når billedgenereringsmodeller laver nye møbler inspireret af store bløde tegnefilmsbamser. 

Denne manglende begrænsning, når de går til kanten af ét domæne, og modellerne i stedet infererer på tværs til andre domæner, er forståeligt nok utroligt fascinerende. Det er det, der gør, at modellerne altid kan svare, også selvom de egentlig er på kanten af deres viden. De kan gætte sig til det usagte, de kan springe til andre vidensområder og skabe inferens via rent sprog-statistisk logiske sammenhænge. 

Det er bare ikke det, der skaber den helt store produktive gennemslagskraft, når teknologien skal sættes til at arbejde for os.

Bredde og dybde

Helt grundlæggende kan du anskue de (meget) store modeller ud fra to parametre: bredde og dybde. Hvor bredden i modellernes træningsdata og træning har været det, der har været afgørende i langt de fleste første forsøg og implementeringer, og også er det, der har skabt ovennævnte fascination, er det ganske overset – eller anses som trivielt – hvor dybt modellerne også er trænet inden for enkelte områder. 

Udfordringen har her været, at vi netop har været nødsaget til at anse dybden som triviel, fordi vi ikke har kunnet verificere den – vi kender ikke træningsdataene, så vi ved ikke, hvad og hvor meget af dette eller hint modellerne er trænet på. På den måde har vores tilgang til dem været mere i retning af at spørge en uudgrundelighed, hvor netop bredden og de skæve sammenhænge blev spændende. 

Alligevel er det dybden i modellerne – den specialiserede funktion – der har afstedkommet den største, direkte identificerbare optimering: kodning. Udviklere har taget de store sprogmodeller til sig i et omfang, så de ikke længere kan forestille sig at arbejde uden. Modellerne er nemlig trænet på enorme mængder kodedata, så de forstår sig helt enormt godt på kode.

Generativ AI i supportfunktioner

Hvordan får I AI til at generere konkret – og nogle gange også målbar – værdi direkte i kerneprocesser og centrale værdikæder? Det er kernen i Basicos rådgivning om AI.

Læs om Generativ AI

Hvad forstår en sprogmodel?

Spørgsmålet bliver derfor: "Hvad forstår modellerne ellers?"

Tech-virksomheden Anthropic, som laver sprogmodellen Claude, der er en af de mest direkte konkurrenter til ChatGPT, udgav i forsommeren 2024 et større studie, hvor de havde undersøgt, hvilke funktioner (i artiklen kaldet ‘features’, grupperinger, sammenhænge) der fandtes i en sprogmodels hjerne.

Ved at køre modellen på en særlig måde over millioner af gange kunne de identificere funktioner, der fx omhandlede Golden Gate Bridge. Der var en masse viden tilknyttet broen – rød, San Francisco, beton og lign. – og dette betød, at modellen havde et sprogligt koncept om, hvad Golden Gate Bridge var. Ved at forstærke denne funktion – altså ved hjælp af kode øge sandsynligheden for, at modellen brugte Golden Gate Bridge i sine svar – oplevede de også, at modellen begyndte at opføre sig anderledes end før. Fx begyndte den at tro, at den var en stor rød bro og ikke en sprogmodel. Og der var utallige af disse funktioner gemt i modellen. Disse funktioners eksistens betyder, at der ligger skjult ekspertise i modellerne.

Og det er denne ekspertise, vi skal afdække og bygge med. 

For modellerne har fx også en funktion, der omhandler fakturaer. De har set så mange forskellige fakturaer, at de ved, hvordan de ser ud, og også hvordan en outlier-faktura kan fortolkes som en ordinær – der er logikker i modellerne, der på en særlig måde kan rationalisere, at det her er kundenummer, dette er kontaktperson osv. Ligesom de også kan se, hvad der er en autosignatur i en mail om fx adresseændring, så to adresser i samme mail ikke forveksles. Fordi de også har en funktion, der omhandler mailstrukturer og formater. 

Ved at afdække disse funktioner opnås der også forudsigelighed. Prøv fx at bede ChatGPT afslutte denne sætning "To be or not to be; that is …", og du vil altid få "the question". Men hvis du i stedet beder den afslutte denne sætning - "CFO’en tog til Mars, fordi …" ‒ får du kaotiske svar hver gang. Simpelthen fordi den dér bruger sin bredde til at gætte på noget, den egentlig ikke har dybde nok til. Der er i en sprogmodel en Hamlet-funktion gemt, men ikke en astronaut-CFO.

Indkredsning af funktioner er en gamechanger

Når vi prompt engineerer – altså designer spørgsmål og opgaver til en AI-model – forsøger vi altid at ramme opgaven og konteksten ind. Det er hele humlen. Og det gør vi, fordi vi ikke vil have den til at svare i bredden, men ned i en dybere kontekst. Udviklere, der bruger modellerne, forstår dette intuitivt, men det skal også forstås på et analytisk ideniveau. 

De opgaver, vi sætter en sprogmodel til at arbejde på, skal derfor være to ting: definerbare, så en funktion kan identificeres eller afvises, og grundlæggende alment kendte, så vi kan forvente, at modellerne evt. har en funktion, der kan tjene vores formål. 

Det betyder også, at vi kortvarigt skal se bort fra chatbotten, der kan svare på alt, og i stedet søge at afdække skarpe funktioner, der kan løse kendte problemer. I stedet for AI-agenter, som der tales meget om på AI-markedet lige nu, ligger gevinsten for de fleste virksomheder i at definere og udvikle AI-roller. Forskellen er simpelthen, at en agent forventes at kunne gøre alt, hvad du beder den om, og være egenrådig, mens en rolle kun kommer på scenen på rette tid og med præcise replikker. 

Ved at indkredse rollen får vi forudsigelighed tilbage og opgaveløsninger, vi kan måle på. Vi får også mulighed for at bruge modellerne til det, vi aldrig før har kunnet løse så nemt med teknologi: at strukturere det ustrukturerede. Gennem roller, der bygger på identificerede funktioner, og som kan kontekstualisere og logisk fortolke forskelligt input, kan en sprogmodel skabe orden i data, der ellers er vilkårlig. Og dét er den virkelige gamechanger, når det kommer til den nye bølge af AI, for det udvider hele det digitale spillebræt.

AI-nørderier i podcastformat

I podcasten The Only Contant inviterer Basicos Lead AI Lasse Rindom prominente danske og internationale gæster til en samtale om teknologien, dens potentialer, udfordringer og betydning for os selv og det samfund, vi lever i.

Lyt med her

Det korte budskab: Ved at fokusere de store AI-modeller får du konkrete gevinster

Efter nu i nogle år at have afprøvet og spredt budskabet om AI rundt i organisationerne står virksomheder over for udfordringen om, hvordan der skabes reel værdi med generativ AI. Sandheden er, at hvor modellerne først imponerede ved at ligne en C3PO, der kunne svare på alt, ligger gevinsten i at finde modellernes indre funktioner og lægge dem i en spændetrøje omkring disse funktioner. Modellerne ved enormt meget, men det interessante er at finde ud af, hvor meget de ved om ét emne og én opgave, og ikke hvor meget de kan brede sig ud over irrelevante områder. 

Behandl dem som en medarbejder, der skal ansættes: Personens viden om de konkrete opgaver er altid vigtigere end anden almen viden. Identifikation af præcise (ofte ustrukturerede) opgaver og test af modellernes skarphed på disse er derfor helt afgørende for at høste værdi af de store sprogmodeller.

Kompetencer hele vejen rundt

Artiklen her giver dig et indblik i maskinrummet på de store sprogmodeller og opfordrer til at udnytte modellernes dybe viden. For selvom sprogmodellernes bredde er det, der skaber den første fascination, er det i dybden, at potentialet for værdiskabelse ligger.

Data

Data er grundlaget for alt arbejde i såvel finansfunktionen som de andre supportfunktioner. Alligevel oplever mange virksomheder udfordringer med at opnå den kvalitet i deres data, som de ønsker, og med at få deres data struktureret og gjort tilgængelige.

Det vil vi gerne hjælpe med at gøre noget ved!

Læs mere her

People

Dine state-of-the-art applikationer er ikke bedre end de mennesker, der betjener dem. Og intet projekt vinder stående applaus fra ledelsen, hvis ikke de rette mennesker med de rette kompetencer er involveret. Så hvordan sikrer du dét, når nu ingen medarbejdere kan alt, kender alt – eller har al tid i verden?

Læs mere her

Processes

For mange virksomheder er det at dokumentere processer enten en engangsfornøjelse, hvor processerne indgår i en specifik sammenhæng, eller en årligt tilbagevendende begivenhed for at stille revisionen tilfreds.

Vores erfaring er, at der er stor forretningsmæssig værdi i løbende at arbejde med dine processer og holde dem opdateret.

Læs mere om processer her

BI

Sæt strøm til dine data med en BI-løsning

Brugen af data er altafgørende for at skabe indsigt i din virksomhed og sætte det, som ikke kan ses med det blotte øje, frem i lyset. Men desværre kan dataanalyse hurtigt udvikle sig til en tung og tidskrævende pligt, som ikke skaber den ønskede værdi – særligt hvis dataanalyse bliver lig med afrapportering. Her kan den rette BI-løsning blive din bedste ven og hjælpe dig med at bruge dine data så værdiskabende som muligt.

Læs mere om BI-løsninger her

FP&A

Årets budget og forecasts er på listen over finansfunktionens vigtigste leverancer. To nøgleopgaver, som er med til at fastlægge retningen for og forventningerne til organisationen.

Men i mange organisationer er både grundprincipperne og de bagvedliggende supporterende arbejdsrutiner medvirkende til at skubbe værdiskabelsen til siden. Oftest til fordel for et ressourcekrævende fokus på at levere meget nøjagtige tal.

Vil du ud over det?

Læs mere om agil planlægning her

ERP

Drøm stort, når du opgraderer eller implementerer et ERP-system.

For det er en bekostelig affære, men samtidig en oplagt mulighed for at få transformeret forretningen. Transformationen kan tage udgangspunkt i forretningsprocesserne som den røde tråd i ERP-projektet, hvilket er med til at sikre projektets forankring i forretningen.

Læs mere om vores ERP-rådgivning her

Non Standard Process

Bruger dine finansielle medarbejdere for meget tid på manuelle processer? Og har du overvejet, om automatisering kunne være vejen frem?

Ud over at digitalisere de finansielle standardprocesser kan vi nemlig også hjælpe dig med at få automatiseret de processer, der er særegne for din virksomhed og din finansfunktion – bl.a. ved hjælp af RPA og Workflow.

Læs mere om vores processer her

Standard Process

Vi er 100-metermestre i at bygge den lavpraktiske infrastruktur, der understøtter finansfunktionen. Det indebærer digitalisering og systemunderstøttelse – bl.a. af de finansielle standardprocesser såsom lukkeprocessen.

Læs mere om vores ydelser her