Fra hjelper til hinder - hvordan AI kan svikte i komplekse prosjekter

‍

DEL 3 – Hvordan kan AI faktisk hjelpe?

I de to fÞrste delene av denne artikkelserien har vi sett pÄ hvordan vi kan optimalisere bruken av LLM-er gjennom bedre konteksthÄndtering og unngÄelse av bias. I denne delen skal vi prÞve Ä sammenfÞye dette med Ä se pÄ hvordan man kan bruke AI-verktÞy effektivt, samtidig som vi sikrer at disse verktÞyene forblir pÄlitelige hjelpere og ikke utilsiktede hinder.

Effektiv bruk av LLM-er krever mer enn Ă„ forstĂ„ teknologien – det handler om Ă„ legge merke til nĂ„r man selv ikke lenger kan verifisere det en AI-modell sier, og hvordan man best kan integrere dens evner i arbeidsprosesser, uten Ă„ bero pĂ„ AI-modellen.  

Dagens stĂžrste begrensning

Utfordringene med dagens LLM-er fokus, i bÄde input og output. Desto mer av arbeidet du gir til en AI, desto lavere kvalitet vil du fÄ tilbake. For Ä teste dette, matet jeg inn hele del 1 og del 2 av denne artikkelserien i AI-en, for Ä jobbe med del 3. Jeg brukte teknikkene jeg har gjennomgÄtt, og jobbet for Ä gi LLM-en best mulighet til Ä gjÞre det bra. Jeg ba den idémyldre, finne frem til struktur, og ba den skrive del 3 i samme stil den kunne se fra del 1 og del 2. Resultatet ble dessverre upersonlig og uinteressant.

Etter Ä ha jobbet mye med AI-generert tekst, blir det slÄende hvor lett det er Ä gjennomskue den. Du gjenkjenner AI-tekst ekstremt lett, ikke bare fordi du har lÊrt deg Ä se etter lister som en indikasjon, men ogsÄ fordi det blir som The Uncanny Valley av tekst. Selv der hvor jeg kunne gi to tekster i akkurat samme stil, om akkurat samme tema, ble det en for generell oppgave for modellen.  

SĂ„ dersom du ber en AI-modell gjĂžre en for stor del av jobben for deg, vil kvaliteten bli lavere. Det samme gjelder dersom du putter inn for mye tekst. Det er en dĂ„rlig idĂ© Ă„ kopiere inn hele Norges lover og be om en vurdering av en situasjon. Dersom du allerede har valgt ut relevante lover – eller enda bedre, relevante paragrafer – vil du fĂ„ langt bedre svar fra en LLM. Desto mer av arbeidet du selv gjĂžr, desto bedre kan en AI stĂžtte deg.

Agenter

Agenter er en fascinerende mÄte Ä unngÄ deler av disse utfordringene pÄ. Som et steg i Ä prÞve Ä minimere effekten jeg nevner over, kan man be en LLM gjÞre en liten del av en oppgave, men i mange iterasjoner. Trikset er Ä starte med et nytt kontekstvindu for hver iterasjon, og lage avgrensede roller som gjÞr neste del av arbeidet. En agent kan vÊre sÄ enkelt som en ny samtale med ChatGPT som du gir en annen prompt. La oss si du har fÞrsteutkast av en tekst du Þnsker hjelp med. I fÞrste omgang gir du teksten til en slags redaktÞr-agent. Du ber den foreslÄ endringer som gir hele teksten bedre struktur, foreslÄ ting som bÞr utbroderes og ting som bÞr nedkortes. Deretter gÄr det videre til en sprÄkflyt-agent. Resultatet av dette gir du videre til en rettskrivningsagent.

Totalt vil dette gi deg et resultat av hÞyere kvalitet enn Ä gi den til en "fiks artikkelen min"-agent. Se pÄ det som en mÄte Ä sette til verks alt jeg har nevnt sÄ langt. Hvis én samtale med ChatGPT som genererer kode setter seg fast, er det bare Ä mate feilmeldingen inn i en ny samtale, og du fÄr mest sannsynlig rett hjelp. Kontekst, bias og fokus kan forbedres pÄ denne mÄten.

Teknologien LLM har mange iboende begrensninger. Det er ikke nÞdvendigvis denne strukturen som blir den beste mÄten Ä lage AI i fremtiden. Likevel er det et ekstremt stort potensial i agenter. Dersom modellen man velger er tilpasset rollen til agenten, kan man se for seg et hav av muligheter. Folk har utviklet konseptet til Ä inkludere hele virtuelle organisasjoner, med strukturer for Ä lÞse komplekse oppgaver. Fra et virtuelt styre pÄ toppen, til utviklere, testere og produkteiere i andre enden. Meldinger utveksles mellom lagene, og avgrensningen i rollen gjÞr at hver agent kan bidra pÄ en konstruktiv mÄte.

Idémyldring

Dagens LLM-er kan vÊre ekstremt nyttig sparringspartner i idémyldringsfasen. Vi kjenner alle den fÞlelsen nÄr en spennende idé skaper en gnist i oss. Akkurat den gnisten tror jeg AI kan bistÄ med. Her blir det AI-en som hjelper oss med fokus. Vi kan ta nytte av at det er enkelt for en AI Ä generere mange ideer ekstremt raskt.  

DrĂžfting av egen forstĂ„else – en moderne rubber duck

Innen programmering er rubberducking en teknikk som innebÊrer Ä fortelle om kode til en badeand, i et forsÞk pÄ Ä tvinge oss selv se pÄ et problem fra et nytt perspektiv. Det Ä gjÞre tankerekken vÄr lineÊr, hjelper oss legge merke til nye detaljer. Det Ä formulere tankene dine og legge dem frem for en LLM kan vÊre en teknikk som kan bistÄ deg i egne tankerekker, selv uten at modellen trenger gi meninger om det du sier.

Noen ganger trenger vi litt mer enn en badeand Ä snakke til, men det kan vÊre overraskende lite som skal til for stor effekt. Selv nÄr en LLM kun bistÄr oss i oppfÞlgingsspÞrsmÄl, kan det vÊre nok til Ä fÄ oss selv til Ä konkretisere en hel tankerekke. Vi benytter oss av at vi er sosiale dyr, og at hjernen vÄr er skrudd sammen for interaksjon. Uten Ä la det utspille seg pÄ samme mÄte som i filmen Her, anbefaler jeg alle Ä prÞve Ä snakke med en LLM for Ä lufte et problem man tenker pÄ, eller fÄ utlÞp for frustrasjon. PrÞv det gjerne i en modus hvor du kan bruke stemmen din. Opplevelsen fÞrste gang du gjÞr dette, og nÊrmest glemmer at det kun er en stor sprÄkmodell som er i andre enden, er ganske surrealistisk. Jeg hÄper vi ikke erstatter bestevennene vÄre som sparringspartnere, men dagens AI er et sterkt supplement.

Konklusjon

Dagens AI kan ikke erstatte en ekspert. Likevel er det mange omrÄder av tingene vi allerede gjÞr som kan forsterkes av en LLM. Disse modellene bÞr nok ikke ta komplekse oppgaver pÄ egenhÄnd, men samtidig er muligheten til Ä ha en AI som skriver referat fra et mÞte noe som er en stor hjelp i hverdagen. Du kan ogsÄ fÄ bistand innen det dyptgÄende arbeidet du gjÞr, sÄ lenge du er kjent med dine egne og LLM-ens begrensninger. AI kan ogsÄ gi deg et nytt perspektiv pÄ et problem du sitter fast i. Likevel kan ikke AI oversette romaner, eller skrive hele systemer.

Jeg hÄper AI kan vÊre det neste hoppet i produktivitet i samfunnet. Det kan vÊre med Ä bane vei til 30 timers arbeidsuke. Eller viktigst av alt: til en hverdag hvor jeg slipper forholde meg til innboksen min.

-Tomas