Lex – Danmarks Nationalleksikon har indgået et treårigt samarbejde med Center for Humanities Computing (CHC) ved Aarhus Universitet for at udvikle en chatbot baseret på kunstig intelligens (AI).
Dette initiativ har til formål at forbedre brugeroplevelsen på lex.dk ved at tilbyde mere interaktive og personlige søgninger. Projektet skal sikre, at Lex’ indhold er tilgængeligt med den teknologi, som brugerne vil benytte i fremtiden. Brugerne vil ved hjælp af chatbotten på Lex kunne få personaliserede svar: Børn kan få simple forklaringer, borgere kan fx få et overblik på tværs af emner, og undervisere kan få fagligt dybdegående hjælp.
Nedenfor besvares nogle af de spørgsmål, som man som forfatter, bidragyder eller bruger af leksikonet muligvis har i relation til udviklingen af en dansk chatbot.
Hvad indebærer projektet præcist?
Projektet sigter mod at udvikle en AI-baseret chatbot, der kan hjælpe brugerne med at navigere og finde information på lex.dk mere effektivt. Ved at anvende avancerede sprogmodeller og maskinlæringsteknikker vil chatbotten kunne forstå og besvare brugerforespørgsler på en mere naturlig og intuitiv måde.
Hvilken rolle spiller Center for Humanities Computing i projektet?
Center for Humanities Computing (CHC) ved Aarhus Universitet er en forsknings- og udviklingsenhed, der er specialiseret i at anvende dataanalyse, maskinlæring og kunstig intelligens inden for humanistisk forskning. I dette projekt bidrager CHC med teknisk ekspertise og udvikling af de AI-modeller, der skal drive den virtuelle assistent.
Indhold
Hvordan vil den virtuelle assistent påvirke den eksisterende indholdsstruktur på lex.dk?
Den virtuelle assistent vil fungere som et supplement til den eksisterende indholdsstruktur og ikke erstatte den. Artikler og indhold forbliver uændrede, men assistenten vil gøre det lettere for brugerne at finde og interagere med dette indhold.
Hvordan sikres det, at den kunstige intelligens respekterer og bevarer indholdets integritet i leksikonet?
AI-assistenten vil udelukkende basere sine svar på det eksisterende indhold fra lex.dk. Den vil ikke generere nyt indhold, men præsentere og sammenfatte eksisterende information på en måde, der gør det lettere for brugerne at finde relevante oplysninger. Dette sikrer, at den faglige integritet og kvaliteten af leksikonets indhold opretholdes.
Vil chatbotten få betydning for, hvordan artiklerne skal udformes (sprogligt og strukturelt) – vil den ændre på nogle af de redaktionelle principper?
Det er en af sprogmodellernes styrker, at de ikke er meget følsomme over for strukturen i den tekst, de skal forstå. De kan trænes til at forstå, hvad en artikel indeholder, også uden at teksten skal omorganiseres og opdeles. Det samme gælder sproget i vores artikler. Det er en central ambition i projektet, at chatbotten bliver i stand til at formulere svar på forskellige niveauer af sproglig kompleksitet, uden at den oprindelige artikel skal tilpasses (og uden at svarene bliver forkerte).
Alt i alt forventer vi på nuværende tidspunkt ikke, at projektet vil afføde ændringer af vores redaktionelle principper.
Hvordan sikrer I, at fagansvarlige og bidragsydere krediteres for det indhold, de har skrevet?
Svarene i chatbotten vil altid blive præsenteret sammen med kildehenvisninger til de bagvedliggende artikler, så brugeren kan se, hvor indholdet kommer fra, og det sikres, at indholdet stadig er knyttet til den oprindelige artikel (og fagansvarlige og bidragsydere).
De fagansvarliges rolle
Vil de fagansvarlige blive involveret i udviklingsprocessen?
Ja, fagansvarlige og fagmedarbejdere vil blive inddraget i udviklingsprocessen for at sikre, at chatbotten fungerer optimalt og understøtter leksikonets mål om at formidle troværdig viden. Fagansvarlige og fagmedarbejdere kan give input til chatbottens funktionalitet og anvendelse, ligesom vi opfordrer alle fagansvarlige og fagmedarbejdere ved Lex til at melde sig som testbrugere til de prototyper, vi lancerer løbende hen over de kommende tre år. Man kan allerede nu tilmelde sig brugerpanelet på mere.lex.dk/brugerpanel.
Hvordan kan fagansvarlige og fagmedarbejdere bidrage til projektets succes?
Fagansvarlige og fagmedarbejdere opfordres til at deltage som betatestere af chatbotten samt til at fortsætte med at levere kvalitetsindhold til leksikonet. De fagansvarliges og fagmedarbejdernes ekspertise og indsigt er afgørende for at sikre, at den virtuelle assistent bliver et værdifuldt værktøj for brugerne.
Samarbejdet mellem Lex og Center for Humanities Computing er en spændende mulighed for at integrere avanceret teknologi i formidlingen af viden og gøre leksikonet endnu mere tilgængeligt og brugervenligt for alle.
Rettigheder
Har I rettigheder til at arbejde med kunstig intelligens?
Lex er i dialog med Udvalget til Beskyttelse af Videnskabeligt Arbejde (UBVA), og vi er enige om, at en chatbot ikke ændrer på de rettighedsmæssige forhold, og at de nødvendige ophavsrettigheder allerede ér klareret i aftalerne mellem Lex og Gyldendal og Gad, i Lex’ forfatteraftaler og i aftalelicensaftalen med Copydan.
De sprogmodeller, som I bruger, har stjålet rettigheder, da de blev bygget. Hvordan kan I forsvare at anvende dem?
Lex vil anvende en eksisterende sprogmodel til at gøre det muligt at interagere med indholdet på lex.dk. Løsningen, som vi bygger, vil kunne anvende alle de eksisterende sprogmodeller og være forberedt til en dansk sprogmodel, når en sådan forhåbentligt bliver etableret. Det ligger endnu ikke fast, hvilken sprogmodel som vil blive anvendt indtil da. Det er afgørende, at modellen belaster klimaet mindst muligt, og at den overholder gældende lovgivning (både i forhold til brugernes data og anvendelsen af rettigheder). Sprogmodellen vil til enhver tid kunne udskiftes med en ny.
Datasikkerhed og privatliv
Hvordan håndteres bekymringer om datasikkerhed og privatliv?
Projektet overholder gældende lovgivning om datasikkerhed og privatliv, herunder GDPR. Brugen af den færdige chatbot vil ikke forudsætte, at man som bruger udleverer personlige oplysninger. Brugerdata vil blive behandlet fortroligt og anvendt udelukkende i udviklingsprocessen til at forbedre chatbottens funktionalitet.
Tidsplan
Hvornår forventes chatbotten at være tilgængelig for brugerne?
Projektet er planlagt til at vare tre år. Vi planlægger løbende at lancere prototyper og forventer, at de første betabrugere allerede kan få adgang i et lukket univers inden sommerferien i år. Det er vores ambition, at den første åbne version, som alle kan få adgang til, vil blive lanceret inden for det første halvandet år, hvorefter der vil være en testfase med brugerfeedback, før den endelige version implementeres.
Klimabelastning
Kunstig intelligens sviner. Hvordan vil I sikre, at Lex’ chatbot har et lavt klimaaftryk?
Mange af de eksisterende chatbots, som brugerne anvender i dag, har ganske rigtigt en meget stor klimabelastning, men sådan behøver det ikke at være. Der findes løsninger, som ikke belaster klimaet så meget, og det er en afgørende succesfaktor for dette projekt, at den virtuelle assistent har så lav klimabelastning som muligt.
Brugerinddragelse
Kommer I til at inddrage brugerne?
Udviklingen af en dansk chatbot, hvor brugerne kan tilgå viden på dansk og få viden, de kan stole på, vil kræve en omfattende inddragelse af brugerne. Lex vil invitere store grupper af brugere til at deltage i brugerpaneler: elever, studerende, undervisere og almindelige borgere.