Fra OpenAI til Gemma
I december 2025 migrerer den danske chatbot væk fra OpenAI over til en open source-model, Gemma, der kan hostes lokalt.
Når den danske chatbot skifter den bagvedliggende “motor” ud med en åben sprogmodel, gør det os mindre sårbare, siger Ole Mølgaard, sekretariatschef på Lex..
“Et væsentligt formål med udviklingen af den danske chatbot er at gøre os mindre afhængige af udenlandske techgiganter, hvis værdier og forretningsmodeller, vi ikke har nogen indflydelse på.
Når vi skifter fra en global sprogmodel til en mindre, open-source model, der kan hostes lokalt, er det, fordi vi ønsker større ejerskab over løsningen og at beskytte vores og brugernes data. Med open source får vi større gennemsigtighed, både i udviklingen, i delingen af erfaringer og i muligheden for at forstå, analysere og forbedre resultaterne. Samtidig kan vi bygge en chatbot, der belaster klimaet så lidt som muligt,”
Teknisk set består chatbotten af to modeller, som arbejder sammen:
Første trin er at finde de rigtige informationer. Hertil bruger vi en embedding-model til at finde de mest relevante Lex-kilder til jeres spørgsmål. Her skifter vi fra OpenAI til en ny søgemodel, der er så let, at den kan køre direkte på Aarhus Universitets egne servere. Det giver mere kontrol og mindre afhængighed af eksterne platforme.
Når kilderne er fundet, bruger vi en genereringsmodel til at formulere selve svaret. Den skifter vi fra ChatGPT til Gemma, som hostes i et datacenter i Finland via et hollandsk firma, Nebius.
“Begge nye modeller er væsentligt mindre end dem, vi skifter fra; selvom vi ikke kender ChatGPT 4.1’s nøjagtige størrelse er vores bedste estimat, at Gemma er omkring 50 gange mindre, så en mindre kvalitetsnedgang er forventelig. Til gengæld bruger vi nu kun en brøkdel af den strøm og det vand, som de tidligere modeller krævede, og al AI-teknologi holdes nu indenfor EU’s grænser”, forklarer postdoc Simon Enni fra Center for Humanities Computing (CHC), Aarhus Universitet.
Fakta
Den danske chatbot skifter søgemodel fra OpenAI’s Text Embedding 3 Large til Multilingual E5 Small fra Microsoft Research. Svar-genereringsmodellen skifter fra ChatGPT 4.1 til Gemma 3 27b fra Google.