Når AI træner på andres indhold uden tilladelse, risikerer vi tab af troværdige kilder, og vores fælles vidensfundament bliver rystet.
“Vi er vidne til verdenshistoriens største tyveri”
Sådan lød det fra Lex’ sekretariatschef, Ole Mølgaard, i marts i DR’s kulturprogram K-Live, hvor han kritiserede de store sprogmodellers uautoriserede brug af andres indhold. I 2025 blev Lex’ 250.000 artikler eksempelvis høstet af ChatGPT omkring otte millioner gange om måneden.
Ifølge Ole Mølgaard er det dybt problematisk. Store techvirksomheder som Google og OpenAI træner deres modeller på indhold fra Lex og andre uden tilladelse. De svar, modellerne genererer, kan være meget tæt på originalteksterne, og selvom svarene ofte er fulde af fejl, ser de tilforladelige ud.
“Det gør brugerne mindre tilbøjelige til at klikke videre til de oprindelige kilder. På den måde stjæler virksomhederne både indhold, brugere, troværdighed og autoritet fra de oprindelige udgivere”, lyder det fra Ole Mølgaard.
Lex står ikke alene med kritikken. Opslagsværket Encyclopedia Britannica har lagt sag an mod Perplexity AI, og tidligere på året lagde DPCMO, der repræsenterer næsten hele den danske mediebranche, sag an mod OpenAI for at bruge danske nyhedsmediers ophavsretsbeskyttede indhold til at træne ChatGPT.
Ole Mølgaard fortsætter:
“Chatbotterne og AI giver fantastiske muligheder, men desværre får man som bruger alt for ofte fejlfyldte svar, og svar, som ikke er forankret i kilder. Som borgere og som samfund har vi brug for at vide, hvad vi kan stole på. Man kan sige, at sprogmodellerne ryster vores vidensfundament.”
Det er baggrunden for, at Lex i disse år samarbejder med Center for Humanities Computing ved Aarhus Universitet om et forskningsprojekt, der skal udvikle et pålideligt, dansk alternativ til de store spillere – med målet om at give alle borgere adgang til troværdig viden.

Ole Mølgaard er sekretariatschef for lex.dk.