Tech & AI nyheder
AI & ChatGPT

AI-firmaer køber mailarkiver fra konkursboer til AI-træning

AI-selskaber opkøber nu mailarkiver og chatlogs fra konkursramte virksomheder for at skaffe ny træningsdata – en praksis der i EU sandsynligvis er i strid med GDPR.

TeknikPuls Redaktion··5 min læsning
AI-firmaer køber mailarkiver fra konkursboer til AI-træning

Det er en ny og kontroversiel metode til at skaffe træningsdata til kunstig intelligens: Opkøb af mailarkiver fra konkursramte virksomheder. Ifølge Computerworld er der opstået et decideret marked for denne type data, og det foregår i et juridisk gråzone – særligt set fra et europæisk perspektiv.

Guldfeber efter data

"Det føles som en guldfeber," udtaler et amerikansk firma, der har specialiseret sig i netop dette forretningsområde: at opkøbe e-mailarkiver og chatlogs fra konkursboer og videresælge dem til AI-virksomheder, som bruger dem til at træne deres sprogmodeller.

Når en virksomhed går konkurs, havner dens digitale aktiver – herunder årevis af interne mails og kommunikation – under konkursboets administration. Her er de juridisk tilgængelige for salg, og AI-industrien har fået øjnene op for, at disse arkiver rummer enorme mængder autentisk, ufiltreret tekst – præcis det, sprogmodeller er sultne efter.

Sandsynligvis ulovligt i EU

En dansk ekspert, som Computerworld har talt med, er dog ikke i tvivl: I EU vil denne praksis formentlig være i strid med GDPR. Problemet er grundlæggende – de mails, der sælges, indeholder personoplysninger om ansatte, kunder og samarbejdspartnere, som aldrig har givet samtykke til, at deres kommunikation må bruges til AI-træning.

Under GDPR kræver behandling af personoplysninger et klart retsgrundlag. Et konkursbo kan sælge en virksomheds fysiske og digitale aktiver, men det medfører ikke automatisk retten til at videregive personoplysninger til et helt nyt formål – og slet ikke til noget så vidtrækkende som AI-træning.

Et voksende problem for databeskyttelse

Sagen illustrerer en bredere udfordring: AI-industrien er i desperat jagt på nyt og varieret træningsdata, efterhånden som de oplagte offentlige datakilder er udtømt eller låst bag betalingsmure. Det har ført til stadig mere kreative – og juridisk tvivlsomme – metoder til dataanskaffelse.

Det er ikke første gang, AI-firmaer er under pres for deres datapraksis. Tidligere har scraping af sociale medier, nyhedsartikler og websteder givet anledning til retssager. Mailarkiver fra konkursboer repræsenterer blot endnu et kapitel i den samme historie.

For europæiske virksomheder og borgere understreger sagen vigtigheden af, at databeskyttelsesmyndighederne holder øje med de metoder, AI-industrien anvender til at skaffe træningsdata – også de mere utraditionelle.

Kilde: Computerworld — computerworld.dk/art/295279/ai-selskaber-er-paa-jagt-efter-ny-traeningsdata-opkoeber-nu-mailarkiver-fra-konkursramte-selskaber

Kilde: https://www.computerworld.dk/art/295279/ai-selskaber-er-paa-jagt-efter-ny-traeningsdata-opkoeber-nu-mailarkiver-fra-konkursramte-selskaber

Læs også