Ny Claude-model finder og udnytter sikkerhedshuller på egen hånd
Anthropics nyeste Claude-model kan selvstændigt finde og udnytte sikkerhedssårbarheder. Eksperter reagerer.
Kunstig intelligens tager endnu et spring fremad — men dette skridt rejser alvorlige sikkerhedsspørgsmål. Anthropics nyeste Claude-model viser sig i stand til selvstændigt at identificere og udnytte sikkerhedssårbarheder i software.
Hvad kan modellen?
I kontrollerede tests har Claude demonstreret evnen til at scanne systemer for sikkerhedshuller, analysere dem og i visse tilfælde aktivt udnytte dem — alt uden menneskelig vejledning undervejs. Det er et kvalitativt spring i AI-kapabilitet, som sikkerhedseksperter følger med bekymring.
Hvad betyder det for AI-sikkerhed?
Fra forskerside er reaktionerne nuancerede. På den ene side åbner teknologien for kraftfulde forsvar: AI der automatisk opdager og lukker sikkerhedshuller hurtigere end menneskelige teams. På den anden side er potentialet for misbrug åbenlyst — et system der kan hacke sig ind, kan bruges til det modsatte formål.
Anthropic understreger, at modellen er designet med sikkerhedsforanstaltninger, og at evnerne primært er til defensivt brug. Men i en verden hvor AI-modeller deles og tilpasses, er spørgsmålet legitimt: Hvem har kontrol?
Kilde: https://www.version2.dk/artikel/anthropic-ny-claude-model-finder-og-udnytter-saarbarheder-paa-egen-haand