Collecting Cyber-News from over 60 sources

Sophos entwickelt LLM-Salting-Technik zum Schutz vor Jailbreak-Prompts

Nov 4, 2025 12:19 PM

Konkret haben die Forschenden einen Bereich in den sogenannten Modellaktivierungen identifiziert, der für das ‘Verweigerungsverhalten” zuständig ist also dafür, wann die KI bestimmte Anfragen ablehnt.

First seen on infopoint-security.de

Jump to article: www.infopoint-security.de/sophos-entwickelt-llm-salting-technik-zum-schutz-vor-jailbreak-pompts/a42603/

Sophos entwickelt LLM-Salting-Technik zum Schutz vor Jailbreak-Prompts

also interesting: