EN, securityweek

‘Deceptive Delight’ Jailbreak Tricks Gen-AI by Embedding Unsafe Topics in Benign Narratives

2024-10-24 14:10

Deceptive Delight is a new AI jailbreak that has been successfully tested against eight models with an average success rate of 65%.

The post ‘Deceptive Delight’ Jailbreak Tricks Gen-AI by Embedding Unsafe Topics in Benign Narratives appeared first on SecurityWeek.

This article has been indexed from SecurityWeek

Read the original article:

‘Deceptive Delight’ Jailbreak Tricks Gen-AI by Embedding Unsafe Topics in Benign Narratives

Related

← SEC Fines Four Tech Firms for Downplaying SolarWinds Impacts

The 3 Questions at the Core of Every Cybersecurity Compliance Mandate →