Artwork

Вміст надано Today, Explained AI and Explained AI. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією Today, Explained AI and Explained AI або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.
Player FM - додаток Podcast
Переходьте в офлайн за допомогою програми Player FM !

Researchers Expose "Adversarial Poetry" AI Jailbreak Flaw

5:24
 
Поширити
 

Manage episode 521724376 series 3679807
Вміст надано Today, Explained AI and Explained AI. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією Today, Explained AI and Explained AI або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.

In this episode, we break down new research revealing how "adversarial poetry" prompts can slip past safety filters in major AI chatbots to unlock instructions for nuclear weapons, cyberattacks, and other dangerous acts. We explore why poetic language confuses current guardrails, what this means for AI security, and how regulators and platforms might respond to this emerging threat.

Get the top 40+ AI Models for $20 at AI Box: ⁠⁠https://aibox.ai

See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

  continue reading

470 епізодів

Artwork
iconПоширити
 
Manage episode 521724376 series 3679807
Вміст надано Today, Explained AI and Explained AI. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією Today, Explained AI and Explained AI або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.

In this episode, we break down new research revealing how "adversarial poetry" prompts can slip past safety filters in major AI chatbots to unlock instructions for nuclear weapons, cyberattacks, and other dangerous acts. We explore why poetic language confuses current guardrails, what this means for AI security, and how regulators and platforms might respond to this emerging threat.

Get the top 40+ AI Models for $20 at AI Box: ⁠⁠https://aibox.ai

See Privacy Policy at https://art19.com/privacy and California Privacy Notice at https://art19.com/privacy#do-not-sell-my-info.

  continue reading

470 епізодів

Semua episode

×
 
Loading …

Ласкаво просимо до Player FM!

Player FM сканує Інтернет для отримання високоякісних подкастів, щоб ви могли насолоджуватися ними зараз. Це найкращий додаток для подкастів, який працює на Android, iPhone і веб-сторінці. Реєстрація для синхронізації підписок між пристроями.

 

Короткий довідник

Слухайте це шоу, досліджуючи
Відтворити