Ataque ‘Echo Chamber’ ultrapassa guardrails de IA

Um pesquisador de segurança de IA desenvolveu uma prova de conceito que usa prompts sutis e aparentemente inofensivos para fazer com que o GPT e o Gemini gerem conteúdo inadequado.


Publicado

em

por

Tags:

Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *