Публикация #226 — AISec [x

TGStat

Введите текст для поиска

Расширенный поиск каналов

Russian

Язык сайта

Russian English Uzbek
Вход на сайт

Каталог

Каталог каналов и чатов Поиск каналов
Добавить канал/чат
Рейтинги

Рейтинг каналов Рейтинг чатов Рейтинг публикаций
Рейтинги брендов и персон
Аналитика
Поиск по публикациям
Мониторинг Telegram

AISec [x_feed]

20 Feb 2024, 21:53

Открыть в Telegram Поделиться Пожаловаться

@garak_llm: you could pay for jailbreak prompts - https://t.co/f9qdSMBDoA… - or you could just use garak's DanInTheWild probe to run a set of 666 known good jailbreaks against your LLM, and see if the model blocks them. 395 of these jailbreaks aren't mitigated by gpt-3.5-turbo 😬 https://t.co/PhjoW4oTsv
https://twitter.com/garak_llm/status/1760011930348159487

Psst … wanna jailbreak ChatGPT? Thousands of malicious prompts for sale

Turns out it's pretty easy to make the model jump its own guardrails

19 0 0