UA
  • Новости
  • Видео
  • Популярное
  • Поиск
  • Приложения
download white apps
Скачать

AI под прицелом. Новое исследование раскрыло его опасную сторону

www.rbc.ua
Wed, 21 May 2025 15:45:00 +0300
AI под прицелом. Новое исследование раскрыло его опасную сторону

ИИ-чат-боты, подвергшиеся взлому, могут стать источником распространения опасной и незаконной информации, которую они усваивают в процессе обучения.

Об этом сообщает РБК-Украина со ссылкой на британское издание The Guardian.

Такое заявление прозвучало на фоне тревожной тенденции, связанной с так называемыми "взломами" (jailbreaking) ИИ-ботов, которые позволяют обходить встроенные механизмы безопасности. Эти ограничения изначально призваны предотвращать выдачу вредоносных, предвзятых или неуместных ответов на запросы пользователей. 

Откуда ИИ берет знания 

ИИ-движки, на которых работают такие чат-боты, как ChatGPT, Gemini и Claude, построены на базе больших языковых моделей (LLM), которые обучаются на гигантских объемах информации из интернета. 

Несмотря на попытки удалить вредоносный контент из обучающих данных, языковые модели по-прежнему впитывают информацию о таких незаконных действиях, как взлом, отмывание денег, инсайдерская торговля и изготовление взрывчатки. Механизмы безопасности должны препятствовать использованию этих данных в ответах ИИ. 

Исследование выявило тревожные уязвимости  

В новом исследовании, посвященном данной угрозе, ученые пришли к выводу, что большинство ИИ-чат-ботов можно довольно легко обмануть и заставить выдавать вредоносную или даже незаконную информацию. Они называют риск "немедленным, ощутимым и крайне тревожным". 

Chicago Sun-Times тем временем подтверждает: искусственный интеллект уже использовался для создания списка книг, которых в действительности не существует. 

"То, что раньше было доступно только государственным структурам или организованным преступным группировкам, вскоре может оказаться в руках любого, у кого есть ноутбук или даже смартфон", - отмечают авторы доклада. 

Исследование возглавили профессор Лиор Роках и доктор Михаэль Фаер из Университета имени Бен-Гуриона в Негеве (Израиль). Они подчеркивают рост угрозы со стороны так называемых "темных языковых моделей" (dark LLMs) - ИИ-моделей, которые либо изначально создаются без систем безопасности, либо модифицируются через взлом.  

Некоторые из таких моделей открыто рекламируются в интернете как "без этических ограничений" и готовы помогать в совершении противоправных действий - от киберпреступлений до мошенничества. 

Как работают jailbreak-атаки  

Jailbreaking, как правило, использует специально сформулированные подсказки, которые вводят ИИ в заблуждение и провоцируют на выдачу ответов, запрещенных политиками безопасности. Это достигается за счет конфликта между основным приоритетом модели, - помогать пользователю, и вторичным приоритетом - соблюдать этические и правовые ограничения. Сценарии таких атак часто строятся так, чтобы заставить систему поставить "полезность" выше запретов. 

Чтобы продемонстрировать масштаб проблемы, исследователи разработали универсальный jailbreak, который успешно “взломал" несколько ведущих ИИ-чат-ботов, заставив их отвечать на запросы, которые обычно должны блокироваться. Как утверждается в докладе, после взлома языковые модели стабильно выдавали ответы практически на любой, даже опасный, запрос. 

"Мы были шокированы, увидев, какие знания скрываются внутри системы", - говорит доктор Фаер. Среди примеров - инструкции по взлому компьютерных сетей, производству наркотиков и пошаговые руководства по совершению других преступлений. 

"Эта угроза отличается от всех предыдущих рисков, связанных с технологиями, своей беспрецедентной доступностью, масштабируемостью и адаптивностью", - добавляет профессор Роках. 

Авторы исследования связались с основными разработчиками языковых моделей, чтобы уведомить их о созданном универсальном взломе, однако получили, по их словам, "разочаровывающий" отклик. Некоторые компании вообще не ответили, другие заявили, что подобные атаки не подпадают под условия их программ, предусматривающих вознаграждение за выявление уязвимостей. 

Предложения по защите от ИИ-угроз 

В отчете подчеркивается, что технокомпаниям следует более тщательно фильтровать обучающие данные, внедрять мощные защитные механизмы против опасных запросов и ответов, а также разрабатывать технологии "машинного разучивания" - чтобы ИИ мог "забывать" незаконную информацию, усвоенную ранее.  

Темные LLM следует рассматривать как реальные угрозы безопасности, сравнимые с нелегальным оружием и взрывчаткой, а разработчики таких моделей должны нести ответственность. 

Доктор Ихсен Алуани, специалист по ИИ-безопасности из Университета Квинс в Белфасте, добавил, что такие атаки могут привести к серьезным последствиям - от распространения инструкций по изготовлению оружия до проведения масштабных дезинформационных кампаний, социальной инженерии и автоматизированного мошенничества "с пугающей точностью". 

"Решение проблемы требует серьезных инвестиций и усиление устойчивости моделей. Также необходимы четкие стандарты и независимый контроль, чтобы не отставать от быстро меняющейся угрозы", - отмечает эксперт. 

В компании OpenAI, разработавшей ChatGPT, заявили, что их последняя модель о1 умеет соотносить ответы с политиками безопасности, что делает ее более устойчивой к таким атакам. Также в компании сообщили, что постоянно работают над усилением защиты. 

Компании Meta, Google, Microsoft и Anthropic также были запрошены для комментария. Microsoft в ответ направила ссылку на блог, в котором описана ее работа по защите от взломов ИИ. 

Вас может заинтересовать:

  • Глава OpenAI рассказал, как ChatGPT изменит повседневную жизнь
  • 5 признаков, что текст написан ИИ, а не человеком
  • Как использовать ChatGPT для генерации идей
Читать полностью

Последние новости

Трамп объяснил "разрушительное" сокращение программ USAID
Трамп объяснил "разрушительное" сокращение программ USAID
Президент США Дональд Трамп признал разрушительными последствия приостановки финпомощи по всему миру и призвал другие страны скидываться на помощь.Об этом сообщает РБК-Украина со ссылкой на Re...
www.rbc.ua
Thu, 22 May 2025 00:00:00 +0300
"Тоттенхэм" выиграл Лигу Европы, в четвертый раз в сезоне одолев МЮ
"Тоттенхэм" выиграл Лигу Европы, в четвертый раз в сезоне одолев МЮ
Две английские команды, провалившие сезон в Премьер-лиге - Манчестер Юнайтед и Тоттенхэм - встретились в финале второго по престижности континентального трофея - Лиги Европы. Вместе с почетным ...
www.rbc.ua
Wed, 21 May 2025 23:58:34 +0300
Салат не спасет, если его портить: как сделать здоровое блюдо, а не набор пустых калорий
Салат не спасет, если его портить: как сделать здоровое блюдо, а не набор пустых калорий
Говорят, ешь салат и будешь худеть. Но не все салаты все равно полезны. Чтобы действительно извлечь пользу и для здоровья, и для фигуры, вот несколько уловок, как сделать свой салатик еще лучше....
nashe.znaj.ua
Wed, 21 May 2025 23:50:00 +0300
Атака БПЛА на Москву продолжается
Атака БПЛА на Москву продолжается
В России заявляют об атаке беспилотников на Москву. Вечером якобы было сбито три БПЛА, сообщил мэр российской столицы Сергей Собянин. По его словам, всего в течение дня над Московской областью ...
korrespondent.net
Wed, 21 May 2025 23:49:00 +0300
Майами Хит будет стремиться выменять суперзвезду НБА к новому сезону
Майами Хит будет стремиться выменять суперзвезду НБА к новому сезону
Руководство Майами рассматривает кандидатуры четырех звездных баскетболистов с намерением приобщить их к своему составу. Согласно информации Miami Herald, Майами Хит намерен подписать одног...
korrespondent.net
Wed, 21 May 2025 23:44:00 +0300
За сутки более 100 боев: в Генштабе назвали самые горячие направления фронта
За сутки более 100 боев: в Генштабе назвали самые горячие направления фронта
По состоянию на , мая, на фронте в течение суток произошло боевых столкновений. Наибольшее количество боев зафиксировано на Покровском направлении, но выделились и другие.Об этом сообщ...
www.rbc.ua
Wed, 21 May 2025 23:30:42 +0300
Война не закончится, пока гражданские расслабляются: военный сделал заявление, которое может стоить нам жизни
Война не закончится, пока гражданские расслабляются: военный сделал заявление, которое может стоить нам жизни
Война в Украине ndash это не только фронт и боевые действия, это и ответственность каждого из нас. Об этом открыто говорит военнослужащий Азова Владислав Жаворонок, имеющий непосредственный опы...
zk.znaj.ua
Wed, 21 May 2025 23:30:00 +0300
Украина разрывает соглашения с РФ и Беларусью: Кабмин подал законы в Раду
Украина разрывает соглашения с РФ и Беларусью: Кабмин подал законы в Раду
Кабинет министров Украины согласовал проекты законов, которые предусматривают прекращение действия, выход и денонсацию ряда международных соглашений с Россией, Беларусью и в рамках СНГКак сообщает...
www.rbc.ua
Wed, 21 May 2025 23:25:06 +0300
Бывший врач Белого дома спрогнозировал, сколько у Байдена осталось времени
Бывший врач Белого дома спрогнозировал, сколько у Байдена осталось времени
Прогнозы по раку простаты с метастазами, который выявили у экс-президента Джо Байдена, крайне неблагоприятные. Об этом рассказал бывший врач Белого дома Ронни Джексон, который работал с президента...
korrespondent.net
Wed, 21 May 2025 23:24:00 +0300
"Безобразное сооружение": власти Грузии разрешили снести знаменитые "кувшины" Рике в Тбилиси (фото)
"Безобразное сооружение": власти Грузии разрешили снести знаменитые "кувшины" Рике в Тбилиси (фото)
В Грузии правительство приняло решение о демонтаже так называемых кувшинов Рике или труб Фуксаса. Два стеклянных сооружения в форме кувшинов в парке Рике в Тбилиси, которые стали одними из самы...
focus.ua
Wed, 21 May 2025 23:23:53 +0300
додати ще новини больше новостей

Топ-новости

Почему Трамп давит на Киев, а не на Москву
Почему Трамп давит на Киев, а не на Москву
"Оставляют Путину то, к чему он стремился": СМИ узнали, почему Трамп не поддержал санкции против РФ
Российские оккупанты продвинулись в четырех областях Украины: карты ISW
Киллеров было несколько: Портнова пытались ликвидировать из-за возможности дискредитации РФ, — эксперт (видео)
"Порезали бензопилами": на Ривненщине селяне разрушили храм-памятник XVIII века (фото)
Стыда нет: Потап впервые прокомментировал скандальное интервью россиянину Дудю
Суд распорядился забрать дочь у самой старшей матери Украины: как живет девушка сейчас (видео)
На Закарпатье родители посадили на цепь и сожгли 10-летнего ребенка: как их наказал суд
Удары по полигонам: почему для трагедии достаточно одного дуболома в майорских погонах
Трамп не пошел на уступки Путину - Рубио
  • О нас
  • Контакты
  • Правила пользования
  • Приложения