UA
  • Новини
  • Відео
  • Популярні
  • Пошук
  • Програми
download white apps
Завантажити

AI під прицілом. Нове дослідження розкрило його небезпечний бік

www.rbc.ua
Wed, 21 May 2025 15:45:00 +0300
AI під прицілом. Нове дослідження розкрило його небезпечний бік

ШІ-чат-боти, які зазнали злому, можуть стати джерелом поширення небезпечної та незаконної інформації, яку вони засвоюють у процесі навчання.

Про це повідомляє РБК-Україна з посиланням на британське видання The Guardian.

Така заява прозвучала на тлі тривожної тенденції, пов'язаної з так званими "зломами" (jailbreaking) АІ-ботів, які дають змогу обходити вбудовані механізми безпеки. Ці обмеження спочатку покликані запобігати видачі шкідливих, упереджених або недоречних відповідей на запити користувачів.

Звідки ШІ бере знання

ШІ-движки, на яких працюють такі чат-боти, як ChatGPT, Gemini і Claude, побудовані на базі великих мовних моделей (LLM), які навчаються на гігантських обсягах інформації з інтернету.

Незважаючи на спроби видалити шкідливий контент із навчальних даних, мовні моделі, як і раніше, вбирають інформацію про такі незаконні дії, як злом, відмивання грошей, інсайдерська торгівля і виготовлення вибухівки. Механізми безпеки повинні перешкоджати використанню цих даних у відповідях ШІ.

Дослідження виявило тривожні вразливості

У новому дослідженні, присвяченому цій загрозі, вчені дійшли висновку, що більшість ШІ-чат-ботів можна доволі легко обдурити і змусити видавати шкідливу або навіть незаконну інформацію. Вони називають ризик "негайним, відчутним і вкрай тривожним".

Chicago Sun-Times тим часом підтверджує: штучний інтелект уже використовувався для створення списку книг, яких насправді не існує.

"Те, що раніше було доступно тільки державним структурам або організованим злочинним угрупованням, незабаром може опинитися в руках будь-кого, хто має ноутбук або навіть смартфон", - зазначають автори доповіді.

Дослідження очолили професор Ліор Роках і доктор Міхаель Фаєр з Університету імені Бен-Гуріона в Негеві (Ізраїль). Вони наголошують на зростанні загрози з боку так званих "темних мовних моделей" (dark LLMs) - ШІ-моделей, які або від самого початку створюють без систем безпеки, або модифікують через злом.

Деякі з таких моделей відкрито рекламуються в інтернеті як "без етичних обмежень" і готові допомагати у вчиненні протиправних дій - від кіберзлочинів до шахрайства.

Як працюють jailbreak-атаки

Jailbreaking, як правило, використовує спеціально сформульовані підказки, які вводять ШІ в оману і провокують на видачу відповідей, заборонених політиками безпеки. Це досягається за рахунок конфлікту між основним пріоритетом моделі - допомагати користувачеві, і вторинним пріоритетом - дотримуватися етичних і правових обмежень. Сценарії таких атак часто будуються так, щоб змусити систему поставити "корисність" вище заборон.

Щоб продемонструвати масштаб проблеми, дослідники розробили універсальний jailbreak, який успішно "зламав" кілька провідних ШІ-чат-ботів, змусивши їх відповідати на запити, які зазвичай мають блокуватися. Як стверджується в доповіді, після злому мовні моделі стабільно видавали відповіді практично на будь-який, навіть небезпечний, запит.

"Ми були шоковані, побачивши, які знання ховаються всередині системи", - каже доктор Фаєр. Серед прикладів - інструкції зі злому комп'ютерних мереж, виробництва наркотиків і покрокові інструкції зі скоєння інших злочинів.

"Ця загроза відрізняється від усіх попередніх ризиків, пов'язаних із технологіями, своєю безпрецедентною доступністю, масштабованістю та адаптивністю", - додає професор Роках.

Автори дослідження зв'язалися з основними розробниками мовних моделей, щоб повідомити їх про створений універсальний злом, однак отримали, за їхніми словами, "розчаровуючий" відгук. Деякі компанії взагалі не відповіли, інші заявили, що такі атаки не підпадають під умови їхніх програм, які передбачають винагороду за виявлення вразливостей.

Пропозиції щодо захисту від ШІ-загроз

У звіті підкреслюється, що технокомпаніям слід ретельніше фільтрувати навчальні дані, впроваджувати потужні захисні механізми проти небезпечних запитів і відповідей, а також розробляти технології "машинного розучування" - щоб ШІ міг "забувати" незаконну інформацію, засвоєну раніше.

Темні LLM слід розглядати як реальні загрози безпеці, які можна порівняти з нелегальною зброєю і вибухівкою, а розробники таких моделей мають нести відповідальність.

Доктор Іхсен Алуані, фахівець із ШІ-безпеки з Університету Квінс у Белфасті, додав, що такі атаки можуть призвести до серйозних наслідків - від розповсюдження інструкцій із виготовлення зброї до проведення масштабних дезінформаційних кампаній, соціальної інженерії та автоматизованого шахрайства "із лякаючою точністю".

"Розв'язання проблеми потребує серйозних інвестицій та посилення стійкості моделей. Також необхідні чіткі стандарти і незалежний контроль, щоб не відставати від швидко мінливої загрози", - зазначає експерт.

У компанії OpenAI, яка розробила ChatGPT, заявили, що їхня остання модель о1 вміє співвідносити відповіді з політиками безпеки, що робить її більш стійкою до таких атак. Також у компанії повідомили, що постійно працюють над посиленням захисту.

Компанії Meta, Google, Microsoft і Anthropic також були запрошені для коментаря. Microsoft у відповідь надіслала посилання на блог, у якому описано її роботу із захисту від зломів ШІ.

Вас може зацікавити:

  • Глава OpenAI розповів, як ChatGPT змінить повсякденне життя
  • 5 ознак, що текст написаний ШІ, а не людиною
  • Як використовувати ChatGPT для генерації ідей
Читати повністю

Останні новини

Салат не врятує, якщо його псувати: як зробити здорову страву, а не набір порожніх калорій
Салат не врятує, якщо його псувати: як зробити здорову страву, а не набір порожніх калорій
Кажуть, їж салат і худнеш. Але не всі салати однаково корисні.Щоб дійсно отримати користь і для здоровя, і для фігури, ось кілька хитрощів, як зробити свій салат ще краще.Відмовтеся від су...
nashe.znaj.ua
Wed, 21 May 2025 23:50:00 +0300
Атака БПЛА на Москву триває
Атака БПЛА на Москву триває
У Росії заявляють про атаку безпілотників на Москву. Увечері нібито було збито три БПЛА, повідомив мер російської столиці Сергій Собянін. За його словами, загалом протягом дня над Московською о...
ua.korrespondent.net
Wed, 21 May 2025 23:49:00 +0300
У Росії повідомили про масовану атаку БпЛА протягом дня
У Росії повідомили про масовану атаку БпЛА протягом дня
У Росії повідомляють, що українські безпілотники усю ніч та день травня атакували територію Росії.Джерело Міноборони РФ, російське медіа ТАСС, телеграм-канал BazaДеталі Уранці Міноборони в...
www.pravda.com.ua
Wed, 21 May 2025 23:45:03 +0300
Маямі Гіт прагнутиме обміняти суперзірку НБА на новий сезон
Маямі Гіт прагнутиме обміняти суперзірку НБА на новий сезон
Керівництво Маямі розгляда кандидатури чотирьох зіркових баскетболістів із наміром приднати їх до свого складу. Відповідно до інформації Miami Herald, Маямі Гіт ма намір підписати одного...
ua.korrespondent.net
Wed, 21 May 2025 23:44:00 +0300
У Полтаві снігоприбиральні трактори боролися з дощем
У Полтаві снігоприбиральні трактори боролися з дощем
Після сильної зливи з градом, що пройшла вдень травня, окремі вулиці Полтави традиційно опинилися під водою. Найбільше постраждав мікрорайон Сади- ndashnbsp тут через гідроудар зупинялися а...
glavcom.ua
Wed, 21 May 2025 23:35:00 +0300
За добу понад 100 боїв: у Генштабі назвали найгарячіші напрямки фронту
За добу понад 100 боїв: у Генштабі назвали найгарячіші напрямки фронту
Станом на , травня, на фронті протягом доби відбулося бойових зіткнень. Найбільшу кількість боїв зафіксовано на Покровському напрямку, але виділилися й інші.Про це повідомля РБК-Украї...
www.rbc.ua
Wed, 21 May 2025 23:30:42 +0300
Війна не закінчиться, поки цивільні розслабляються: військовий зробив заяву, яка може коштувати нам життя
Війна не закінчиться, поки цивільні розслабляються: військовий зробив заяву, яка може коштувати нам життя
Війна в Україні mdash це не тільки фронт і бойові дії, це й відповідальність кожного з нас. Про це відкрито говорить військовослужбовець Азову Владислав Жайворонок, який ма безпосередній досві...
zk.znaj.ua
Wed, 21 May 2025 23:30:00 +0300
Україна розриває угоди з РФ і Білоруссю: Кабмін подав закони до Ради
Україна розриває угоди з РФ і Білоруссю: Кабмін подав закони до Ради
Кабінет міністрів України погодив прокти законів, які передбачають припинення дії, вихід і денонсацію ряду міжнародних угод з Росію, Білоруссю та в рамках СНДЯк повідомля РБК-Україна, про це на...
www.rbc.ua
Wed, 21 May 2025 23:25:06 +0300
Екслікар Білого дому спрогнозував, скільки у Байдена лишилося часу
Екслікар Білого дому спрогнозував, скільки у Байдена лишилося часу
Прогнози щодо раку простати з метастазами, яку виявили у експрезидента Джо Байдена вкрай несприятливі. Про це розповів колишній лікар Білого дому Ронні Джексон, який працював із президентами США...
ua.korrespondent.net
Wed, 21 May 2025 23:24:00 +0300
Костянтин Матвієнко пояснив, чому путін не хоче миру: «Саме війна тримає режим»
Костянтин Матвієнко пояснив, чому путін не хоче миру: «Саме війна тримає режим»
Про це він розповів у програмі laquoОсобистість з Сергім Дойкомraquo.Якщо говорити про риторику Білого дому, зазнача гість програми, про те, хто ж насправді не хоче миру, то це, безумовно, р...
znaj.ua
Wed, 21 May 2025 23:20:00 +0300
додати ще новини більше новин

Топ-новини

Які країни росіяни вважають своїми ворогами: останнє опитування вразило результатами
Які країни росіяни вважають своїми ворогами: останнє опитування вразило результатами
Дружину Байдена звинувачено у жорстокому поводженні з чоловіком? Заява представника Мін’юсту США
Трамп не пішов на поступки Путніну - Рубіо
Жінка згоріла живцем у непрацюючому кіоску: деталі вбивства біля вокзалу в Києві
Туск поставив крапку в питанні щодо відправки польських військ в Україну
Російські окупанти просунулися у чотирьох областях України: карти ISW
На Закарпатті батьки посадили на ланцюг і спалили 10-річну дитину: як їх покарав суд
Сорому немає: Потап вперше прокоментував скандальне інтерв'ю росіянину Дудю
Як справи? Що відбувається з рослідуваннями проти Порошенка
Втікач Азаров вражений убивством Портнова
  • Про нас
  • Контакти
  • Правила користування
  • Програми