• USD 27.7
  • EUR 32.8
  • GBP 36.4
Спецпроєкти

Чому штучний інтелект не захопить світ. Поки що...

ІЇ не може в повній мірі передбачити і зрозуміти те, що люди можуть обговорювати

Реклама на dsnews.ua

Професор лінгвістики в Лондонському університеті королеви Марії Девід Еджер в інтервʼю Serious Science розповів про особливості чат-ботів, розуміння і використання мов штучним інтелектом.

Кілька років тому було проведено дивний експеримент: група працівників Facebook створила двох чат-ботів, а потім змусила їх поспілкуватися один з одним. Однак чат-боти почали розвивати свій спосіб спілкування, що було дійсно дивно: вони почали з англійських слів, а ось граматика сильно змінилася і боти, фактично, речення англійською і не використовували. У якийсь момент розробники, вчені і Facebook подумали: «О, а що це? Це не схоже на англійську». Але що цікаво, чат-боти виконували те, чого від них жадали.

Тому вчені дозволили їм продовжити спілкування. Їм стало цікаво, чи зможуть вони створити якусь систему спілкування між чат-ботом і людиною. Їх метод полягав в тому, що вони, фактично, змусили зільйони людей обговорювати щось зовсім безглузде, на кшталт: «Мені потрібні три мʼячі, тобі дві коробки». І вони мали визначити способи задоволення потреб один одного за допомогою бесіди. Після задокументували отримані дані і передали їх чат-ботам, а потім запустили їх для розмови.

Перед чат-ботами стояло завдання виграти перемовини, домогтися найкращого результату. Але, як я вже говорив, чат-боти трохи були несповна розуму, і науковці сказали: «Це взагалі не схоже на англійську». І відключили програму. Преса тоді відреагувала досить кумедно – теж втратила здоровий глузд. Уявіть собі: «О, Боже, ці ШІ збираються захопити світ, вони створюють власну мову» і все в такому ж дусі. Хоча це було не зовсім те, що сталося. Тобто, було схоже, що вони створювали свій власний спосіб спілкування. Але вчених хвилювало не стільки те, що чат-боти збираються захопити весь світ: вони дійсно не просили чат-ботів оперувати англійською, вони хотіли від них успішної стратегії проведення перемовин. Потім вони все виправили і змусили чат-ботів знову говорити англійською.

Однак це був дуже цікавий експеримент, бо порушив два цікавих питання, одне з яких полягає в тому, а що станеться, якщо ШІ стануть настільки добрі в мові, що зможуть запросто спілкуватися один з одним, використовуючи цю мову. Чи не залишимося ми за бортом? Це питання, на яке я хочу відповісти.

Чи може бути таке, що ШІ на кшталт «Алекси» або «Сірі» будуть такіж вмілі у використанні мови, як і ми? І більше того, чи будуть вони використовувати її так само, як ми?

Моя відповідь така: вони можуть стати до біса вмілі, вони можуть стати справді так само вмілі, як ми або навіть краще (що б це не означало), але робитимуть це зовсім інакшим чином. Якщо ми поглянемо на історію відносин ШІ та мови, якщо ми згадаємо 70-і рр.., коли все починалося, творці ШІ насправді були зацікавлені в тому, щоб змусити ШІ спілкуватися з людьми. Ну, як компʼютер Star Trek.. Люди почали створювати різні системи, і найвідоміша з них отримали реально дивну назву — SHRDLU. Це система, яку створив Террі Виноград, і вона була дуже простою: ваш світ складається з кольорових блоків різних розмірів. Програма розуміла цей світ і ви могли сказати їй щось на кшталт: «Постав синій блок у червоний», а система відповіла б: «Я поставила синій блок у червоний блок», і так воно працювало.

Реклама на dsnews.ua

Щоб змусити цю систему працювати, Виноград використовував все, що знав про граматику англійської мови, і перетворив її на компʼютеризовані правила, а потім повʼязав ці правила зі значенням різних слів і словосполучень в цьому маленькому світі, а після використав це для створення програми. Це дійсно неймовірна робота. Ви могли змусити програму щось робити, і все це трохи скидалося на Star Trek, однак все ж це був просто світ блоків: користі мало, а блоки не великі.

Тому завдання полягало в тому, щоб взяти щось на зразок SHRDLU, розширити її і змусити працювати, як людину. Ось чого в 70-80-х люди намагалися добитися, що насправді дуже складно. Дійсно складно, оскільки ви ніколи не вгадайте, про що люди збираються говорити: вони обговорюють всілякі речі; речі, яких ви не бачите; речі, які є в їх уяві…Неймовірно важко досягти того, щоб компʼютерна програма могла це осягнути.

У 70-х і 80-х люди намагалися поліпшити граматику: правила для різних великих сфер. Фактично, вони почали її компʼютеризувати, за для чого змушували сотні аспірантів-лінгвістів вивчати усі тексти, а після вивчити їх мала компʼютерна програма, щоб вивчити вже весь текст і визначити правила. Ці правила потім використовувалися для створення іншої компʼютерної програми, яка мала зрозуміти саму мову. Ось чому здебільшого люди займалися у 80-х. І досі займаються, створюючи гігантські масиви аналітичних даних, відомих як синтаксичними деревами, все ще дуже і дуже корисні. Але вони ніколи не працювали все з тієї ж причини — ніколи не знатиме, що обговорюватимуть люди, і все сходило нанівець. Такі системи дуже крихкі, тому не працюють так, як працюють люди; або ж не такі гнучкі, як ми, люди.

Те, що відбувалося у 80-х, допомогло народженню нового штучного інтелекту, який поводиться інакше, і це, з чим ми живемо сьогодні. Якщо поглянути на «Алексу», Siri» або "Окей, Гугл" — використовується ця нова система, але ця система працює зовсім інашким чином. Чим ви не займаєтеся, так це тим, що не намагаєтеся зрозуміти правила цих систем. Замість цього ви працюєте над тим, щоб система була дуже великою і справлялася з аналізом всього, що до неї вкидають. Такі системи називаються нейронними мережами. Що ви, фактично, робите: даєте системі певні дані і повідомляєте, на який результат очікуєте; а вона починає міркувати і думати, намагаючись порівняти отримані дані з результатом, на який ви чекаєте. Коли все вийшло, у вас нова система — система, яка структурована таким чином, що дає вам бажаний результат на підставі наданих вами даних. І саме так сьогодні працюють більшість систем ШІ.

Вони справді чудові, і якщо ви скажете «Siri»: «Siri! Постав Рахманінова», тоді «Siri», швидше за все, ввімкне Рахманінова. Відбувається це здебільшого завдяки нейронним мережам. Що досить цікаво, оскільки те, що ШІ дійсно роблять, зовсім не схоже на дії людини.

Що відбувається, коли я кажу «Постав Рахманінова!»? Інформація надходить до мозку і ви просто приймаєте рішення піти і ввімкнути запис Рахманінова. Що робить система? Аналізує сказане вами за допомогою нейронних мереж, тобто відправляючи дані інтернетом на сервери Apple або Google в Ірландії або в Каліфорнії, де б вони не перебували; потім ви отримуєте всі ці дані і результат.

Дуже схоже на інтелект у планетарних масштабах, що є дійсно прекрасний.

Загалом, так вони обробляють всі ці звуки, і обробляють дуже добре; але їм також потрібно обробити граматику, зʼясувати, що ви маєте на увазі, кажучи: «Siri, постав мені щось з Рахманінова». І в цьому вони не дуже вмілі. Фактично, що вони роблять – просто роблять вірне припущення, виходячи з найбільш імовірного значення слів. На підставі ваших запитів у мережі. Яка ймовірність того, що поставлена задача буде означати: «Поставити Рахманінова». Все, що ви робите — це просто берете різні слова і змішуєте, як ніби це суп зі слів; і потім просто робите найкраще припущення. Що іноді називають стратегією «семантичний суп». Ви використовуєте ключові слова.

І не так, як чинять люди, але сьогодні зʼявилися нові системи. Зовсім недавно, кілька років тому, Google почав використовувати інший підхід, здебільшого Google Translate, але не всюди. В межах цього методу не просто використовуються ключові слова, щоб зрозуміти, що відбувається: використовується не тільки ймовірність того, що станеться, виходячи з наявної у вас купи слів, а визначається найбільш йомвірне, наступне або попереднє. Тому, якщо я скажу вам щось на кшталт: «Кіт сів на…», ви, мабуть, скажете «килимок», тому що ви чули це тисячу разів. Але якщо б я сказав: «Кіт сидів на хмарі», ось це вже більш незвично. Якщо я скажу: «Кіт сів на незалежність», ось це вже взагалі вкрай незвично, а якщо я скажу: «Кіт сів на на» (the cat sat on the the), ви такі: «Щоооо?!». Значення всіх цих речень англійською ви можете зрозуміти. Що стосується останньої фрази, ви можете припустити існування якоїсь великої книги, на обкладинці якої є слово «the» і кіт сів на «the». Цілком логічно. Але фраза «Кіт сів на на» зустрічається дійсно рідко, такого майже не буває, а от «Кіт сидів на килимку» — слово «килимок» зустрічається досить часто.

Тому ви можете враховувати те, як часто певні слова йдуть одне за іншим, щоб зробити вірне припущення щодо граматики речення. Це те, як працюють нові системи. Тому, якщо ви помітили, що Google Translate останніми роками став краще, це з тієї причини, що він звертає увагу на статистику того, яке слово йде за іншим. Сьогодні існують насправді складні типи таких систем, які називають нейронними мережами з «довготривалої короткочасною памʼяттю», і вони немов памʼятають те, що вже чули. Щодо мого прикладу «Кіт сидів на килимку»: вони будуть памʼятати про кота і вважати, що «килим» — це швидше за все місце для котів. Фактично у них є якась памʼять, яку можна використовувати для того, щоб граматика запрацювала.

Давайте розглянемо ще один приклад: «Лисиці по всьому моєму парнику плигають». Якщо подумати, то «лисиці» і «плигають» розташовані далеко одне від одного, а найближчим словом до «плигають» — це «парник». Однак ви не кажете «лисиці у моєму парнику плигає», а кажете «плигають», тому що мова йде про лисиць, а не про парники. Для нейронних мереж це завжди було серйозною проблемою. З новими методами вони можуть стати кращими, зможуть зрозуміти, яке дієслово найбільш узгоджується з іменником.

Завершуючи, хочу просто сказати: «Вау, це неймовірно, але, виявляється, нейронні мережі насправді чинять не так, як ми». Тому-то і проводилися дослідження: є такий науковець, Таль Лінзен, який проводив експерименти з цими складними нейронними мережами, ставлячись до них, як до людей, примушуючи виконувати завдання з використанням мови так само, як це роблять люди. І мережі, і люди припускаються помилок, але помилки, яких припускаються нейронні мережі, дійсно сильно відрізняються від помилок, яких припускаються люди. Тому, незважаючи на те, що їх продуктивність і поведінка дуже схожі, насправді те, що відбувається у них глибоко всередині, повністю відрізняється. Таким чином, маємо те, що хоча нейронні мережі, ті види ШІ, які у нас працюють сьогодні, можуть бути неперевершеними в обробці нашої мови, але те, як вони працюють, повністю відрізняється від того, як ми обробляємо мову.

    Реклама на dsnews.ua