Читать нас в Telegram

Вот вам анекдот: The greyhound stopped to get a hare cut.
Не ругайте за этот бородатый анекдот своего папу. Ругайте компьютеры.

Генератор каламбуров не кажется серьезной работой для исследователя искусственного интеллекта — это больше похоже на наброски за выходные, которые могли бы рассмешить коллег по лаборатории в понедельник. Но для Хё Хё, которая занималась этим проектом, будучи постдоком в Стэнфорде, шутки — это серьезная проблема машинного обучения. Цель Хё — создать искусственный интеллект (ИИ), с которым можно непринужденно поболтать, и разработать ботов, которые не только читают вслух новости или сообщают о надвигающейся грозе, но и умеют шутить или сочинять стихи. При такой постановке задачи становятся очевидны рамки, в которых существует типичный ИИ-проект.

Нейронные сети являются естественными имитаторами; они воспроизводят языковые шаблоны, просматривая огромное количество образцов. Если ваша цель — цельный текст, этот подход работает хорошо. Настолько хорошо, что последние достижения NLP спровоцировали этические дебаты о том, могут ли люди злоупотреблять ИИ для создания убедительных поддельных новостей. Но полученная проза так же суха, как газетный текст или статьи Википедии, которые обычно используются для обучения таких систем. Другими словами, нейронные сети остаются верны правилам до последнего, и это делает их шутки чудовищно несмешными. Хорошо продуманная шутка балансирует на грани логичности, не впадая в бессмыслицу, говорит Хё, и нейронным сетям просто не хватает человеческого восприятия, чтобы достичь этого баланса. Кроме того, весь смысл творчества в том, чтобы создавать новое.

«Даже если бы у нас был длинный список каламбуров, на которых система могла бы учиться, это уничтожило бы новизну». — говорит ученая.

Вместо этого Хё Хё и ее команда, в которую входили Наньюн Пэн и Перси Лян, попытались дать своему ИИ немного творческого остроумия, используя идеи из теории юмора. Любому, кто пробовал придумать каламбур, эта задача знакома. Чтобы каламбур сработал, он должен быть удивительным в локальном контексте («перестал терзать зайца» имеет мало смысла сам по себе), а также вызвать эффект «Эврика!», который связывал бы это вместе (в случае с нашей шуткой — благодаря слову «грейхаунд»). Хё и ее команда дали этому свойству каламбура довольно академичное название: «локально-глобальный принцип неожиданности». Чтобы нейронная сеть могла скаламбурить, ей предварительно дают пару омофонов: hair (волос)/hare(заяц). Затем она генерирует обычное предложение с первым омофоном, который затем заменяет на второй, что и вызывает эффект «неожиданнотсти». И чтобы выйти из тупика тарабарщины, слово, связанное с первым омофоном, меняется на слово, связанное со вторым омофоном, чтобы предложение снова обрело смысл.

Затем Хё устроила конкурс каламбуров, выставив ИИ против юмористов — оценивали каламбуры пользователи интернета. Результаты машин не были выдающимися, по крайней мере, по человеческим стандартам. Хотя система Хё создавала каламбуры, которые были намного смешнее, чем предыдущие попытки ИИ шутить, она побеждала людей только в 10 процентах случаев. Кроме того, каламбуры получились довольно примитивные (и время от времени безуспешно боролись с грамматикой):

That’s because negotiator got my car back to me in one peace. 
(Игра слов peace (мир) и piece (кусок), in one piece — одним махом).

Even from the outside, I could tell that he’d already lost some wait.
(Игра слов wait (ожидание) и weight (вес), to lose some weight — похудеть).

Well, gourmet did it, he thought, it’d butter be right.
(Игра слов butter (масло) и better (лучше)).

«Мы и близко не подошли к решению», — говорит Хё.

И все же Роджер Леви, директор Лаборатории вычислительной психолингвистики MIT, считает, что этот подход является многообещающим шагом к созданию ИИ с большей индивидуальностью. «Юмор — это внутренне сложный аспект изучения ума. Но это также важнейшая часть нашей человеческой сущности», — говорит он. Четыре года назад Леви описал подход, позволяющий вычислить, насколько каламбур смешной, — и в итоге эта работа легла в основу проекта Хё. Теоретически концепция «локально-глобального принципа неожиданности» имела смысл, но у него еще не было данных, чтобы доказать это.

«Здорово, что на практике все получилось», — говорит он.

В более широком смысле исследование юмора подчеркивает необходимость привнести больше человеческого интеллекта в нейронные сети, говорит Леви. «Неожиданность» — важная часть его исследований. У людей эту реакцию можно наблюдать, когда они сталкиваются с новой или неожиданной информацией (и она может быть измерена с помощью айтрекинга), а у машин такую реакцию можно отследить с помощью вероятностных моделей типа цепей Маркова (чем меньше вероятность возникновения слова в этом контексте, тем более оно удивительно).

Технологии делают «неожиданность» удобным мерилом сравнения путей решения проблем с помощью языка, потому что человек и машина очень по-разному подходят к таким задачам. Леви устроил своим нейросетям несколько психолингвистических тестов, созданных для изучения реакции на двусмысленность в языке, и обнаружил, что машины, конечно, справлялись, но использовали для этого совершенно не человеческую логику. Если мы сможем научить ИИ мыслить теми же путями, что и люди, мы получим более человекоподобного бота.

В то же время Леви говорит, что Хё надеется применить свой каламбурный подход к более сложным творческим задачам, например, рассказыванию историй. Идея состоит в том, чтобы позволить нейронной сети делать то, что она умеет, а затем отредактировать результат с помощью человеческого интеллекта. Так, нейронную сеть можно обучить генерировать скучную цепочку идеально связных предложений, а затем превратить эти данные в творческий рассказ, основанный на теориях повествования.

«Цель заключается в том, чтобы сделать истории более творческими и интересными, — говорит Хё. — Я хочу, чтобы ИИ писал истории о вещах, о которых люди и не подумают писать.»


Источники:

  1. Gregory Barber. THE COMEDIAN IS IN THE MACHINE. AI IS NOW LEARNING PUNS
  2. He He, Author of the project
  3. Roger Levy
  4. A Computational Model of Linguistic Humor in Puns