В начале 1970-х годов инженеры определились с проблемами, которые в ближайшие десятилетия нужно было решить на пути создания умных машин. Перечень был составлен в 1972 году международной группой, сложившейся вокруг Фирбушпоинтовского (местечко Firbush Point недалеко от Эдинбурга) семинара по проблемам искусственного интеллекта. В англоязычных источниках следы этого семинара можно найти по словосочетанию Firbush Robot Group.
Это был план из 12 пунктов. Каждый отражал большую и сложную задачу. Про большинство из них в 1970-е годы не было ясного представления, каким путем искать решение.
Мечты среди зимы
Чтобы лучше почувствовать контекст, нужно ещё вспомнить, что 1974–1980 годы — это так называемая «зима искусственного интеллекта». Эйфория, последовавшая за изобретением компьютеров, уже прошла. Стало ясно, что к быстрому прорыву в светлое будущее технологии не приведут, а как справляться с ограничениями компьютерной техники в решении самых насущных проблем, было непонятно.
Все эти задачи казались едва ли разрешимыми в обозримом будущем. Взять эти планки с наскока надежды уже не было.
Сейчас, сорок пять лет спустя, мы можем оценить, что из казавшегося тогда важным и сложным, было решено, а что так и осталось актуальной задачей разработки искусственного интеллекта.
- Создание шахматных программ.
- Машинное творчество в области музыки, поэзии, живописи.
- Создание программ, выдерживающих тест Тьюринга.
- Машинное доказательство теорем.
- Создание программ индуктивного вывода.
- Создание вопросно-ответных систем (в том числе систем автоматического реферирования).
- Автоматический перевод.
- Распознавание и синтез речи.
- Автоматическая проверка правильности программ.
- Автоматическое вождение автомобилей.
- Создание роботов-сборщиков, роботов-строителей.
- Создание робота-планетохода для автономной работы в новых условиях.
(Зарипов Р. Х. Машинный поиск вариантов при моделировании творческого процесса. М., 1983. С. 11)
Посмотрим на этот список внимательнее.
1. Создание шахматных программ
К 1970-м годам шахматные программы уже существовали. Не слишком большой диковинкой они были даже в 1960-х. Видимо, этот пункт нужно трактовать иначе: «создание программ, которые хорошо (лучше человека) играют в шахматы».
В самом деле, в ту эпоху шахматные программы с сухим счетом проигрывали опытным шахматистам, они ловились на простом принципе: оценивая позицию на доске, компьютеры ни в какую не хотели жертвовать фигурами, тем самым сильно ограничивая свои возможности в игре. Шахматист-человек был готов на жертвы материалом, придумывал остроумные комбинации и побеждал.
Со временем росла вычислительная мощность компьютеров, они с помощью так называемой «грубой силы» просчитывали все большее число вариантов и находили выигрышный. К середине 1990-х годов силы человека и супер быстрого компьютера сравнялись: Deep Blue от IBM обыграл чемпиона мира среди людей Гарри Каспарова. Это была не вполне чистая победа, силы были скорее равны. Но это не так важно, потому что через несколько лет шахматные программы всё равно сделали мощный рывок и оставили человека далеко позади.
В середине 2000-х даже чемпион мира не мог надеяться на положительный для себя исход, садясь за доску против компьютера.
Рывок был сделан уже не за счет грубой силы, а благодаря хитрым эвристикам оценки позиции, которые позволяли избежать лишних подсчетов: так чемпионов мира стали обыгрывать уже не суперкомпьютеры, а обычные десктопы.
Катарсис случился, когда на сцену вышли нейросети. Нейронная AlphaZero, применяя нетривиальные игровые стратегии, с хорошим запасом обыграла программу предшествующей парадигмы.
Так что здесь всё понятно. Задача решена настолько хорошо, что служит фактически образцовой, когда мы говорим об успехах искусственного интеллекта.
2. Машинное творчество в области музыки, поэзии, живописи
Формально говоря — да. Фактически говоря — нет.
Компьютеры умеют рисовать картины, сочинять стихи и музыку. Ради справедливости нужно сказать, что это так было уже в 1970-х годах. Разница с тем временем касается в первую очередь стоимости (а значит и доступности) периферических устройств. 45 лет назад можно было написать программу, которая создаст мелодию, трудно было эту мелодию воспроизвести (это сейчас динамики/колонки для нас привычны, тогда было не так); компьютер мог написать картину, трудно было эту картину перенести из памяти в физический мир: принтер был слишком дорогим.
Сейчас с периферией проблем нет, а часто она даже не нужна: общедоступность устройств сделала мир таким, что распечатывать созданное компьютером изображение не нужно, легче посмотреть его на экране смартфона.
Но главное не в этом. Если речь идет про настоящее творчество, сопоставимое с творчеством поэтов и художников, то тут искусственному интеллекту похвастаться нечем. Что стихи, что картины в исполнении компьютера — это компиляции, воспроизведение, косплей. Придумывать новое микросхемы пока не в состоянии.
Хотя в наше время оказались востребованы именно имитации, и компьютер в этом преуспел. Время и устройство нашли друг друга. Инженерам достаточно того, что стихи рифмуются, а музыка похожа на то, что писал в свое время Бах. Вряд ли кто-то заинтересован в принципиальном прогрессе в этой области. Так что засчитаем искусственному интеллекту балл.
3. Создание программ, выдерживающих тест Тьюринга
Снова и да и нет.
С одной стороны, чат-боты с того времени сделали огромный шаг вперед. В 1970-е годы «компьютеры, которые общаются с человеком» на практике означало «компьютеры, которые в своей памяти держат все варианты диалоговых ситуаций». То есть всего-то навсего для хорошей программы-болталки нужно было вручную описать все возможные вопросы и все возможные ответы на них. При минимальном погружении в тему становится очевидно, что это просто невозможно: число возможных речевых ситуаций бесконечно.
Теперь так никто не делает. Нашёлся другой путь: глубокое обучение. Нейросеть умеет находить в предоставленных ей данных скрытые закономерности, которые позволяют выбирать нужный вариант при ответе на вопрос человека. Существуют такие программы, которые действительно умеют имитировать общение с человеком, поддерживать осмысленный диалог на протяжении обмена несколькими репликами. Всё это стоит занести разработчикам искусственного интеллекта в актив.
В то же время все сообщения о том, что тест Тьюринга будто бы пройден, просто кликбейт. В чистом виде тест не пройден. Не говоря уже о том, что если бы даже он был пройден, это еще не означало бы какого-то принципиального прорыва в построении интеллектуальных систем. Это была бы еще одна имитация, на этот раз на уровне общения.
4. Машинное доказательство теорем
Речь, конечно, о математических теоремах.
В целом доказательство остается уделом человека, а если с подобной задачей справляется компьютер, то задачу переквалифицируют, и говорят уже не о доказательстве, а о вычислимости. Дескать, компьютер сам ничего доказать не может, но если вдруг он справляется с теоремой, то получается, что результат можно было просто посчитать. Доказательство в отличие от подсчета — сложная логическая операция.
Но некоторого успеха на этом пути разработчики искусственного интеллекта добились. Их достижения используются для контроля качества аппаратного и программного обеспечения.
5. Создание программ индуктивного вывода
Индукция — это возможность делать обобщения на основе частных фактов. Но в сфере искусственного интеллекта этим термином обозначается несколько иное: смогут ли программы сами строить решение на основе человеческого описания конечной задачи? Когда это случится, профессия программиста отойдет в прошлое, как профессия лифтера. Сейчас каждый сам может нажать кнопку нужного этажа в кабине. Также в будущем человек сам сможет вызвать нужную программу, описав то, что ему хочется получить в результате.
Разработки в этом направлении ведутся (перспективно смотрится генерация html-кода по описанию нужного элемента с помощью сети-трансформера GPT-3), но пока программисты все еще существуют.
6. Создание вопросно-ответных систем (в том числе систем автоматического реферирования)
Первая мысль, когда мы слышим про вопросно-ответные системы, что речь идёт о тех же чат-ботах, то есть о программах, с которыми можно пообщаться, задавая им вопросы. На самом деле, нет. Под вопросно-ответными системами понимаются интерфейсы к базам знаний, то есть такие программы, которым можно задать вопрос о том, где и когда случилось то или иное событие, кем был некоторый человек, чем стало для него открытие Америки или мировой финансовый кризис, и получить ответ на этот вопрос. Не обязательно в виде реплики, похожей на человеческую речь, но обязательно — ответ должен быть правильным.
Компьютер, давший ответ на вопрос о жизни, вселенной и всяком таком, из книги Дугласа Адамса был классической вопросно-ответной системой.
И да, такие системы созданы и иногда даже неплохо работают, выдавая ответы быстрее и правильнее, чем если бы на их месте был человек. Лучше всего это продемонстрировала победа суперкомпьютера Watson на англоязычном аналоге нашей «Своей игры» телевикторине «Jeopardy!»
7. Автоматический перевод
Тут всё понятно. Машинный перевод стал одной из тех областей, где несомненен не просто прогресс, а настоящий прорыв. Смена принципов, на которых базировалась область (раньше были словари, теперь используются нейросети), привела к тому, что для ряда жанров качество машинного перевода перестало существенно отличаться от качества перевода, сделанного человеком. Конечно, не всё идеально, но с тем, что собой представляли компьютерные переводчики, основанные на словарно-правиловых методах 1990-х годов, не сравнить. Думается, в 1970-х специалисты даже не рассчитывали, что качество машинного перевода станет таким высоким за такой короткий скачок в несколько лет.
8. Распознавание и синтез речи
Еще одна область, в которой нейросети помогли вывести технологии на приемлемый уровень. Пользователи голосового ввода в экосистемах Яндекса или Google, покупатели умных колонок от Amazon, знают, что машины научились весьма недурно понимать человеческую речь. Вернее, не понимать, а распознавать, конечно. Если с «пониманием» в философском смысле у компьютеров всё по-прежнему неважно, то уж различить, какие именно слова произнес человек, машина сможет. Этот прорыв привел к расцвету голосовых интерфейсов.
Есть отдельные проблемы: например, натренированная на литературном языке система может не понять речь диалектную. Эту проблему иллюстрирует смешное видео про лифт с голосовым управлением, где пассажиры тщетно пытаются сказать, что им нужно на 11-й этаж. Система рассчитана на англичан, а незадачливыми пассажирами оказываются носители шотландского акцента:
Синтез речи — задача в целом более простая (хотя и не без подводных камней). Распознавать нужно то, как говорят разные люди с их индивидуальными особенностями, а говорить можно так, как тебе удобно. Правда, соблюдая при этом интонационные конструкции и правильно расставляя ударения. Нейросети преуспели и в этом. Та же Алиса от Яндекса общается с нами вполне человеческим голосом.
9. Автоматическая проверка правильности программ
В зависимости от наших аппетитов, можно задать здесь более или менее высокую планку, которую искусственному интеллекту нужно было бы взять. Наверное, стоит говорить не просто о том, что компьютер сам обнаружит ошибку в коде, которая не позволит программе исполниться (в этом нет ничего интеллектуального), а о том, что искусственный интеллект сам поймет, что программа работает, но не делает того, что нужно, из-за незамеченной ошибки программиста. Такие ошибки найти сложнее всего. Скажем, в каком-то месте нужно делить на 3, а программа делит на 4. Пока по абсурдным результатам все поймут, что что-то здесь не так, может пройти много времени.
Ещё лучше было бы, если бы компьютер не просто находил такие сложные ошибки, но и исправлял их.
Но всё это пока фантастика. Пока компьютер умеет находить только простые случаи: «видит», что в нужном месте не поставлена запятая, в другом месте кода пропущен пробел. Исправлять всё это приходится человеку. Но и такие задачи в 1970-х годах казались существенным шагом вперед.
10. Автоматическое вождение автомобилей.
В этой области всё очень хорошо. Естественно, мы не успели отказаться от людей-водителей, но успехи в создании беспилотных автомобилей таковы, что их вхождение в наш быт — дело ближайшего будущего.
Есть ряд проблем в распознавании необычных объектов на дороге, в принятии решений в нетривиальных ситуациях, но в целом машины под управлением автопилотов многократно безопаснее и рациональнее для дорожной ситуации, чем то, что мы имеем сейчас. Эти соображения рано или поздно сыграют свою роль, а программное обеспечение для таких автомобилей активно создается по всему миру, и уже готово для тестирования на дорогах общего пользования.
11.Создание роботов-сборщиков, роботов-строителей
Если роботы смогут сами собирать других роботов, то колонизация других планет станет гораздо проще. Люди смогут прилететь на Марс, где для них уже будет к этому моменту построено жилье и развернуты коммуникации. Переселение на другое небесное тело будет напоминать переезд из одного города в другой, с готовой инфраструктурой и сферой услуг. Такого никогда не было в человеческой истории. Колонистам всегда прежде всего приходилось строить для себя убежище. В теории теперь его могут построить роботы еще до прибытия людей. Но для этого роботов должно быть много. Разумнее всего было бы послать на другую планету ограниченное число механизмов, которые на месте собрали бы других роботов, пока их не набралось бы достаточно для строительства крупных объектов инфраструктуры, предназначенных для людей.
Сценарий кажется разумным и понятным, но он до сих пор не реализован. Значит, тут не всё так просто.
Действительно, слишком много внешних обстоятельств могут повлиять на процесс производства или строительства, и научить роботов справляться с ними оказывается гораздо сложнее, чем научить водить автомобиль. Машина движется по дорогам, для которых определены правила, выработаны знаки, сигналы, исчислимы ситуации, в которые попадает авто. Со строительством всё намного-намного сложнее.
Непросто и со сборкой. Уже много десятилетий примитивные роботизированные механизмы используются в конвейерных производствах. В новеллизации первого фильма о Терминаторе как раз специально обращается внимание на то, что финальная сцена этой истории происходит на заводе посреди примитивных, но всё же предков машины для убийств из будущего.
И тем не менее, без людей в цеху сейчас не обойтись. Производство смартфонов сосредоточено в странах с дешёвой рабочей силой, а не с дешёвыми роботами.
Пока задача не решена. Но если будет решена, то она может сделать более дешевым и доступным жилье и на Земле, а не в далёком космосе.
12. Создание робота-планетохода для автономной работы в новых условиях
Проблема этой задачи в принципиальной непредсказуемости обстоятельств, в которые попадет робот в незнакомой и недружелюбной среде. Если на земле еще можно худо-бедно заложить в электронную систему проблемы, с которыми может столкнуться автономный механизм, можно обучить его на тренировочных данных, можно собрать команду экспертов, хорошо знающих про подводные камни и обычные трудности, то на другой планете всё ново и непредвиденно. Это значит, что робот должен принимать решения самостоятельно почти как человек, ориентируясь не на существующую базу знаний, а на что-то вроде интуиции. Интуицию для искусственного интеллекта создать пока не удалось.
Кстати, действующие на Марсе роверы роботами в собственном смысле не являются. Каждый шаг им задаёт оператор на Земле.
И что сбылось?
Подведем итог, вычеркнув те пункты, в которых проблемы искусственного интеллекта оказались решены.
Создание шахматных программ.Машинное творчество в области музыки, поэзии, живописи.- Создание программ, выдерживающих тест Тьюринга.
- Машинное доказательство теорем.
- Создание программ индуктивного вывода.
Создание вопросно-ответных систем (в том числе систем автоматического реферирования).Автоматический перевод.Распознавание и синтез речи.- Автоматическая проверка правильности программ.
Автоматическое вождение автомобилей.- Создание роботов-сборщиков, роботов-строителей.
- Создание робота-планетохода для автономной работы в новых условиях.
Итого: 6 пунктов из 12, ровно половина. Есть, над чем работать, но есть и чему порадоваться.