Apple Siri — тот самый искусственный интеллект?

Темы: Apple, Siri, AI, inoblog, Jon Stokes, wired,

Смартфон iPhone 4S недавно попал в руки общественности, и пользователи столкнулись с кое-чем необычным: новым персональным голосовым помощником Siri от Apple.

Например, спросите Siri, куда вы можете окунуться, и он выдаст вам целый список бассейнов, источников и болот. Спросите его «Сколько дров бросил бы сурок, если бы сурок мог бросать дрова?» (Прим. ред. — известная английская скороговорка), и он выдаст список из сорока двух вариантов, уточнив у вас при этом, африканский это сурок или европейский.

Джошуа Топольский (Joshua Topolsky) в своей статье на This Is My Next опубликовал некоторые забавные ответы Siri, которые собираются в микроблоге Shit That Siri Says в рамках сервиса Tumblr, и эта коллекция постоянно растёт.

Ответы Siri остроумны, но они не особо отличаются от «пасхальных яиц», которые программисты десятками внедряют в код приложений. Или отличаются? Я со всей серьёзностью соглашусь, что система Siri может развиваться, и Apple придёт к созданию настоящего искусственного интеллекта, как минимум, в некотором смысле. Siri это совсем другой чат-бот, не похожий на другие, с использованием облачных технологий, и эта комбинация «облака» с аналитикой в режиме реального времени и концепцией непрерывного развития является его отличительной чертой.

 

Источники разума: алгоритмы или данные?

Изначально, часть модели взаимодействия Siri, которая формировала ответы на шутки, оскорбления и другие случайные вопросы, предназначенные для изучения реакции системы, выводила его в категорию маститых чат-ботов. Развитие чат-бота началось с «Элизы» (ELIZA), которая была простой интерактивной программой, воспринимающей фразы от пользователя на английском языке и формирующей на их основе вопросы. «Элиза» изначально задумывалась как пародия психотерапии. Разговор пользователя с «Элизой» выглядел примерно так: 

Пользователь: Мне грустно

Элиза: Почемы вы грустите?

Пользователь: Потому что я совершил ошибку

Элиза: Почему вы совершили ошибку?

Пользователь: У меня грипп

Элиза: Возможно, вам нужно обратиться к врачу. Я всего лишь психотерапевт

Пользователь: Habla Espanol? (прим. – вы говорите по-испански?)

Элиза: Вы говорите какую-то чушь.

Такой чат-бот, как «Элиза», использует совокупность технологии обработки естественного языка (NLP — natural language processing) и готовых ответов для распознавания информации ввода и преобразования её в осмысленный и грамматически правильный ответ. Проблема в изобретении хорошего чат-бота кроется как раз в NLP-блоке. Например, в вышеприведённой диалоговой ситуации программа должна знать, что глагол make (делать) является формой настоящего времени made (сделал), таким образом, она может преобразовать предложение «Because I made a mistake» в «Why did you make a mistake?». Такое алгоритмическое знание о том, как скомбинировать ограниченное количество существительных, глаголов и модификаторов в синтаксически правильное предложение, является трудоёмким для преобразования в программный код.  

Таким образом, искусство и наука кодирования чат-ботов со времен начала развития операционной системы UNIX заключается в разработке и реализации набора NLP-алгоритмов, которые способны воспринять конечный словарный набор и конвертировать его в понятные для человека предложения. Лёгкая часть задачи, по крайне мере, с точки зрения компьютерных наук, состоит в формировании набора готовых ответов, которые чат-бот использует в специфических случаях, например, когда он не знает, что ответить.

Например, рассмотрим выше указанный диалог. Для сопоставления шаблона «У меня грипп» строке ответа «Возможно, вам нужно обратиться к врачу. Я всего лишь психотерапевт» кодирование может оказаться очень сложным. Такое сопоставления строки строке не требует какого-либо NLP-алгоритма, то есть в данном случае искусственный интеллект не задействуется в широком смысле этого слова. В конечном счете, успех метода подбора наиболее удачного из заранее сформированных ответов не зависит от заложенного в алгоритм интеллекта, а только от неутомимости программиста, который выдумывает возможные пары вопросов/ответов и внедряет их в код приложения. Чем больше таких пар придумает программист, тем более интеллектуальным будет казаться чат-бот, так как пользователю будет интересно выискивать новые «пасхальные яйца» при изучении разговорного пространства бота. 

Взрослый пользователь быстро исчерпает потенциал чат-бота, словарный запас которого составляет 100 или даже 1000 закодированных пар. А как насчёт 100 000 пар? А одного миллиона? Вот здесь уже интересной становится возможность использования облачных технологий. 

 

Много данных, много умных

В традиционном мире чат-ботов с готовыми внесёнными в код ответами пользователи вынуждены ждать программных обновлений для получения доступа к новым парам вопросов/ответов. Но, так как Siri является облачным приложением, инженеры Apple могут непрерывно добавлять эти пары в код. Каждый раз, когда сотрудник Apple придумывает более изощрённую пару, он тотчас же может её добавить в Siri, и сразу же миллионы пользователей получат доступ к обновлению. Также программисты могут наблюдать за новыми поступающими запросами, которые популярны, анализировать их и добавлять готовые ответы в код Siri.

Таким образом, можно ожидать, что коллективные усилия сотен сотрудников Apple и десятков или сотен миллионов пользователей приведут к созданию такой огромной базы, которая обеспечит взрослому человеку ощущение интеллектуального разговора. 

Стоит отметить, что построение искусственного интеллекта с помощью наложения «пасхальных яиц» одного на другое в облаке не является прерогативой Apple Siri. Например, когда Google делает то же самое — показывает пятидневный прогноз погоды в ответ на поисковый запрос о местной погоде, или выдаёт расписание киносеансов при поиске фильмов в интернете, — это уже называется особенной функцией, а не «пасхальным яйцом». При этом используется тот же базовый принцип «делать интеллектуальное предложение соответственно пользовательскому вводу». Действительно, Google уже долгое время идёт по этому пути, поэтому я думаю, что вскоре компания сможет представить нечто похожее на Siri для платформы Android. Они владеют технологией распознавания речи, большую базу данных слов и выражений, опыт NLP-разработок, чего достаточно для создания достойного конкурента Siri. И, кажется, Google создаст это.

 

Но настоящий ли это искусственный интеллект?  

Любители философствовать, такие как Джон Сиерл (John Searle), не считают Siri реальным искусственным интеллектом, несмотря на то, какие остроумные шутки она может выдать. Всё, что делает Siri, это лишь перемешивание символов согласно фиксированному набору правил без понимания смысла. Но для всех остальных, кто не особо задаётся проблемами внутреннего функционирования голосового помощника, Siri является полнофункциональным искусственным интеллектом, который может отвечать безупречно и надлежащим образом на огромный диапазон словосочетаний, встречающихся в типичном разговоре. На данный момент развития, совокупность больших объёмов данных и модель непрерывного развития могут достичь того, чего не могут умные NLP-алгоритмы: создать чат-бота, похожего на «реальный искусственный интеллект», который мы может назвать искусственным интеллектом. В некотором смысле.

Источник: Джон Стоукс (Jon Stokes), Wired
Перевод: Александр Будик