logo

Перевод: история создания голосового помощника Cortana

Автор:

Голосовой помощник Cortana был важной частью стратегии Microsoft, призванной не только обеспечить успех Windows Phone на рынке, но и продемонстрировать свои достижения в области искусственного интеллекта.

Но почему помощника решили назвать Cortana? Ответ кажется очевидным, ведь Cortana — вымышленный ИИ-персонаж в играх франшизы Halo, который является советником и помощником Мастера Чифа. Однако идея заключалась не только в этом, о чём рассказал Сандип Паручури (Sandeep Paruchuri) в интервью Алисе Ньютон Рекс (Alice Newton Rex) для рассылки Big Bets.

Изобретение Cortana

Чтобы разобраться в истории Cortana, необходимо перенестись в 2011 год, когда Microsoft решила полностью переписать Windows Phone и не планировала добавлять большое количество функций в новую версию ОС. Инженеры были целиком заняты работой над этим проектом, а у менеджеров было почти 18 месяцев для поиска новых идей.

В это время Сандип работал в команде разработчиков веб-браузера, поиска и карт. Несмотря на сделанные улучшения, которые позволили повысить релевантность результатов поиска в Bing, пользователи по-прежнему не использовали встроенную функцию поиска в Windows Phone, а открывали браузер для перехода в Google. И разработчики понимали, что у них не получится добиться нужных результатов простым улучшением поисковой системы.

Незадолго до этого Apple запустила собственный голосовой помощник Siri, и команда решила ухватиться за эту идею. Заметив, что людям нужно просить Siri сделать что-либо, они задумались, можно ли сделать помощника с теми же возможностями, что у Siri, но с предугадыванием вопросов, которые могут возникнуть у людей. Поскольку в это же время выходила новая часть Halo, они решили, что Cortana будет идеальным названием, так как все в команде хотели бы иметь такого же личного помощника.

Итак, менеджеры Windows Phone (их было около 10 человек) начали прорабатывать эту идею. В частности, Робер Говард (Robert Howard) написал концептуальную заметку с описанием того, что они могли бы сделать. Но в тот момент все инженеры, в том числе работавшие над Bing, были слишком заняты, чтобы разговаривать на эту тему.

Всё изменилось в октябре 2012 года, когда состоялся релиз Windows Phone 8 и начался новый цикл разработки. Менеджеры вновь приступили к серьёзной работе над идеей, обсуждая её с инженерами и дизайнерами. Они даже наблюдали за некоторыми администраторами, чтобы узнать, как они выполняют свою работу. Например, один из них вёл записную книжку со всей ключевой информацией и своими интересами. Это вдохновило команду на создание цифровой «записной книжки», в которой хранилась бы любая личная информация. При этом пользователи могли просматривать и удалять записи, если они не хотели, чтобы Cortana имела к ним доступ. Это была прозрачная модель конфиденциальности, которая позволяла пользователям самостоятельно контролировать свои личные данные. Увы, эта модель так и не стала отраслевым стандартом для персональных помощников.

В результате получилась презентация из нескольких плакатов в стиле научной ярмарки, которую они показали командам-партнёрам, чтобы получить их одобрение. И это сработало. «Прелесть культуры Microsoft заключалась в том, что люди всегда получали удовольствие от трудных задач», — сказал Сандип.

Тем не менее, команде не разрешили тратить всё имеющееся время на разработку Cortana. Когда они показали плакаты руководству, то ответ был таков: «Это мило, но у вас есть работа по поиску и картам, и это ваше основное направление. Но если вы найдёте свободное время, то займитесь этим». Дело в том, что после выхода Windows Phone 8 у команды была целая тепловая карта областей, в которых они проигрывали конкурентам, и ожидалось, что они исправят эти недостатки. На практике же команда посвятила основной работе примерно 60% своего времени, а в оставшиеся 40% времени они работали над Cortana.

Вехи разработки

Каждый цикл разработки Windows Phone включал в себя три большие вехи. И, прежде чем приступить к работе над ними, команды должны были проработать каждую деталь создаваемого продукта. При разработке операционных систем почти нет права на ошибку, поскольку нет какой-либо гибкости в отношении сроков выхода аппаратного обеспечения.

Этот многоуровневый процесс разработки стал настоящей проблемой для команды, создававшей Cortana, так как работа над первой вехой (M1) началась ещё до того, как они поняли, что именно они хотят создать. Разработчики понимали, что им придётся развивать Cortana и после релиза системы, поэтому был сделан выбор в пользу веб-технологий, которые позволили бы внедрять инновации независимо от обновлений ОС. Также команда вложила много сил в создание системы отслеживания местоположения, так как казалось, что для неё найдётся множество применений. «Нам приходилось угадывать, какие строительные блоки нам понадобятся, поскольку мы сами до конца не знали, что именно мы создаем», — отметил Сандип.

Они и оглянуться не успели, как наступила вторая веха (M2), а значит на разработку продукта оставалось всего 18 недель (M1 и M2 были 12-недельными циклами, а M3 — 6-недельным). К счастью, в тот момент они уже определились с тем, что хотели создать, а также неожиданно получили приток талантливых специалистов. Это произошло из-за того, что дела у запущенного Smart Search в Windows 8.1 шли не очень хорошо, и разработчики решили, что Cortana может помочь им с доработкой этой функции. В итоге многие руководители и инженеры пришли работать над голосовым помощником.

В этот момент команда Cortana начала привлекать людей из разных отделов Microsoft для реализации сценариев работы помощника. Однако получившийся список сценариев оказался намного больше, чем предполагали в команде, и они столкнулись с необходимостью расставления приоритетов. Для решения этой проблемы к ним присоединился ещё один менеджер, ставший своего рода «редактором продукта». Именно он решал, какие компоненты необходимо оставить, а какие — вырезать.

Весной 2013 года к работе над проектом подключились маркетологи, которые настаивали на том, чтобы у Cortana была индивидуальность и чувство юмора. А в качестве публичного названия они выбрали Alyx, так как его легко произносить. Cortana же изнчально задумывалась как кодовое название продукта. Однако утечка названия Cortana из бета-версии продукта изменила всё. Более миллиона человек подписали петицию с требованием выпустить продукт под этим названием, и после небольших переговоров с разработчиками Halo решение было принято.

По мнению Сандипа, авторами Cortana можно назвать следующих людей: Маркус Эш (Marcus Ash) был главой команды разработки; Роберт Говард (Robert Howard) написал первоначальную заметку; Согол Малекзаде (Sogol Malekzadeh) был главой отдела дизайна, контента и UXR, и именно он занимался работой над тем, чтобы Cortana воспринималась как реальный человек. Последнее было очень важным аспектом работы, поскольку пользователей не должны были раздражать подсказки от помощника. Команда не хотела, чтобы у людей складывалось ощущение, что за ними «следит большой брат». Также Сандип выделил бесстрашного директора по разработке, который позволял руководителям отходить от стандартных вех, а также отлично справлялся с поисковых новых людей для работы над проектом.

Падение морального духа

Перед началом третьей вехи (M3) моральный дух команды был на самом низком уровне. У разработчиков было множество функций, которые работали на 80%, но они не были уверены, что успеют доделать их к релизу. Даже когда они отказались от тех вещей, которые они точно не успевают сделать, не было уверенности в том, что продукт выйдет в релиз. На этом этапе Cortana была более-менее готова только для английского языка (США), что было проблемой, так как стратегия Windows Phone сместилась в сторону развивающихся рынков. «Мы все не спали ночами, думая над тем, сможем ли мы показать что-либо. Мы беспокоились о том, не будет ли это правильный продукт, выпущенный в неудачное время для неправильной аудитории?», — рассказал Сандип.

Команда начала решительно сокращать сценарии Cortana, такие как оповещения об общественном транспорте (например, «выходите сейчас, чтобы успеть на метро к 11:15, иначе вы пропустите свою первую встречу»). Было слишком амбициозно объединить данные о транспорте с календарём, так как это требовало правильной интерпретации данных. Также под нож пустили некоторые вещи, которые придавали Cortana индивидуальность, в том числе голос, заказанный у актёра озвучки Cortana в Halo. К счастью, разработка этих функций велась на стороне сервера, поэтому команде удалось избежать множества проблем.

К этому моменту руководство Microsoft полностью поддерживало Cortana, и именно на это делался особый акцент в рекламе новой версии Windows Phone. Команде была очень необходима поддержка сверху, чтобы они могли отступать от некоторых правил релизов. Так, порой под видом исправления ошибок они добавляли новые функции. «Мы делали возмутительные вещи, например, приходили на заседания комиссии по релизам в пижамах, чтобы они посмеялись и разрешили включить нашу функцию», — рассказал Сандип. Этот трюк позволил вернуть голос Cortana перед релизом.

Наконец, оставалось получить одобрение генерального директора. Но именно в тот момент эта должность переходила от Стива Балмера к Сатье Наделле. «У Балмера был плохой вкус в отношении продуктов», — сказал Сандип с лёгкой улыбкой. «Он хотел, чтобы всё было под брендом Microsoft. Его прощальным подарком была попытка назвать его Bingo. Но мы это ожидали». К счастью, у Сатьи были другие идеи, и он горячо поддерживал проект, так как верил в возможности искусственного интеллекта. Под его руководством Cortana сохранила своё имя и была объявлена готовой к релизу.

Релиз

Итак, Cortana была выпущена как часть Windows Phone 8.1. Реакция пользователей была отличной, а выбранные сценарии оказались вполне подходящими. Людям нравилась возможность создавать интеллектуальные подсказки, которые позволяли создать напоминание о покупке цветов, когда вы в следующий раз будете проходить мимо цветочного магазина. Также пользователи отметили сильную индивидуальность Cortana и отличный дизайн.

За время разработки Cortana был выпущен голосовой помощник Google Now, который имел противоположный подход к индивидуальности и приветливости. Конечно, пользователи заметили это, и в своих отзывах называли Cortana «сообразительной и остроумной».

Но были и отрицательные отзывы, которые в основном были связаны с доступностью Cortana только на английском языке (США) и проблемами с обновлением ОС. Также высказывалось опасение, что хоть Cortana и хороша, но этого будет недостаточно, чтобы заставить людей купить Windows Phone.

Но в целом команда была в восторге от реакции общественности. К слову, в 2015 году почти половина команды Bing в той или иной форме работала над Cortana. Это были усилия нескольких тысяч человек.

Упадок

Однако светлого будущего не получилось. Windows Phone свернули в 2017 году, а в прошлом году прекращена поддержка приложения Cortana для Android и iOS. По словам Сандипа, спад начался сразу же после столь многообещающего релиза. Ко второму релизу больше не было маленькой команды, которая работала итеративно и инвестировала в отличный инструментарий. Сотни руководителей пытались принять участие в работе над проектом, поэтому для реализации чего-либо требовались десятки совещаний. Все эти люди разбавляли первоначальную атмосферу. Они придумывали, как масштабировать продукт, но не его культуру.

Также началось преобразование организационной структуры. Команда Windows Phone слилась с командой Windows, поэтому было вполне естественно добавить Cortana на Windows и Xbox. Однако компьютер имеет гораздо меньше контекстных данных, чем смартфон, и поэтому он не может быть действительно удобным помощником. Да и в то время многие настольные компьютеры не имели микрофона и доступа к календарю.

Другая проблема заключалась в том, что внутри Microsoft стали использовать название Cortana для обозначения всего, что связано с искусственным интеллектом и машинным обучением. Название попросту перестало обозначать что-либо. И это стало началом конца. Стремительное размывание бренда пошатнуло его ещё до того, как у него появился настоящий шанс завоевать сердца людей.

Комментарии (4)
  1. Дмитрий Шишкин 22 декабря 2021 в 17:28
    -1
    Cortana хоть работает сейчас или всё такая же бесполезная шляпа, как и была?
    1. Arseni Онлайн
      Arseni 22 декабря 2021 в 18:00
      +1
      В Windows 11 я иногда спрашиваю о погоде. Чтобы вызвать её, говоришь "Cortana" и задаёшь вопрос.
  2. Arseni Онлайн
    Arseni 22 декабря 2021 в 18:06
    0
    Как-то была новость и рекламная компания о том, что Cortana переориентировали в ассистента в работе для увеличения производительности. С тех пор хоть что-то изменилось, её планируют развивать?
  3. Артём Федотов 23 декабря 2021 в 02:33
    +1

    Мне кажется Майкрософт сейчас пытается угадать, вывезет ли Bing если возложить на него обязанности Cortana или нет. Он по существу уже пытается. В течение года, появился голосовой поиск на русском, и если раньше он ничего не понимал - теперь довольно точно распознаёт речь. Также при голосовой поиске, он теперь прямо как Google и Алиса - озвучивает результаты. Может посчитать - простая арифметика. 


    В целом Bing имеет большой потенциал. Например имеется подобие умной камеры. Или решатель математических задач. Это позволяет думать, что Майкрософт готовит его как частичную замену для Cortana.

Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.