Saturday, January 14, 2017

Сравнение Google Home и Amazon Alexa / Geektimes

Пользователь
12,8
рейтинг
13 января в 12:04

Сравнение Google Home и Amazon Alexa из песочницы

Недавно мне в руки попало два популярных голосовых помощника. В этом обзоре я расскажу о том, что они умеют и чего пока не умеют.


image


Покупка и инсталляция


Google Home сейчас стоит $129, цена Amazon Echo с помощником Alexa $179. Оба, конечно, не продаются в России. Что ж, едем в США и покупаем там.


Google Home предлагается в 7-ми разных цветах тряпичного чехла, закрывающего нижнюю часть устройства (там находится колонка). Алекса бывает черная и белая и по размеру существенно крупнее и увесистее конкурента. Оба сделаны из приятного матового пластика. На мой личный взгляд внешне Google Home кажется каким-то обрубком, тогда как нижняя часть Alexa похожа на дуршлаг. Но о вкусах не спорят.


Зато надо отметить, у Google Home отличная коробка, ее хочется открывать и закрывать снова и снова. Продакт дизайнеры очень постарались.


image


В качестве внешних интерфейсов у Алексы 2 кнопки, а у Гугла небольшой невидимый тачскрин, по которому у меня редко получается попасть. Впрочем, эти кнопки и не нужны, ведь всеми функциями можно управлять голосом.


Для подключения нужно скачать приложение (приложение Alexa пришлось ставить как apk, его нет в российском сторе), и настроить доступ в домашний Wi-Fi. Делается это довольно просто, только нужно не забыть также включить bluetooth на телефоне. После подключения в домашний Wi-Fi устройства быстро линкуются с приложением — и вы можете видеть, как их движки интерпретируют полученные фразы.


Немного о безопасности. Как известно, "the S in IoT stands for Security". Помощники слинкованы с вашим личным аккаунтом, но не распознают голос хозяина. Кто угодно может воспользоваться ими, чтобы прочитать вашу почту и что еще там вы им доверили.


Распознавание речи


Распознавание паттерна вызова ("OK, Google" и "Alexa") происходит на месте, а распознавание фразы и формирование ответа — в облаке. Если рассматривать их как хабы для управления умным домом, то здесь кроется принципиальное отличие этих платформ от HomeKit, который умеет работать оффлайн. У меня ни разу не случалось, чтобы помощники не узнали свое имя. Зато не раз бывало, чтобы в качестве имени приняли что-то еще.


Наш с супругой среднерусский английский Google понимает очень хорошо. Практически все простые фразы распознаются корректно с первой попытки, чего не скажешь об Алексе. Ниже я попробовал произнести ей довольно сложное слово:


— Alexa, what's under rubber new riddle?
— Alexa, what is them to bring new rail?
— Alexa, what is an tripper no real?


Ок, упрощаем вопрос


— Alexa, what is interpret priner?
— Alexa, what is an trump renewal?
— Alexa, what is an to pandora?


Зайдем с другой стороны


— Alexa, what is a synonym for businessman?
— Business's synonyms include business executive and business person.


Ну хорошо, дорогая. Кому интересно, изначальное слово было entrepreneurial.


Ведем непринужденную беседу


Оба помощника имеют встроенный обширный набор предустановленных фраз и ответов. Не с кем поговорить о любви, о жизни? Роботы к вашим услугам. Например, обоих можно попросить 'tell me a joke'. Набор шуток у них обширный, но ни одна из шуток не показалась мне смешной. Думаю, коварные нейросети просто притворяются тупее, чем они есть.


— Alexa, who killed Kenny?
— Oh my god, they killed Kenny!


— OK, Google, are you robot?
— I prefer to think of myself as your friend


— Alexa, what is the purpose of life?
— The answer is 42, but the question is far more complicated


— OK, Google, what is your gender?
— I am all inclusive


— Alexa, does Santa exist?
— I don't know him personally, but I heard a lot of good things about Santa


— OK, Google, tell me a story
— One there lived a protagonist and some supporting characters. Together they went on a journey. And twist ending, it was all a dream!


— Alexa, am I funny
— I don't have a sense of humour so it's hard for me to tell


И здесь она определенно не соврала.


Поиск


Alexa отправляет вопросы в bing, а куда их отправляет Google Home – догадаться несложно. Оба помощника вполне сносно пользуются интернет поиском и Википедией в ответ на вопросы. На мой взгляд, Гугл ищет лучше – он гибче настроен на поисковые фразы и чаще понимает, что запрос поисковый.


— Alexa, when Moscow was founded?
— Moscow state of establishment was 1147


— OK, Google, what is a greatest number
— According to English Language and Usage, 7 is the smallest and 9 is the greatest number


— Alexa, where is Kilkenny?
— Kilkenny is a city in Kilkenny, Ireland (...)


— OK, Google, which fish is the fastest?
— Sailfish. According to china.org.cn the sailfish is the fastest fish in the world able to speed at a swim speed of 68 miles per hour


Так что, Борис Борисыч, развейте наконец свои сомнения, ИИ нам все рассказал.


Фичи out-of the-box


Оба умеют рассказывать, что стоит у вас в Гугл-календаре (но озвучивают только латинское написание). Почту пока не читают. И слава роботам, см выше про безопасность.
Гугл умеет переводить на множество языков, Алекса – нет


— OK, Google, what is 'Mother washed a frame' in Russian?
— Мать мыл раму


Оба умеют стримить музыку из популярных приложений (платите деньги), а также радио и новости (бесплатно). Насчет музыки надо понимать, что так как данные на железку идут через Cloud, то стримить ее с телефона затруднительно, такой опции нет. Amazon и Google разрешают бесплатно загрузить на ваш аккаунт в их музыкальных сервисах какое-то количество треков и играть их оттуда.


Alexa позволяет делать покупки на Amazon. Для покупок можно установить pin-код, чтобы соседи не игрались.


— Alexa, shopping
— Would you like to shop?
— Yes
— What would you like to order?
— Books
— Voice ordering is exclusively available for prime members. Would you like me to add Books to Nikolai's cart instead?
— Yes


Здесь в приложении появляется набор книг, можно продолжить покупки там.


Помимо этого, у обоих есть довольно много толковых и не очень фич, таких как игра в викторину, будильник, калькулятор, конвертер мер и валют, толковый словарь и так далее.


Фичи с бубном


8 декабря было объявлено о запуске открытого API для Google Home. Говорится, что механизм под названием Google Actions заработает в начале 2017 года и позволит третьим сторонам создавать диалоговые сценарии, через которых пользователь сможет использовать обращаться к контенту или сервисам поставщика. Мудрено написал, в общем смотрите, как это работает в Alexa Skill Kit, который существует с середины 2015.


В приложении Alexa есть магазин skills, разработанных разными сервисами, такими как Expedia или NASA. Скилл — это доступ к услугам/информации сервиса посредством голосовых команд. Его можно бесплатно подключить в магазине или просто голосом, назвав ключевое слово или фразу.


— Alexa, ask NASA Mars to get me a Curiosity rover update


— Alexa, ask RecipeFinder what I can cook with tuna and cheese
— Here are some more recipes (..) I have included links to the recipes in your cart

Ссылки появляются в приложении. Не кликабельные арррргх!


В скиллах круто то, что они представляют собой диалог, который может иметь достаточно много опций развития (в отличие от сценариев IFTTT, о которых речь дальше). Пока что количество оценок у скиллов в магазине Alexa измеряется сотнями, так что это только первые шаги в создании голосовых интерфейсов. Свои скиллы запустили Expedia и Kayak, но они не дают возможности голосом бронировать билеты и отели, можно только цены смотреть. Тем не менее, можно бронировать автомобиль в Expedia, заказывать Uber, и есть даже один банковский скилл, который позволяет оплачивать счета.


Кроме того, у Alexa и Google имеется свой IFTTT канал, через который можно настроить еще больше функций. IFTTT позволяет делать между сервисами триггеры вида «если сервис 1 сказал А, то отправить в сервис 2 команду Б». Такой канал имеют почти все Smart Home железяки, несколько крупных торговых сетей (они позволяют только обновлять онлайн-корзину) и миллион информационных порталов. Беда с IFTTT в том, что все рецепты для Алексы и Гугла позволяют делать что-то по голосовой команде (заметки в spreadsheet, пост в фейсбуке, включить термостат), но не позволяют прокидывать связь обратно (прочесть заметки, прочесть фейсбук, спросить температуру). Очевидно, разработчики не предоставили соответствующего API, но я не понимаю, почему. Уж если они календарь умеют читать, то могли бы и сообщения от IFTTT озвучивать, но нет.


Дальнейшее развитие


Резюмируя, я бы сказал, что за счет Skills у Alexa сейчас больше возможностей, чем у Google, но все это может появиться в нем довольно быстро. Кстати, полтора года назад Amazon запустил 100-миллионный венчурный фонд Alexa Fund для инвестиций в проекты, использующие голосовой интерфейс Alexa. У фонда уже 10 инвестиций, самая большая из которых — в Ecobee, термостат, который то ли уже обогнал, то ли вот-вот догонит по продажам Nest.


У Amazon также есть SDK Alexa Voice Service, позволяющий запускать сервис Alexa на железе сторонних разработчиков. Google пока не выпустил аналогичный SDK, планируют выпустить в этом году.


В целом, соревнование Amazon vs Google на поле Smart Home обещает быть интересным. Пока Гугл зафейлил попытку подмять платформы и протоколы неудачным проектом Brillo-Weave, Амазон вырвался вперед с развитием голосовых интерфейсов. Гугл теперь вынужден догонять, с задержкой примерно в год-полтора. Зато в активе Гугла более качественная голосовая библиотека, и вообще он умнее, лучше запрограммирован, так что ситуация близка к паритету. Если вы читаете эту статью с сугубо практическими целями и вы не американец, при выборе из двух устройств я бы предложил купить Гугл, так как он получше понимает и получше ищет. От сложных диалоговых интерфейсов из Skills Store мало толку, если вас не могут нормально понять.

Николай Ковшов @Doobrovskiy
карма
3,0
рейтинг 12,8
Пользователь
Легендарная стратегия для тебяПроверь свои командирские навыки в новой тактической ММО стратегии! 16+Загрузить(199)Скрыть объявление
Объявление скрыто.
Распевки и упражнения для вокалаПолучи суперэффективные распевки для вокалиста - здесь!5 секретов вокалаОтзывыОб автореfree.easyvoice5.ruАдрес и телефонСкрыть объявление
Объявление скрыто.

Самое читаемое

Комментарии (45)

  • 0
    >Siri, которая работает оффлайн

    Что-то у меня она не хочет работать, если аппарат в режиме полета или просто отключена передача данных.
    • 0
      очень похоже на опечатку fix:
      >Siri, которая не работает оффлайн
      >Siri, которая работает не оффлайн
      • +1
        Вы правы, конечно. Я поправлю формулировку.
  • 0

    Почему для этого нужно отдельное устройство? Ведь все это мог бы делать и обычный телефон или я ошибаюсь?

    • +2
      Нужно все время слушать окружающий шум на предмет командной фразы. Насколько я понимаю, у телефона быстро заряд кончится, да и качество микрофона-динамиков недостаточное.
      • +2
        Новые айфоны же как-то умеют, и батарейку это не садит…
        • 0
          Удобная штука, подтверждаю, работает в относительной тишине на расстоянии до 5 метро, срабатывает в 95%
          • +1
            Я могу и в соседнюю комнату крикнуть и спросить сколько времени)))
      • 0

        Для этого нужно выделить спец. контролер с малым потреблением и все. Не обязательно гонять ЦП. Как то плохо когда умный ассистент только дома, где ты проводишь меньше всего времени если не считать сон.

    • +1
      очевидным развитием таких технологий является система «умного дома», где inside контроллер, подключенный ко всяким умным лампочкам и мультиваркам, необходим. Телефон вы не оставите дома, чтобы он выполнил необходимые действия, а торчащая наружу (опубликованная в интернете) мультиварка с чайником — плохая идея.
      • 0

        Система умного дома может управляться телефоном, и даже когда вы не дома. А наружу выставляется сама система умного дома с которой связывается тел. напрямую или через облако. А не каждая розетка отдельно. Т.е. каждый член семьи будет иметь своего мобильного ассистента, а не одна игрушка на всех в одной комнате. В общем задумка хорошая реализация неудобна.

  • +4
    — Alexa, what's under rubber new riddle?
    — Alexa, what is them to bring new rail?
    — Alexa, what is an tripper no real?
    — Alexa, what is interpret priner?
    — Alexa, what is an trump renewal?
    — Alexa, what is an to pandora?

    Что-то я тоже Вашу речь не распознаю…

    Alexa, what is a synonym for businessman?

    Кому интересно, изначальное слово было entrepreneurial.

    Прилагательное — синоним существительному? Тут, ведь, и человек-то не догадается… ))
    • +1
      Первые 3 (на самом деле, штук 10) вопроса — entrepreneurial, следующие 3 — entrepreneur, ни разу за много попыток не распознала
  • +1
    Заглянул только лишь бы узнать смогли ли эти два девайса поговорить друг с другом, но видимо пока рано.
  • +3
    Во всех этих обзорах нет ответа на один вопрос: а действительно ли это удобно и нужно в повседневной жизни? Я не помню последний раз, когда хотел бы узнать, сидя на диване и ничего не делая, в каком году основана Москва, ну или какая самая быстрая рыба.

    По поводу стриминга музыки — да, прикольно попросить сыграть что-нибудь, однако опять же, редко слушаю дома музыку.

    По поводу календаря — я реально не знаю настолько занятых людей, которые не могут 1 встречу в день держать в голове. Да и календарь для того и нужен, чтобы визуально оценить загруженность того или иного дня.

    Вы привели пример может быть и русского английского (акцент) но фразы у вас построены грамматически правильно, ведь в фразе «OK, Google, what is 'Mother washed a frame' in Russian?» is и будет точкой, после которой Гугл понимает что далее следует фраза которую нужно перевести, так что, нужно знать грамматику.

    покупки на амазоне? Увольте. Я хоть и живу в Европе, но положить нужную вещь в корзину голосом — из разряда фантастики

    Я вчера заказал блокнот LEUCHTTURM1917 Medium (A5), dotted, black. Именно средний, именно в точку, именно черный, учитывая, что у 99% продавцов нужного не было в наличии

    Почему во всех этих тестах используются вопрос

    Алексаэ\Гугл — купи телевизор на Амазоне?

    Может быть Alexa найди телевизор на леде, с такой то диагональю, смарт ТВ, 4к, выгнутым, в бюджете до столько то, с рейтингом выше 5

    Вот тогда я и пойму может ли Алекса и Гугл делать что то действительно полезное

    • 0
      Полезность вещь относительная. Смотря какая у вас целевая функция. Мне интересно повышать свою коммуникативную ценность, в этом плане эти штуки мне полезны. Приходят гости, говорят всякое роботам, всем весело.

      Чтобы они экономили время, придется учиться ими пользоваться. Ну и пройдет еще время, пока устаканятся основные сценарии для их использования. Может, это вообще в бизнесе будет, а не дома. Посадят такую Алексу в ЖЭК, а Хоум на кассу в Пятерочке.
      • 0
        Приходят гости, говорят всякое роботам, всем весело.


        Вспоминается говорящая рыба из магазина на диване 90-х, которую можно было повесить на стену в гостинной… Приходили гости, она смешно крутила головой и хвостом, всем было весело ;)
    • +1
      Очень удобно. Сначала восприняли скептически, теперь же это просто обыденность. Включить свет с ребенком на руках. Выставить уровень димирования не через приложение или кнопкой со стены, а всего одной фразой. Попросить включить телевизор на нужном канале пока готовишь кофе. Прослушать прогноз погоды за завтраком. Попросить напомнить о готовящейся еде в духовке одной фразой, а не тыканьем кучи кнопок. Да просто включить музыку…
      Очень жду skill для интеграции с Plex. Вот это будет счастье, а то уже собрался пилить сам.
      • 0
        один вопрос, готовим мы на кухне, музыку и фильмы слушаем в зале, будильник ставим в спальне, три Гугл Хома покупать надо получается
        • 0

          В случае с Amazon необходимо купить Dot для каждой комнаты. Они гораздо дешевле Echo. При покупке 5, по-моему, штук, одна в подарок. У Google такого пока нет. Поэтому, да, придётся раскошелиться.

      • 0
        Основная сложность, что если вы говорите вместе с тем, что кто-то говорит в телевизоре, ничего не получится.
        Очень, очень плохо идет распознавание голоса на любом похожем на голоса фоне.

        Зато крайне удобно пользоваться распознаванием за рулем, когда можно пусть и не мгновенно, но не особо отвлекаясь отправить/почитать смс, уточнить погоду, и так далее. Но пока что все это доступно только на английском (
        • 0

          Не замечал такого. Телевизор в 2,5 метрах. Правда большую часть времени ТВ вещает на русском.

    • 0

      Ну я например прикрутил алексу к управлению домом и это удобно.
      https://m.youtube.com/watch?v=U-6_s7yuGQE


      Ещё дети часто ставят музыку, а я спрашиваю погоду. Но без управления домом она бы была для меня бесполезна. Кстати скил публичный и им можно пользоваться.

  • 0
    У меня дома Alexa, меня честно говоря бесит. Очень часто не понимает меня. Английский еще ничего, но немецкий слишком заточен на разговорную речь. Это очень мешает управлению умными устройствами в доме. Если есть устройство «кухонная лампа» и сказать «включи кухонную лампу» или «включи свет на кухне» Алекса поймет и включит. Но стоит добавить группу устройств с именем «кухня», что бы выключать все разом, то Алекса начинает тупить. Все время переспрашивает «сорри, какой девайс вы имели ввиду?» У меня на кухне две лампы плюс светодиодная подсветка. Еще свет в корридоре и в зале. Такой гемморой с выбором имен. У меня еще монитор подключен к умному дому (джойстик управления на LG мониторе отвалился, я вместо него esp8266 подпаял). Так вот если скажешь «Алекса включи монитор» она обязательно переспросит какой девайс я имел ввиду. Если сказать «Алекса включи ЭТОТ монитор» (с определенным артиклем) — сразу включит. И в логе видно же, что фразу полностью услышала, но без артикля почему то семантически не понимает. Если сказать «Алекса, включи отопление» — понимает с пол пинка.

    Если я общаюсь с Google Assistent в телефоне, то он понимает много лучше. Поэтому жду с нетерпением Google Home. Их в Европе к сожелению нету, а покупать импортированный за 250 евров — жаба душит.
    • 0
      Я назвал основной свет именем комнаты, например kitchen. Разбросанные по кухне споты назвал по номерам их расположения слева на право: spot one, spot two. Плюс телевизор на кухне kitchen TV. Проблем с распознованием у всей семьи нет.
      • 0
        Когда я подстроился под Алексу с ее заморочками, то стало проще. Понятно, что мое произношение не очень, но все же. Светом со временем я перестал управлять через Алексу, бывает, но редко. Все же кнопку на стене нажать проще. А вот монитор и отопление я прошу включить Алексу. Ну и музыку прошу включить, пока готовлю.
  • 0
    ...«Алекса заказала для меня кукольный домик»
  • 0

    Наверно не очень вопрос, но все же…
    Как каждый помощник реагирует на "домогательство"?

    • 0
      Отшучивается
  • +1
    В повседневной речи как-то проще обращаться к собеседнику по имени, например Алекса. Говорить каждый раз OK, Google с моей точки зрения как-то не натурально. Можно ли у Google сменить wake word на что-то человеческое?
    • 0
      Jarvis!
      • 0

        Серьёзно?
        В новости про умный дом Цукерберга тоже упоминалось, что его дом работает на API от Alexa и отзывается по имени Jarvis. Вот только я нигде не увидел где в API это можно поменять. Там только Alexa, Amazon, Echo.
        Зато у Amazon есть несколько типов API. Smart достаточно скуден по функционалу, но не требует дополнительного invocation name. А вот API на котором пишутся skills более функционален, но для активации уже необходима дополнительная фраза. В моем случае я тоже использовал Jarvis (судя по отзывам на форумах, также поступило и большинство).
        Домочадцы стали шутить, что дома появилось два домовых т.к. появились конструкции типа: Alexa, ask Jarvis where is daddy.

        • 0
          Я всего лишь предложил имя для домашнего помощника. Не знал что Цукерберг делает «свой Amazon Echo».
  • 0
    Пользуюсь гугл хоумом с момента релиза — многие сервисы недоступны, вести диалог нереально как и просто на многие вопросы отвечает что ничем помочь не может. До ИИ и того маркетингового булшит-ролика гугла ему как до Луны. Апишки нормальной нет, поддерживает мало сервисов и девайсов (к примеру где lifx?). Пользуюсь только «hey google, play my playlist»
  • 0
    Я с нетерпением жду Google Home, чтобы подключить его к моей системе УД. Даже оставил места в потолке под него вместо спотов. Это будет, скорей всего, самое популярное применение данных систем — гугл включи свет, гугл опусти жалюзи, гугл включи телевизор и т.д.

    Я думаю Google предпочтительнее, так как для него больше шансов, что появится поддержка русского языка.
    • 0

      Я купил home в USA и обратился в поддержку гугла с просьбой протестировать немецкий или русский языки. Пока молчат. Буду пока пилить уд на английском.

  • 0

    Поправка. О том, что actions on google будут доступны, было объявлено еще в октябре, на той же презентации, на которой были представлены смартфоны pixel.


    А 8 декабря вся платформа уже официально зарелизилась и в общем-то сейчас работает.


    Т.е. вы уже можете расширять google home своими action'ами. В 2017-м эти actions станут доступны для нового ассистента в телефоне.

    • 0
      ребят, действительно, вы всего парочкой своих комментов заставили меня захотеть купить гугл хоум.
  • 0
    А что посоветуете на 2-3 комнаты ставить? амазон, гугл? хотелось бы простой передачи распознанного текста php скрипту.

    сейчас сделал предзаказ на ReSpeaker… но что, то выглядит сыровато
    https://www.seeedstudio.com/ReSpeaker-Core-Based-On-MT7688-and-OpenWRT-p-2716.html
    • 0
      Что имеется в виду под распознаванием текста? Случайные или заготовленные фразы?

      Если заранее известные то можно и в iftt сделать с алексой обработку евента и передавать через maker channel.

      Ну если логика сложнее то свой скил (что тоже нет так сложно — у меня хостится простенький скил на pi для проигрывания российского радио, написан на nodejs, и второй скил для управления домом в их облаке)

      Совсем случайные фразы тоже не получится — после того как вы говорите ключевое слово «Alexa/Echo» вы должны сказать действие например «ask» или в случае с ifttt — «trigger» и далее название скила к которому обращаетесь.

      Я не стал разоряться на большую колонку, dot второго поколения — (который срабатывает по ключевому слову) в каждой комнате меня вполне устроил (home непонятен пока нет возмонжости кастом девелопмента).
      • 0
        Что имеется в виду под распознаванием текста?

        Просто случайный текст. т.е. система слушает эфир, «слышит» контрольное слово, дальше через api google или bing преобразует голос в текст и отдает текст php скрипту
  • 0
    Насчет музыки надо понимать, что так как данные на железку идут через Cloud, то стримить ее с телефона затруднительно, такой опции нет.

    Это не понял с чего это, данные идут напрямую через BT, Echo работает как обычная колонка с голосовым управлением.
    • 0

      Как вы это сделали? Я долго бился, но дать на Алексу музыку с телефона не смог

      • 0
        Просто смотря что вы имете в виду под «дать музыку» — я имею в виду что как обычную колонку со вперед / назад стоп / плей оно вполне себе работает, вопрос что трек голосом не выбрать, но для этого их можно в клауд амазоновский кинуть и всё.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.



Original Page: https://geektimes.ru/post/284574/



Sent from my iPad

No comments:

Post a Comment

Note: Only a member of this blog may post a comment.