Зачем мы разговариваем с гаджетами сегодня и что будем делать с ними завтра
Анализируем перспективы умной техникиСмартфон, а это самый привычный и наиболее часто используемый сейчас гаджет, активно развивался и эволюционировал последние 15 лет. Все удобнее становились операционные системы, постоянно возрастала производительность, увеличивался экран, повышалось качество звука и съемки, а также появились, исчезали, а порой снова возвращались разные форм-факторы. Впрочем, теперь мы видим все меньше революционных изменений, а скачкообразный прогресс сменился на плавное улучшение всех характеристик. Одновременно «умнела» и другая техника, а пока смартфоны вышли на своего рода плато, она начала резко догонять их в плане развития.
Когда речь идет о домашнем «умном устройстве», чаще всего на ум приходит телевизор или приставка. Есть и более экзотичные (по крайней мере пока) варианты: подключенные к интернету стиральные машинки, холодильники, духовки и вытяжки. Судя по всему, в ближайшее время стоит ждать все большего количества технологичных интеграций в бытовую и домашнюю технику, а вместе с тем эти инновации постепенно начнут спускаться из топовых линеек брендов в модели среднего класса. Заодно становясь массовыми.
Один из важнейших вопросов — какой способ общения и взаимодействия выбрать для таких продуктов.
Наиболее привычный графический интерфейс реализовать можно далеко не везде. Как засунуть дисплей в умную лампочку или розетку? Поэтому производители сделали ставку на одно из самых простых и очевидных решений — голосовое управление.
Однако и тут есть проблема. Далеко не всем комфортно разговаривать с неодушевленными предметами. Например, старшее поколение часто испытывает при этом неловкость и скептически воспринимает голосовые интерфейсы. Молодежь и люди средних лет, впрочем, тоже не всегда считают это уместным.
Пока только детям, открытым ко всему новому и находящимся в процессе познания мира, абсолютно комфортно взаимодействовать с техникой голосом. Исследования показывают, что 40% голосовых вопросов ассистентам задают именно малыши. При этом дети гораздо более эмпатичны — они считают ассистента личностью и первым делом спрашивают не «Что ты умеешь?», а «Кто ты?»
Чтобы делать гаджеты удобными для всех, мы в SberDevices решили применить мультимодальный подход, то есть сочетающий в себе разные типы управления. «Обращаться» к устройству можно голосом, жестом, пультом или тачем – и тут на помощь придет виртуальный ассистент, чей ответ будет учитывать способ, которым был задан вопрос. Он может что-то рассказать голосом, показать на картинке или сразу совершить нужное действие.
У нас, в SberDevices, это семейство Салют, три персонажа с разными характерами и манерой общения: Афина, Сбер и Джой. Мы принципиально не называем их «голосовыми», потому что ассистенты Салют помогают управлять устройством разными способами.
Почему это важно? Возьмем жестовое управление. Пока это кажется чем-то не особо нужным – зачем, например, останавливать песню жестом, если можно отдать команду голосом? Но, как и ко всему удобному, к управлению жестами быстро привыкаешь.
Например, если звонит телефон и нужно моментально ответить на звонок, выключить воспроизведение взмахом руки будет удобнее, чем поднять трубки и удивить собеседника обращением к голосовому ассистенту.
Недавно у Салют был первый день рождения. По этому случаю мы подводили итоги и выяснили, что за год Афина, Джой и Сбер отреагировали на 1.2 миллиона жестов. Это при том, что большую часть времени в нашей линейке гаджетов было доступно только одно устройство с камерой, а значит, и поддержкой жестов — SberPortal!
С развитием технологий компьютерного зрения лет через 10 мы сможем включать чайник взмахом руки, тем более что производителям техники это тоже удобно, достаточно просто установить на устройство камеру. Следующий виток развития этого направления – восприятие техникой вашей мимики. Например, если вы улыбнулись, просматривая видео – устройство поймет, что такой тип контента вам нравится, и учтет это в будущем.
Мультимодальность – это преимущество, которое позволяет каждому подбирать удобный формат взаимодействия с умными устройствами и «живущими» в них виртуальными ассистентами. Но как сделать так, чтобы сами ассистенты успевали за потребностями пользователей, чтобы они могли дать большой выбор функций на все случаи жизни? Чтобы, например, голосом можно было можно заказать продукты не только из большой торговой сети, но и из магазинчика рядом с домом? Для этого нужно открыть внешним разработчикам возможность создавать приложения для ассистентов.
У Сбера такая платформа называется SmartMarket, на ней можно учить ассистентов новым навыкам — мы называем их смартапами. За прошедший год было создано порядка 800 смартапов — то есть у ассистентов появилось 800 новых умений, от базовых игр до поддержки заказов из интернет-магазинов. С первых дней мы сделали разработку максимально доступной, чтобы все желающие могли поучаствовать в развитии ассистентов. Многие инструменты на SmartMarket даже не требуют навыков программирования. Благодаря этому смартапы создают как большие компании, так и обычные люди.
Еще совсем недавно мультимодальное управление было чем-то необычным, но сегодня оно становится все более востребованным, и уже в ближайшее время поддержка таких функций станет гигиеническим фактором – даже в самые простые устройства будет встроена возможность голосовых и/или жестовых команд. В SmartMarket есть возможности для работы со всеми эти функциями, и мы призываем разработчиков не проспать будущую технологическую революцию — потому что в разработке приложений для умных устройств в ближайшем будущем выиграет тот, у кого больше опыта.