Можете ли вы представить себе мир, где личный помощник AI на ваш смартфон способен понять, как много о мир, как вы? Что насчет сценария, где общаясь с помощником А. И. Так же естественно и легко, как работать с другим человеком? Развивая те виды возможностей именно то, что команда на центре Samsung ИИ в Торонто ставят свои умы.
Samsung ньюсрум сел со Свеном Дикинсон, руководитель центра Samsung по блютузу Торонто, чтобы узнать больше об этих замечательных полей, и что они могут означать для будущего.
Видение видение
Второй центр Samsung АИ создана в Северной Америке, центр Samsung в МА Торонто под руководством доктора Свена Дикинсон, эксперт в области компьютерного зрения и бывший декан факультета компьютерных наук в Университете Торонто.
В эпицентре АИ исследования и разработки, центр Samsung в МА Торонто в основном сосредоточены на развитии возможностей визуального понимания, что позволит устройства Samsung, чтобы понять мир, в котором он расположен. Кроме того, команда работает над мульти-модальных взаимодействий, которые пользователь-машина взаимодействий, которые инкапсулируют видение, язык и знания.
“Разрешив устройств Samsung, чтобы ‘посмотреть мир’ через компьютерное зрение позволяет им визуально первом их диалоге с пользователем, предоставляя комплексные, мультимодальные опыт, что гораздо более естественно, чем это только видение или на основе диалога”, говорит Дикинсон, чей опыт включает в себя изучение проблем, связанных с формой восприятия и распознавания объектов.
Говоря о преимуществах мультимодальных технологий, Дикинсон утверждает, что “не надо было читать инструкции, чтобы выяснить, какие кнопки нажимать на устройстве и в каком порядке. Скорее, я должен быть в состоянии показать свои устройства, чего я хочу, и сказать ему, что я хочу, в естественном языке, который понятен, и находится в мире, в котором я живу”.
Экстраполируя на взаимодействие компьютерного зрения и смешанных входов, он идет дальше сказать что, “для достижения этой широтой понимания, то устройство должно иметь модель моего понимания мира, способности общаться эффективно и естественно со мной, и умение увидеть и понять тот мир, в котором я вижу”.
Заметив на приложения для этой технологии, Дикинсон определяет наиболее убедительным в качестве “персонального помощника, который вы не только говорим, но который видит мир таким же образом, что вы делаете.” Говоря о важности мульти-модальных взаимодействий устройство, Дикинсон указывает, сколько перечеркнул один из режимов общения (аудио, речь, зрение и т. д.) бы затруднить общение между двумя людьми, и говорит, что также относится к личным устройствам.
Поистине усовершенствованный пользовательский опыт является ключевым
В 2019 выставке потребительской электроники (CES), Samsung представила свое видение гостиная, которая включает в себя подключение 500 миллионов устройств компания продает каждый год, и делает их умнее. Дикинсон подчеркивает, что широкий ассортимент продукции Samsung будут иметь определяющее значение в реализации этого видения, говоря, что, “чем отличается Samsung является то, что он делает множество устройств в доме, включая цифровые приборы, телевизоры, и мобильные телефоны. Samsung имеет уникальную возможность использовать эти устройства для получения мульти-устройств, которая следует за пользователем с одного устройства на другое, и из одной комнаты в другую. Это поможет реализовать весь потенциал каждого устройства, чтобы эффективно общаться, чтобы помочь пользователю выполнить устройства-конкретные задачи, и чтобы узнать привычки и предпочтения пользователя, так что последующее общение не навязчивое, но вместо этого всегда полезно’”.
Говоря о том, что его центр нужно сделать, чтобы действительно реализовать компьютерное зрение и смешанные взаимодействия, комментарии Дикинсон, что “видение-это не о понимании образов, видения, понимания мира. Действительно способны системы искусственного интеллекта должны обладать пониманием нашего мира, его физики и причинно-следственных связей, его геометрии и динамики. Они должны также уметь моделировать и понимать человеческое поведение”. Он экстраполирует на этом, отмечая, что, “если наши техники смогут увидеть 3D-мире, что мы живем точно так же, как и мы, то есть, понять, 3D фигуры, позиции и тождества объектов в нашей общей среде, то наши устройства могут визуально воспринимают мир как мы. Такой общий визуальный контекст будет иметь решающее значение в разработке полностью реализованы личные помощники”.
Дикинсон говорит, что Samsung является ведущим заряд, когда дело доходит до действительно интеллектуальных визуальных представлений, и определяет визуальный заземление в качестве важнейшей предпосылкой для хорошо округлены возможности визуального понимания. “Samsung является лидером, когда дело доходит до развития взаимодействия человека-прибор, который точно имитирует человеческое взаимодействие служб,” Дикинсон говорит: “Мы стремимся обеспечить визуальный заземление и представления знаний леса для диалогового взаимодействия. Без этих компонентов, пользователи будут разочарованы услуг, и быстро отключился.”
Взаимодействие человека и устройства на основе открытого обмена информацией
Дикинсон продолжает объяснять, что искусственный интеллект должен уметь объяснить самому пользователю. Он замечает, что после неудачной попытки выполнить задачу или предоставить адекватный ответ, “устройство должно быть способно отразить пользователю, как именно и почему это придумал, что ответ (или его отсутствие). В идеале, он должен быть способен следить за пользователем, задавая вопрос или прося пользователю настроить свою камеру или другие режимы ввода, так что он может собрать дополнительную информацию и сформулировать адекватный ответ”. Дикинсон рассказывает, что такое открытость и обмен информацией будет иметь ключевое значение для дальнейшего совершенство человека-устройства взаимодействия, отметив, что “то, что мы называем сфере ‘активный диалог и активное видение’, где система может построить мысленную модель того, что пользователь понимает, и может, в свою очередь, открывают свои ментальные модели, так что пользователь может понять мыслительные процессы, устройства.”
Преимущества базирующейся в Торонто
Вопрос о том, как в Торонто действует на центр ИИ, Дикинсон отмечает, что центр имеет много преимуществ, благодаря своей близости к различным ИИ мирового уровня-соответствующими учреждениями, включая Университет Торонто, Йоркский университет и Университет Райерсон. “Будучи в Торонто предлагает нам огромное региональное преимущество”, — Дикинсон заявил: “Мы были через дорогу от Университета Торонто, дома в отдел информатики (РС), который является одним из топ-10 международных информатики. Более половины членов нашего Центра Ай-либо активных преподавателей, выпускников и нынешних студентов РСУ”.
На тему Сотрудничество между Samsung глобальные Ай-центры, Дикинсон рассказывает, что, “семи глобальных АИ центры работают над созданием передовых решений в соответствующих областях, а также координация работы по достижению общей цели, осуществляющего Samsung конечной АИ видение”. Дикинсон затрагивает тему Торонто ИИ центр сотрудничает с другими АИ центров дальше, заявив, что, “мы начинаем изучение возможных совместных исследований с другими глобальными АИ центры, и надеюсь сходятся на некоторых случаях ценность для Samsung и ее продукции и услуг”.