原标题:奖金1000000元!百度喊你开发对话式技能

以下内容首发于DuerOS开放平台:https://dueros.baidu.com/didp/doc/dueros-bot-platform/dbp-design/interaction-design_markdown

图片 1

图片 2

技能交互设计规范

经过严谨和规范化设计后的优秀技能更容易被用户了解、使用和喜爱。DuerOS提供了对话式技能的交互设计规范,覆盖了技能的场景、风格、话术、引导和满足等方面,让你的技能与用户进行良好的交互,更快更好的服务用户。

  • 技能场景定义
    • 技能功能独立清晰
  • 技能风格设计
    • 礼貌友好
    • 真实可靠
  • 作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。技能话术设计
    • 简洁自然
    • 直白易懂
    • 作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。丰富多变
  • 技能引导设计
    • 欢迎引导
    • 作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。提供明确简洁且受限的选项
    • 多轮对话中的友好引导
  • 技能满足设计
    • 作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。支持满足多样丰富表达
    • 提供简洁清晰的反馈
    • 处理潜在通用需求
    • 多个信息同时传递话术
    • 合理处理同音词
    • 合理处理同义词
    • 重要信息二次确认
    • 记录用户重要信息
    • 覆盖所有分支
    • 无响应主动退出
    • 结束时汇总反馈
  • 技能发布上线
    • 技能服务稳定可靠
    • 技能信息有标识度
    • 技能描述简洁易懂

蓝牙设备可以像 WiFi 设备一样具备语音交互的能力,这是非常有意义的事情。

随着对话式智能硬件的蓬勃发展,现已逐步形成了以对话式AI交互为核心,以触控操作和屏幕展现为辅助的多模多态的人工智能交互模式。

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。技能场景定义

-shenzhenware-

7月4日,百度AI开发者大会上,百度正式发布DuerOS
3.0,具备划时代的自然对话交互、全新对话式内容服务生态、打通商业模式闭环三大要素。李彦宏认为,AI技术必将改变生活的方方面面,人机交互方式正面临巨大变革。

技能功能独立清晰

一个技能应该有独立且明确清晰的场景,避免一个技能面向的场景模糊或者同时支持多个功能场景。

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。反面示例

单一技能“小白电话”,同时具备电话号码归属地查询、电话丢失拨打、电话缴费、电话订外卖、电话订机票等多个功能。

正面示例

拆分为多个独立技能:“小白电话缴费”、“小白手机”、“小白外卖”。

2017 年,伴随人工智能音箱行业的火热,基于 AI
的语音交互也正逐渐改变人机交互的方式。同时,集语音技术以及内容、服务生态的语音平台应运而生,这些语音平台大多背靠互联网巨头、AI
公司,试图发展成为「AI 时代的安卓」。

与此同时,智能语音开发者正迎来AI「淘金」大潮。

技能风格设计

对于这些的公司而言,除了 AI
技术和内容闭环服务打通,他们更注重将技术、应用落地到产品,带给用户价值,这样才能反过来促进技术的进步,繁荣生态。

DuerOS
3.0为了给开发者创造平等赋能的生态环境,公布了「亿元开发支持计划」,并同时发布对话式AI技能大赛。

礼貌友好

必须严格避免技能中出现任何暴力、色情、反动或者不礼貌的内容。

作为国内最繁荣的语音 AI 生态,百度 DuerOS
在产品落地方面有不少领先的成果。在最近由深圳湾主办的「ON THE GO:随行 AI
场景的产品创新」峰会上,来自百度智能生活事业群组的刘悦发表了主题为《百度在对话式人工智能上的创新探索》。

此次,百度设立100万开发激励(75万现金+25万奖品),邀请开发者使用「DuerOS技能开放平台」,针对以「小度在家」和「小度音箱」为代表的搭载了DuerOS系统的智能硬件,开发对话式技能。

真实可靠

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。必须严格保证技能提供的所有内容均真实、准确、可靠。

以下为演讲实录,内容经深圳湾整理和编辑。

图片 3

技能话术设计

人机交互发展:从人理解机器到机器理解人

自定义对话式:无限可能,任你发挥

简洁自然

在自然易懂的前提下,应该尽可能的提炼出简洁的技能话术。可以尝试大声并多次重复朗读你的技能话术,直到能够一口气流畅通顺地完成朗读。若表达信息过多,可尝试将话术拆解细分为多轮对话表达。

反面示例

用户:打开小白手机,我的手机不见了
技能:感谢你使用小白手机,当前技能可以通过拨打你的电话的方式快速找到你的手机,你可以直接对我说你的电话号码,请问你的电话号码是多少?

正面示例

用户:打开小白手机,我的手机不见了
技能:请说你的电话号码

每一次人机交互的迭代都在推动着时代和产品的发展。

内容资源播报:丰富资源,即刻点播

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。直白易懂

技能中的话术应该使用日常直白通用的表达方式,避免使用缩略词或生僻词汇,例如“未”、“勿”,应替换为更易于理解的“没有”、“不要”等。

反面示例

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。用户:订大杯不加糖拿铁
作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。技能:现未营业暂无卖售,请勿下单

正面示例

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。用户:订大杯不加糖拿铁
技能:当前时段店铺没有营业,请于早上10点后再下单

我们简单回顾一下人机交互发展经历的三个阶段:第一阶段的 PC
时代,以鼠标和键盘的交互方式促进了 PC
设备发展,相关软件也应运而生。第二阶段的触屏时代,从过去的鼠标、键盘到触控手机,使得硬件的使用成本极大的降低。第三阶段,也就是目前,语音对话的人机交互方式的发展,使得我们理解机器成本进一步降低。

智能家居控制:科技生活,家居成精

丰富多变

用户可能会多次进入技能,在保持话术简洁直白的同时,可以通过丰富话术和功能的多样性,使技能更加生动人性化。

正面示例

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。用户:打开今日美食推荐
话术1:今天将推荐给你好吃不贵的美食…
话术2:为你推荐健康又好吃的…
话术3:今天天气炎热,适合…
话术4:今晚就是平安夜,最棒的美食是…

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。从人理解机器到机器理解人的交互方式的改变,催生了智能音箱、智能大屏设备、智能可穿戴设备、智能车载等设备的发展。

图片 4

技能引导设计

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。基于语音对话的人工智能产业已经全面爆发

DuerOS对话式技能,为智能设备提供了无限可能性。DuerOS技能开放平台为开发者提供了全套的对话式技能开发工具。开放的协议和技术文档,配套教学视频和开发论坛,让初学者也能快速上手。

欢迎引导

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。在用户打开技能的开始阶段,可以有简洁欢迎或技能简介,同时有友好的引导,让用户能够清晰地知道接下来应该怎样与你的技能进行交流。

反面示例

技能:欢迎来到小白声音,我可以为你播放打雷的声音、下雨的声音以及各种其他环境的背景音,你之前听过下雨的声音,可以告诉我现在你想听的声音,例如对我说播放海浪的声音即可进行播放海浪的声音

正面示例

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。技能:欢迎来到小白声音,可以为你播放海浪、下雨等环境背景音,请对我说你想要播放的背景音

若你的技能为需求明确且一轮交互即可满足的即用即走类型的技能,用户打开时可以省去欢迎和引导,直接回答以满足用户的问询。

反面示例

用户:打开历史上的今天
技能:欢迎使用历史上的今天,在这里你可以了解到历史上的今天发生了什么重大事件,你可以对我说今天发生了什么。

正面示例

用户:打开历史上的今天
技能:2006年的今天,美国灵魂乐歌手詹姆斯·布朗逝世。

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。从国外的市场来看,亚马逊
、Google、苹果、微软以及许多创业型的公司加入到这场智能化的变革当中,他们的竞争已经进入白热化阶段,并推动整个市场和产业的发展。

图片 5

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。提供明确简洁且受限的选项

需要用户进行回答时,应该给到非常清晰简洁且范围受限的回答范围,以避免用户进行开放式回答。如果是进行选项引导时,应该严格控制选项内容及数量。

反面示例

技能:欢迎来到奇幻探险…请问接下来你将想要走那条路径?

正面示例

技能:欢迎来到奇幻探险…一共有三条路供你选择,分别是:花园、森林、古堡,请选择你要去的路径

回过头来看,国内的市场情况也跟国外非常像。我们预测,2020
年,对话式人工智能在各个场景上的渗透将大幅度增加:智能家居、智能车载、智能可穿戴。

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。在开发者大会上,12岁的袁翊闳的故事让人们真切感受到DuerOS平等赋能的魅力。这个来自广东中山,对计算机编程有着浓厚兴趣的小开发者在接触到DuerOS后,自学并使用平台,设计了「看图猜成语」等对话式AI技能,获得了人生的第一笔收益。

多轮对话中的友好引导

  • 句尾引导:多轮对话中,技能播报话术末尾必须包含明确的问询或者引导,告知用户接下来的多轮应该怎样与技能交互。

反面示例

用户:我的手机不见了
技能:好的,你可以通过我来找到你的手机

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。正面示例

用户:我的手机不见了
技能:好的,请说你的电话号码

  • 多次问询引导:当用户的回复没有命中意图时,应该明确告知用户没有理解,并且进行更清晰明确的引导话术。

反面示例

作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。用户:我的手机不见了
作为国内最繁荣的语音 AI 生态,并同时发布对话式AI技能大赛。技能:好的,请说你的电话号码
用户:还行还行
技能:请说你的电话号码

正面示例

用户:我的手机不见了
技能:好的,请说你的电话号码
用户:还行还行
技能:没有理解,请依次说出电话号码数字

  • 多次未命中的退出引导:当用户连续多次回复没有命中意图时,在告知没有理解并且进行更清晰引导的同时,需要明确告知用户应该怎样退出技能或主动为用户退出当前技能。

反面示例

用户:我的手机不见了
技能:好的,请说你的电话号码
用户:还行还行
技能:请说你的电话号码
用户:还行还行
技能:请说你的电话号码

正面示例

用户:我的手机不见了
技能:好的,请说你的电话号码
用户:还行还行
技能:没有理解,请依次说出电话号码数字
用户:还行还行
技能:没有理解,你可以表达退出来关闭当前技能。请依次说出电话号码数字,以便于查找你的手机

图片 6

截止2018年8月,搭载DuerOS的智能设备激活数量突破一亿大关,成为中国首个达到亿级装机量的对话式人工智能操作系统。DuerOS平台合作伙伴数量已经超过200家,搭载DuerOS的主控设备超过110多款。

技能满足设计

中国市场的潜力非常巨大,我们发现,目前有非常多的音箱、大屏设备、穿戴设备、耳机等设备都在变成一个可人机自然对话的智能设备,基于语音对话的人工智能产业已经全面爆发。

使用技能平台开发并成功上线的技能,将可通过小度技能商店在所有搭载DuerOS的智能设备上生效,触达海量的AI设备用户,用户则可通过自然的对话交互,调启丰富的娱乐及服务能力。开发者则有机会通过付费技能、技能内付费等方式获取收益。

支持满足多样丰富表达

尽可能穷举用户可能的多样的口语化表达方式,并对此进行满足。

反面示例

用户1:帮我找手机
技能:好的,请说你的电话号码

用户2:我的手机不见了
技能:不能理解

用户3:拨打一下我的电话
技能:不能理解

正面示例

用户1:帮我找手机
技能:好的,请说你的电话号码

用户2:我的手机不见了
技能:好的,请说你的电话号码

用户3:拨打一下我的电话
技能:好的,请说你的电话号码

小度自诞生以来取得的成绩

!划重点!

提供简洁清晰的反馈

可以通过“好的”、“收到”、“谢谢”等简洁的反馈话术,来告知用户已经收到并且理解了用户表达。

反面示例

技能:请问出发城市是北京吗
用户:是的
技能:请说目的地城市
用户:上海
技能:请说起飞日期

正面示例

技能:请问出发城市是北京吗
用户:是的
技能:好的,请说目的地城市
用户:上海
技能:收到,请说起飞日期

百度在 2015 年的时候发布了第一款

100万激励,校招绿色通道

处理潜在通用需求

需要考虑技能内各个场景下的潜在通用表达需求,示例通用表达场景:

  • 在等待用户回答选项时,应该能够友好处理用户的回放需求,例如“再说一遍”、“我没听清”等等。
  • 游戏类技能应该能够满足用户的常见帮助需求,例如“我该做什么”、“你能做什么”、“这个怎么玩”等等。
  • 在游戏技能开头播放复杂的玩法介绍时,应该能友好处理用户多次使用后的跳过需求,例如“跳过”、“跳过介绍”等等。

反面示例1

技能:欢迎来到奇幻探险…一共有三条路供你选择,分别是:花园、森林、古堡,请选择你要去的路径
用户:再说一遍
技能:对不起,不能理解

正面示例1

技能:欢迎来到奇幻探险…一共有三条路供你选择,分别是:花园、森林、古堡,请选择你要去的路径
用户:再说一遍
技能:好的,请选择你要去的路径,分别是:花园、森林、古堡

反面示例2

技能:欢迎来到奇幻探险,在这里,你可以…
用户:这个游戏怎么玩
技能:对不起,不能理解

正面示例2

技能:欢迎来到奇幻探险,在这里,你可以…
用户:这个游戏怎么玩
技能:你可以对我说…

小度产品

报名零门槛,云服务器补贴

多个信息同时传递话术

应该尽可能避免同时传递多个信息。当必须要传递时,应该在多个信息之间通过“第一步”、“第二步”、“首先”、“然后”、“最后”等简洁的序列话术,使用户更自然轻松的理解。

反面示例

用户:打开小白食谱,蛋炒饭怎么做
技能:将辣椒和火腿肠切丁,鸡蛋打散,倒入米饭并均匀搅拌,锅内放油,热后转中火并将米饭倒入,筷子搅拌至米饭颗粒分明。

正面示例

用户:打开小白食谱,蛋炒饭怎么做
技能:首先,将辣椒和火腿肠切丁。第二步,鸡蛋打散,倒入米饭并均匀搅拌。第三步,锅内放油,热后转中火并将米饭倒入。最后,筷子搅拌至米饭颗粒分明。

,从那时候我们开始尝试和探索如何做一款这样的产品。至今,小度助手已经成为中国市场最繁荣的语音
AI 生态。

技术全开放,配套教学资料

合理处理同音词

对话式交互可能会出现同音词,需要合理处理同音词问题,以避免理解歧义。

反面示例

技能:请说你的城市
用户:fuzhou
技能:福州市当前..

正面示例

技能:请说你的城市
用户:fuzhou
技能:请问是福建省的福州市还是江西省的抚州市?
用户:江西省的抚州市
技能:抚州市当前..

在 2016、2017
年,我们更多的持「生态赋能」的思路,不断跟业界的其他硬件公司合作,包括音箱企业、电视企业、汽车企业、手表企业、耳机企业、手机企业等。我们把
AI 能力赋予不同场景下不同的硬件,让这些硬件成为可语音交互的设备。

百万奖金,来者有份

合理处理同义词

通过满足常用名称的同义词,将会满足用户更加自由的表达,以获得超出预期的
用户体验。

反面示例

用户:打开芒果台
技能:对不起,不能理解

正面示例

用户:打开芒果台
技能:已为你切换到湖南卫视

2018 年,我们统计了搭载小度助手设备的激活数:从年初的 5000 万涨到 2018
年年底的 2
亿,至今这个数字还在不断提升。当然,激活数据并不能代表这个生态已经达到繁荣,只能从一个侧面反映了搭载的能力。而这样的能力是否真正被用户使用,以及用户是否接受我们给他的新交互方式?

图片 7

重要信息二次确认

因为可能缺少视觉辅助,重要信息或通过对话表达易于出错的信息应该进行二次确认以保证信息正确。

反面示例

用户:我的手机不见了
技能:好的,请说你的电话号码
用户:188xxxx2958
技能:正在为你拨打。

正面示例

用户:我的手机不见了
技能:好的,请说你的电话号码
用户:188xxxx2958
技能:请问是要找188xxxx2958的手机吗。
用户:是的
技能:正在为你拨打。
(*说明:电话号码数字较长且信息关键,在用户表达后,应该进行二次确认)

图片 8

百度为这大赛,可谓下了血本

记录用户重要信息

可通过记录用户之前表达的重要信息,例如技能功能相关信息、游戏进度等,以降低用户的交互成本,并传递友好贴心的使用体验。

反面示例

用户(第二次使用):我的手机不见了
技能:好的,请说你的电话号码
用户:188xxxx2958
技能:请问是要找188xxxx2958的手机吗。
用户:是的
技能:正在为你拨打。

正面示例

用户(第二次使用):我的手机不见了
技能:请问是要找尾号2958的手机吗
用户:是的
技能:正在为你拨打。
(*说明:通过记录用户上次使用的电话号码,避免用户二次输入)

实际上,我们也会非常兴奋地看到,从语音交互次数来看,用户的接受程度也在不断提升。从
2018 年 3 月到 2018
年年底,我们通过月语音交互次数的指标来反映用户交互频率,从最开始的 2
亿次到达去年年底的 16 亿次,这个数字至今还在持续上升,并且速度非常迅速。

75万元现金+25万奖品

覆盖所有分支

除了能覆盖用户最常用的表达外,也需要尽可能周全完善地设计技能场景范围内所有可能遇到的分支流程,并给到对应的满足策略。

反面示例

用户:我的手机不见了
技能:请问是要找尾号2958的手机吗
用户:我要拨打188xxxx2978
技能:对不起,不能理解,请问是要找尾号2958的手机吗

正面示例

用户:我的手机不见了
技能:请问是要找尾号2958的手机吗
用户:我要拨打188xxxx2978
技能:好的,请问是要找188xxxx2978的手机吗。
(*说明:当前场景下,用户最常用的表达可能)

图片 9

最高单项奖20万现金

无响应主动退出

多轮对话中,用户面对问询或者引导无任何响应连续超过2次时,建议应该主动退出技能并告知用户已主动退出。

反面示例

用户:我的手机不见了
技能:好的,请说你的电话号码
用户:(无响应)
技能:请说你的电话号码
用户:(无响应)
技能:请说你的电话号码

正面示例

用户:我的手机不见了
技能:好的,请说你的电话号码
用户:(无响应)
技能:没有听清,需要依次说出电话号码数字,以便于查找你的手机
用户:(无响应)
技能:已退出小白手机,欢迎再次使用

从这两方面看来,小度已经变成了中国最繁荣的对话式人工智能平台。

更有小度在家、小度音箱等实物奖品

结束时汇总反馈

在多次信息问询完成后,结束时应该汇总用户在各轮回答的信息字段并反馈告知用户确认。

反面示例

技能:请问出发城市是北京吗
用户:是的
技能:好的,请说目的地城市
用户:上海
技能:收到,请说起飞日期
用户:2月16日
技能:好的,请说起飞时段
用户:17点之后
技能:好的,为你找到…

正面示例

技能:请问出发城市是北京吗
用户:是的
技能:好的,请说目的地城市
用户:上海
技能:收到,请说起飞日期
用户:2月16日
技能:好的,请说起飞时段
用户:17点之后
技能:请问你要预订的是2月16日、17点之后、从北京飞往上海的航班吗
用户:对
技能:好的,为你找到…

这里面有另外两个指标,我也想分享给大家,一个是语音技能数量,目前小度已经有上千个各式各样的语音技能,我们自己只能做一些头部的技能,更多长尾的技能需要开发者不断提供,这些技能绝大部分都来自于我们社区当中对这方面感兴趣的开发者,使得生态变得更加健康和更加活跃。

图片 10

技能发布上线

图片 11

多样技能类型,多层奖项激励,多种评奖方向。

技能服务稳定可靠

应该严格保证技能的后端服务稳定可靠,快速响应用户请求,达到用户良好的使用预期。

另外,根据 Strategy Analytics 的统计,2018
年第四季度,小度系列智能设备的出货量提升到中国第二,增长率达到了全球第一,增势非常迅猛。从现在来看,小度逐渐进入千家万户,成为用户贴心可靠的助手,这也是百度在做对话式人工智能方面的理念和终极目标。

无论是企业还是个人,每位选手都能发挥自己的创造力

技能信息有标识度

通过定义清晰独立而有差异化的技能功能、选择不易于混淆的技能调用名称等技能信息,让用户在众多技能中能快速的区分出你的技能并乐于选择使用。

小度的产品发展经历

报名低门槛,校招新通道

技能描述简洁易懂

尽可能完善技能的描述信息,也可以在描述信息中提供更多技能内的常用表达示例,为用户快速了解技能功能。

我们经历了从开始发布产品,到后面不断给第三方赋能,一直到后面自研硬件,一路走下来的过程。

这次大赛报名方式,主要是以线上报名的形式为主,

图片 12

不管你是在校学生、还是技术神宅

百度对话式人工智能的创新一:蓝牙语音解决方案

亦或是企业大牛均可参与其中

接下来讲一讲百度在对话式人工智能所做的创新。除了大家熟悉的无屏音箱、带屏智能音箱,我们还在其他方向做了探索,今天借这个机会给大家来简单分享。

特别提醒在校的同学们,顺利通过初赛

第一个是蓝牙设备。面对各种各样的蓝牙设备,我们萌生出了给这些蓝牙设备赋能的想法——使得蓝牙设备可以像
WiFi 设备一样具备语音交互的能力,这是非常有意义的事情。

还有机会获得百度2019校招绿色通道

我们首先来看一下蓝牙设备的趋势:根据 SIG 的调查,截止到 2022
年,整个蓝牙设备全球铺货量达到 8.8
亿台。这意味着有很多蓝牙设备等待着我们去升级,对话式 AI
技术将对传统的蓝牙市场带来新的机遇。

业内前沿的人工智能技术、领先的福利待遇、扁平的公司文化,快速的事业提升曲线都在等着你!

图片 13

学习新机遇,技术全开放

从场景上来看,蓝牙设备也存在许多痛点。我们主要总结了三个场景,一个是家中,一个是路上,一个是在车内。在家中,智能音箱既支持
WiFi
又支持蓝牙,可进行语音交互。在路上有穿戴设备和智能耳机,苹果前不久发布第二代
AirPods 支持了 Siri
语音唤醒。第三个场景是车内,人在开车的时候双手被限制在方向盘上,这时候语音交互就会变成非常自然的交互方式。

为了让小白也能快速上手,

图片 14

百度开放了技术文档,

基于这三个场景,我们怎么帮助用户提升他的体验,怎么帮助设备商更好地提升产品呢?这就是我们之前半年到一年时间探索当中希望解决的问题。

并配套教学视频,

小度蓝牙解决方案

让起步较晚、甚至是零基础的参赛者

在 2018 年 7
月的百度开发者大会上,百度在国内率先提出了蓝牙设备的语音解决方案——DMA
蓝牙解决方案。在 11 月的百度世界大会上,我们发布了第一款基于 DMA
蓝牙协议的车载支架,这也是我们在车载场景上基于蓝牙解决方案做的实践产品。这个产品并不希望搅乱市场,我们更多是想告诉其他相关的厂商,这样的一个方案是
work 的、是被用户买账的。

也能有自己原创开发的机会

图片 15

那如何入门学习?

同时,因为精力有限,我们也不希望完全自己来做所有语音蓝牙设备,而是希望把蓝牙合作方案输出给更多合作伙伴,让大家打造出具备智能对话能力的蓝牙设备。


平台教学资料:登录技能开放平台,查看技术文档 &
视频教学;

而做这件事情的时候,会给厂商带来一系列的问题,比如:


产品技术支持:在DuerOS开发论坛、技术导航反馈技术问题;

用户是否有需求?对这样的产品感兴趣吗?


线上直播课程:DuerOS为参赛开发者量身打造系列直播课程,内容涵盖:人工智能行业趋势、DuerOS市场发展、小度技能平台的概念及意义以及技能平台的使用方法演示等;

是否会增加很大的生产成本?


线下Workshop开发演练:为了让参赛选手们快速上手DuerOS技能开放平台,开发出有趣有用的技能。百度将在上海(9月13日)、南京(9月14日)举办线下技术沙龙巡讲,DuerOS唤醒之旅Workshop——「对话式AI技能」前沿探索与开发演练。

AI 技术接入门槛高吗?是否需要投入很多人力和周期?

大赛交流群

有成型的方案帮助我们落地吗?

还等什么呢?

语音能力、NLP 打包在方案中吗?

百度DuerOS,邀你一同

可以给用户提供哪些内容资源?是否收费?

唤醒万物,无限可能

图片 16

图片 17返回搜狐,查看更多

实际中,我们对这些问题也进行了研究和探讨:

责任编辑:

小度的装机量、活跃度,以及小度车载支架的热卖,从市场角度印证了,用户对这个产品有非常大的刚需。

产品的功能方面,我们在小度蓝牙方案上基于不同的场景做深度的打磨,比如车载支架相应的车载场景,刚需的内容就包括娱乐、导航、接打电话,针对这些场景深度打磨的产品都会在小度
APP 上得以体现。

针对技术门槛,我们也做了很多优化,提供 SDK
的开发套件,把研发的门槛降到非常低。

图片 18

DMA
整套方案是免费的一体化解决方案,包括语音技术、背后的内容资源和开放生态,以及第三方技能。

关于小度蓝牙的解决方案

接下来是具体的方案介绍,小度蓝牙的解决方案主要包含两部分,一个是小度
APP,第二个是 DMA 协议。DMA 协议的主要作用是帮助蓝牙硬件和手机上的 APP
之间进行对话式交互通讯。

图片 19

通过我们提供的 DMA SDK,可以快速把 AI
移植到蓝牙设备,让数以千万的蓝牙设备瞬间变成可以对话的人工智能设备。

当这些蓝牙设备有了语音交互的能力,就能够让用户通过语音交互获取小度云端的内容,包括听音乐、有声节目、导航、控制家居等等。

图片 20

小度的 DMA
语音解决方案有效解决了经典蓝牙协议的以下痛点:触碰和按键触发、语音输入延时明显、APP
之间的串扰和抢占等。

DMA
解决方案的语音交互不需要触发按钮,并针对远场的语音交互做了非常多的优化,在车内复杂的环境下,唤醒率达到了
97% 以上;DMA 解决方案的 BLE/RFCOMM 通道和 A2DP 可以同时使用,延时从
500ms-2000ms 下降到 200ms-300ms,不影响占用录音通道的 App。

图片 21

百度对话式人工智能的创新二:大屏交互

今天还会跟大家分享我们另外一个在做的创新探索,即大屏体验。

「让用户放下遥控器」是我们做大屏探索时给自己设定的一个目标。针对找不到遥控器、找片很费劲、音质不理想的几大痛点,我们做了小度电视伴侣这样一个设备,它有很好的
Hi-Fi
音质,全语音远场交互,和全天候人工智能助手,这个产品最终的销量也远高于我们的预期。

图片 22

在小度电视伴侣,我们专门设计的小度智能电视 UI
可以告诉用户,放下遥控器、试着通过语音来跟这个设备进行交互;

图片 23

我们还创造了「大屏信息流」的概念,把好的内容通过信息流呈现,并通过语音交互做定制化的推送;

图片 24

同时,这一设备的整套系统全面接入了小度语音助手,使得语音无处不在,它开机时就是智能电视,关上之后就变成智能音箱,语音交互一直在线……

针对电视上 APP 应用安装麻烦的痛点,小度电视伴侣搭载了 DuerOS
的语音技能,不需要安装,只需一句话就可以调用。

图片 25

我们希望在后续中不断探索人机交互,以及人工智能如何赋能不同场景的智能硬件,希望对话式硬件被更多人使用。

微信号:shenzhenware

整理、编辑:大林/ 深圳湾

审校:森林木/ 深圳湾

/////////////

{“type”:2,”value”:”