aizixun8 发表于 2024-12-25 09:50:09

美团推出语音交互新功能,助力盲人群体享受无障碍外卖服务

“一个服务14亿人的产品,必须从服务好一小部分人开始。”

10月15日,第36个国际盲人日,美团APP为盲人推出全新语音交互功能:美团盲人语音定制应用——点击美团APP搜索入口处的麦克风,即可说出无障碍外卖、用户可以通过语音交互完成一系列动作,包括选择餐厅、菜品、支付订单甚至售后。

为了推出这一新功能,美团于10月14日在北京798公园召开了媒体沟通会。

发布会上,中国盲人协会会长李庆忠感叹,中国有1700万盲人,但很少有人能充分享受到互联网产品带来的好处。通过与美团的合作,给盲人的生活方式带来了巨大的改变。 “这对于盲人群体来说已经是一个巨大的改变了。”

没有多少公司愿意为弱势群体量身定制产品。微软此前开发了专门为盲人玩的Xbox游戏机,苹果专门为盲人开发了iOS系统……在本地生活服务领域,美团是第一家为盲人定制语音应用的公司。瞎的。

美团语音平台负责人蔡训良图 |美团

据美团语音平台负责人蔡训亮介绍,早在2017年美团语音平台成立时,工程师就提出要开发针对盲人群体的特定版本。今年6月,美团与中国盲人协会正式达成合作后,为盲人定制语音交互应用的开发很快就被提上了团队的议程。

“语音点外卖”听起来很简单,但其中涉及的多轮语音对话技术和复杂的场景语义识别是业界公认的问题。美团首席科学家张金茂笑称,如果用户问Siri:你多大了?它可以机智地说:对不起,这是一个秘密。但在美团这个直接关系到用户吃喝住行日常生活的平台上,如果用户问最好的餐厅是什么,平台如果太聪明或者不够聪明,是不会被用户接受的。知道。

美团语音平台有自己的底气。在向盲人提供这一新功能之前,团队已经覆盖了公司内部30多个需要语音对话的技术场景,涵盖了美团的各个业务线,包括骑手语音播报、客服处理、酒店和店内业务等。语音团队每天需要处理包括识别、合成在内的50万小时的语音需求。

同时,为盲人提供这样的应用也是美团不断优化技术能力的一个实际场景。

美团联合创始人、高级副总裁王慧文表示,当一项新技术出现时,它可能还没有那么成熟,体验也可能没有那么好。但如果部分用户的需求能够通过这个技术得到满足,那么这种情况下,实现价值、落实这些用户需求的最好方式就是服务好他们。随着技术越来越成熟,它能够服务的人群会越来越大,这也符合美团“帮助每个人吃得更好、生活得更好”的初心使命。

从“解决一部分人的问题”到“为所有人提供更好的体验”,是美团作为一家科技公司解决问题的新方式。它提供的社会价值超越了“给予爱”。从长远来看,这种新思维应该成为所有科技公司产品思维中不可或缺的一部分。

六倍速音效,“刚刚好”

盲人需要外卖吗?答案是肯定的。

美团针对盲人群体的调查报告显示,87%的视障人士使用过外卖服务,70%的受访者表示手机点外卖是他们最常用的外卖方式。近40%的受访者甚至指出,外卖现在是他们满足一日三餐的最重要方式之一。

如何用手机点外卖并不是一件简单的事情。对于盲人来说,过去使用智能手机的主要方式是屏幕阅读软件。这对于听新闻或者获取信息来说并不困难,但是对于点外卖等复杂场景就不太友好了。获得生活服务的过程并不是简单的问答,而是涉及到多重选择和互动,以及最终的支付。对于盲人来说,通过触摸屏幕来完成整个交互链是非常困难的。

例如,弹出红包的目的是给用户带来好处,但盲人使用时关闭一个小的浮动弹出窗口已经很困难。即使你能听到关门的通知,但要在大屏幕上找到一个小十字也不容易。同样,在订购过程中,有很多关键操作都是通过按钮来完成的,比如选择数量、选择规格等,而这些按钮通常都很小,盲人使用起来非常困难。

对于盲人来说,红包弹窗是一个影响操作的设置。

https://img2.baidu.com/it/u=4006499085,1968083447&fm=253&fmt=JPEG&app=120&f=JPEG?w=444&h=1108

而“语音+生活服务”则是帮助盲人“解放眼睛”的更好方式。为了解决这些问题,美团语音平台重新设计了产品,为盲人定制语音应用。自8月初项目立项以来,蔡循亮带领团队多次与中国盲人协会进行沟通。同时,他多次深入一线盲人群体调研,了解盲人的真实需求是什么。

当天发布会的视频中,用户激活无障碍点餐外卖功能后,平台可以准确识别盲人用户的菜名、商户名称、口味或点餐历史等含义,并为用户提供帮助。反应近乎完美。而且,美团App会根据过去的使用记录智能匹配用户的地址,无需用户重复输入和编辑。

顺利运作流程的背后,蔡训良团队做出了诸多调整。其中,简化语音对话操作流程是基于盲人群体的需求而做出的最大改变。

在这次专项应用中,美团语音团队将整个应用核心功能区的信息卡片做成一张大卡片,并通过快捷按钮快速向下滚动或返回,使得信息展示更加完整。通过长按App底部的点餐功能,用户可以根据语音指令选择餐厅菜品,并完成选菜、加减、支付等一系列动作。

在简化操作的同时,他们也听到了盲人的一些“意想不到”的需求。例如,很多盲人告诉蔡循亮,他们想讲得更快,因为盲人的听力一般都比较好。

对此,蔡训亮还对这些系统进行了调整,做了五种可调语速设置。最快是正常语速的6倍。蔡训亮表示,他们调查的一些盲人对“六倍速”特别满意,并表示“刚刚好”。

此外,在研究过程中,蔡循亮还发现盲人用户对科技互联网产品的需求远远超出了他的想象。例如,一些盲人问他们是否可以使用智能音箱点餐,或者是否可以通过语音叫出租车。也有盲人问:“你能给我一个个性化的推荐吗?”

对于这些需求,张金茂在14日的发布会上代表美团做出了回应。未来,通过美团APP上的语音,用户还可以完成寻找餐厅、打车去餐厅等跨域交互。在一些汽车和音箱上,已经可以通过语音交互获得生活服务,个性化推荐将是未来要推广的重要功能点之一。

小麦克风背后的“大”挑战

除了输入方式和播音速度之外,小麦克风背后的挑战也不小。以现有技术,机器将语音转换为文本并不困难,但如何准确理解这些文字背后的需求是一个非常复杂的问题。

进入美团App,点击语音指令即可轻松点外卖,即可体验语音点餐。

例如,当用户说他的地址在朝阳时,机器能否理解朝阳是北京市区还是辽宁城市?如果用户说要去最近的海底捞,系统如何匹配距离用户最近的餐厅呢?即使用户说,我想吃点辣的,系统如何匹配餐厅也是一个问题。

美团语音平台团队背后最现实的问题,被张金茂和蔡训良归咎于技术水平。其中最关键的技术问题是多轮对话技术、语音识别与理解、对话技术、知识图谱和大数据技术支撑。从直观上看,这项技术需要解决的问题是如何让系统理解不同人嘴里的“朝阳”、“最近”、“辣”的含义。

从定制应用的体验来看,虽然需要大量的语义识别和LBS匹配功能,但这个语音平台在服务水平上已经很成熟。

但美团语音平台花了两年时间才走到这一步。

2017年,作为语音平台的核心成员,蔡循亮在与公司管理层讨论建立语音平台时,确立了美团语音平台的定位:“让每个人获得像说话一样简单的生活服务”——用户只需要您需要说出您的需求,美团可以准确理解并匹配这些需求。

美团作为中国领先的本地生活服务平台之一,既有需求,也有信心。

对于美团来说,用户数据安全是其自研语音平台的首要考虑因素。 “如果你在这件事上与第三方合作,你将面临很多数据障碍,比如隐私障碍。”

作为一名在语音领域摸爬滚打十几年的技术人员,蔡循亮认为,无论是数据积累还是技术积累,美团都是最能理解用户需求并从用户角度提供最合适响应的公司。系统动作。

不过,虽然内心认识到语音平台的意义,蔡循亮却一度感到灰心。

美团一直鼓励创新,但同时很多新业务“开得快,关得也快”。与同类人工智能技术相比,语音训练比文本和图片处理成本更高,而且市场上的人才较少。这意味着一旦你开始做,这将是一项长期且巨大的投资。 “这件事没有捷径。”

https://img2.baidu.com/it/u=71122153,220554244&fm=253&fmt=JPEG&app=138&f=PNG?w=1024&h=438

他的纠缠并没有持续多久,管理层的肯定给了蔡循亮创业的支持。蔡循亮回忆,当他向王兴、王慧文等高管汇报工作进展时,他们的态度都是一样的:“这些都是我们要做的事情,一定要让它解决真正的问题。” 。

但如何结合公司的业务来做产品却不是一个简单的问题。以语音技术的核心——多轮对话技术为例。它的技术链条非常长——从AI语音识别到利用“知识图谱”等技术进行理解,再到在系统中寻找对应的位置和产品资源,最后输出反馈给用户。任何一步出现问题都会影响最终的输出。

图片|美团

为了解决这个问题,蔡循亮和他的团队在酒店、外卖包装等场景做了很多尝试。即使每天到了外卖时间,美团语音平台团队也会用手机“调音”产品。在蔡训良看来,每一项技术指标的优化都要反复打磨。 “没有捷径。”

两年时间,在没有任何大张旗鼓的情况下,美团内部的语音平台已经开始在30多家商家中发挥作用,逐渐取代了过去的第三方应用。

例如,美团客服使用的语音系统现在是由美团自己的语音团队开发的。过去,语音系统可以自动呼叫商家,但对于打不通的电话则毫无用处。使用蔡训亮团队开发的产品后,我们可以进一步分析无法接通的呼叫,筛选出空号和不在服务区域的呼叫,以便客服采取进一步行动。

“为了”

在组织层面,美团语音平台由美团联合创始人王慧文负责。在当天的发布会上,王慧文毫不犹豫地对盲人定制应用的推出表示肯定和赞扬。

在他看来,企业的价值一部分来自商业价值,另一部分来自社会价值。 “无论你生产什么产品,归根结底还是要看产品是否产生社会价值,是否让消费者满意。 ”

服务盲人群体也符合美团的使命。在他看来,服务14亿人的产品,首先要服务好少数人。 “吃、住”的使命背后,其实隐藏着“为”。

另一方面,从商业角度来看,投入公益也并非一无是处。从团体内部应用走向公益,不仅对盲人群体意义重大,也是美团语音平台迈出的重要一步。产品经理出身的王慧文认为,用户必须使用产品才能了解产品的问题并做出改进。所以找到一个好的落地场景就变得至关重要了。

谈到打造语音平台,王慧文并不急于带来立竿见影的商业回报。技术的发展要尊重客观规律,需要长期、耐心的投入。

事实上,大多数人只看到了美团对其产品的“试水”,却忽略了美团对指向未来的底层技术的投入和积累。

与语音平台类似的是美团的自动驾驶汽车研发团队。 2016年,现任美团无人配送部总经理(兼时任外卖总架构师)的夏华夏注意到了自动驾驶技术的发展。经过观察,他得出结论,这项技术可以为外卖业务带来很大帮助。

美团无人配送车|美团

和语音平台一样,在外界看来,自动驾驶技术落地还需要很多年的时间,而美团不一定需要自己去做。但夏华夏与管理层沟通了自己的想法后,很快就得到了集团的支持。到2018年,美团无人配送团队已经发展到100多人的团队,并且是一个独立的部门,甚至在组织架构上与外卖事业部平行。

在技​​术迭代方面,美团有自己清晰的方法论。 “长期耐心”是这家公司的重要文化,尤其是在长期技术布局方面。利用长期合适的资源专注于更有效的场景,是王慧文认为更适合底层技术的一种方式。当一项新技术刚出现时,由于技术成熟度和体验表现的问题,很多用户会因为不够好而忽视它的价值——“有些人高估了一年的变化,低估了五年的变化。十年变迁。”

王慧文认为,随着技术的成熟,未来不能使用手机的老人甚至孩子也可以使用语音来实现各种服务。 “最终,你会用它,我也会。”
页: [1]
查看完整版本: 美团推出语音交互新功能,助力盲人群体享受无障碍外卖服务