人工智能和机器学习如今以超出我们想象的方式影响着我们的生活,但如果这些技术中有一个特别具体、无处不在的例子,那就是你的智能手机、智能音箱、平板电脑和电脑中的数字助手。无论你说“嘿,谷歌”,“嘿,Siri”,还是“Alexa”,你都在召唤一套先进的人工智能和ML工具,用来听你说话,理解你,做你想做的事情。
这些数字助理没有一个是完美的,即使经过多年与人的互动,他们今年都有一些重要的问题要解决。本周,三位VentureBeat的作者聚焦于他们最常使用的数字助理的10个重要问题。周三,我们关注了谷歌的助手,Siri今天跟进,亚马逊的Alexa明天跟进。我们希望你喜欢这三篇文章。
苹果(Apple)的数字助理Siri在几乎所有可能的指标上都经历了艰难的2018年。它是HomePod智能音箱的标志性但最弱的功能,经历了苹果内部领导层的洗牌和退场,在执行一些最基本的功能时变得更加不可靠。当苹果公司(Apple)表示,它正在雇人帮助高管了解Siri的问题,以便解决这些问题时,我最初的想法是“现在才开始?”严重吗?和“感谢上帝!”
从表面上看,Siri现在就像一列火车残骸,我可以用一句话写完整篇文章:把它扔掉,用别的东西完全替代它。它并没有达到苹果公司It“just works”的性能标准,如果它是一款即将发布的全新产品,显然需要更多的时间。
但苹果不会关闭Siri,并将其与其他软件进行交换。Siri是一项被广泛使用的服务,几乎与苹果所有的操作系统和设备都有关联。相反,这款助手将会被打补丁、修复和扩充,直到它工作得更好——这一过程从去年Siri的快捷方式就已经开始了,毫无疑问,今年还会继续进行额外的调整。
下面是我列出的苹果今年应该改进Siri的10个方法,即使我对其中任何一个都不抱太大希望。
去年7月,Loup Ventures发布了一项“数字助理智商测试”,声称通过看似严格的测试,智能手机上的Siri在99%的时间里都能听懂用户的问话,在78.5%的时间里都能正确回答。这低于谷歌Assistant(85.5%的正确率),但好于亚马逊(Amazon)的Alexa(61.4%)和微软(Microsoft)的Cortana(52.4%)。去年12月在HomePod上对Siri进行的测试也得出了类似的结果:理解能力99.6%,正确答案74.6%。
即使Loup的数字在现实世界中Siri的使用情况下是准确的,助理在四分之一的情况下也会给出不正确的答案。在一个通常认为苹果(以及大多数非苹果产品)的设备总是能正常工作的世界里,这是很糟糕的。经过8年多的开发,如果Siri理解了什么,它至少应该能够部分回答,如果不能完全回答,也应该能够正确回答。将部分答案算作正确答案,99%的正确答案率——100个答案中有一个错误答案——应该是可以实现的。
根据我的经验,Siri在过去一年中实际上走的是相反的方向。它过去能够处理的常见查询现在经常返回严重错误的结果,这使得使用“数字助理”变得毫无意义。看看Reddit的SiriFail讨论组,你就会知道为什么这是苹果需要解决的最大问题,而且马上就可以解决。
Siri迫切需要一个强大的“离线”模式,这样它就可以在连不上互联网的情况下做一些事情。当ipad、iPod touch和Apple watch超出了无线数据范围时,问题就会变得很糟糕,就连移动电话iphone也会出现这种情况,而且长时间完全失去Siri功能是很烦人的。
问题是,Siri几乎完全依赖远程服务器进行响应,这意味着它可以被互联网减慢速度——或暂停。至少,目前的每台苹果设备都有一个A8芯片和内存,所以它应该能够存储Siri的一部分功能,并能自己做一些事情。实际上,iPhone 3GS的语音控制功能就是这样开始的,而且在大约10年前,它在播放音乐、打电话和其他特定设备的基本功能上都惊人地可靠。
无论是放在一个房间里的扬声器,还是发给家人的iPad, Siri都将不可避免地由多人控制。不用说,与其他数字助理一样,Siri应该能够使用语音指纹来区分它们。
此外,Siri至少应该能够以基本的方式满足用户的个人需求。如果有要求,每个用户的声纹应该链接到一个单独的iCloud账户,这样Siri就可以根据一个人的电子邮件、联系人和其他数据提供正确的回复。这并不是说该设备需要存储用户的完整iCloud账户上的所有信息,只是说如果有人在问问题,Siri应该能够知道是谁在问问题,并暂时检索与请求相关的信息。
苹果在其《机器学习杂志》(Machine Learning Journal)中指出,它采取了令人印象深刻的措施,让HomePod的麦克风在几乎任何环境干扰下都能识别语音指令。在实践中,HomePod有能力接收超过整个房间以外的声音,即使附近有电视或其他音源——这种情况使得Echo和谷歌扬声器很难听到命令。
不幸的是,HomePod超强的听力让Siri非常烦人。如果你在HomePod的房间里对iPhone或iPad说“嘿Siri”——甚至是在另一个房间里——你可能会注意到HomePod拦截了原本要发送给其他设备的请求,而且可能无法正确地处理它。当HomePod坐在我的办公桌上时,我经常遇到这个问题,对此我并不感到完全意外。但后来,当我把扬声器移到我的家庭房间时,它在两个房间之外接收了我的声音,我发现自己的嘴巴都松了。
让用户为给定的设备重命名Siri可以解决这个问题,还可以让用户调整设备上Siri的灵敏度(增益控制),这样Siri就不会在不想要的半径范围内工作。这在homepod上很有可能成为一个问题,但它也可能在其他设备上被调整。
上图:苹果电视上的Siri。
一个相关的问题是,HomePod的Siri不能在iPhone或iPad上做Siri能做的所有事情。想象一下,你向一台Siri设备发出请求,得到的回应却是“无法处理你的请求”。“这是会发生的事。
与HomePod和Apple Watch相比,Siri在Apple TV上的工作方式有所不同(而且几乎没有什么不同),而macOS和iOS用户的体验则大不相同。苹果公司说这是很容易定制服务的每个Siri体验主机设备,但一个苹果或苹果看电视用户作为iPhone用户会问同样的问题,想要一个好的答案,而不是一个提示尝试另一个设备上相同的请求。除了硬件方面的限制,比如Apple TV没有集成的通话麦克风,Siri的表现应该没有障碍。
多年来,iOS设备一直能够提供类似小工具的个性化天气、日历约会、提醒、新闻和其他细节的总结,所有这些都是一目了然的——苹果称这些功能使Siri成为一个更主动的助手,旨在与谷歌抗衡。
但自推出以来,Siri的功能进展甚微。iOS现在只会根据……嗯,这很难说。在某一时刻,这些建议似乎是基于不同时间的设备使用模式,但现在它们看起来只是随机的。它所做的最积极的事情是谷歌多年的基础:自动计算时间和到下一个日历事件的位置的距离,并告诉你接下来会发生什么。
长期以来,苹果一直将隐私问题作为一种支撑来解释为什么它的个人数字助理不会变得太个人化,也不会提供太多帮助。是时候让Siri开始扮演一个真正的门房,而不是一个什么工作都不想做的人了——即使是在被要求并获得许可的情况下。如果你告诉Siri可以跨多个设备或从你的iCloud账户同步特定用户的特定信息,这样它就可以为你提供更好的服务,那么Siri应该可以做到这一点,而无需进一步询问。
除了让主动帮助在屏幕设备上更有用外,HomePod还应该为任何用户提供该功能的音频版本。这将把“数字助理”的概念带入生活,它会在你开始或结束一天工作之前,对你应该知道的关键事情进行总结,在你穿衣服或洗碗的时候对你说话,而不是强迫你看屏幕。
苹果的Siri音箱应该可以在不依赖iPhone的情况下进行语音通话。谷歌为用户提供一个免费语音电话号码;亚马逊也提供免费电话服务。但苹果要求你在附近有一部iPhone来方便通话。
允许Siri音箱自己启动和结束FaceTime音频通话,将是使苹果的选择更具竞争力所需要的最低要求。如果能让它们成为他们所住房间的电话替代品,那就更好了。
苹果的Siri快捷键——它是Alexa技能的替代品——让Siri设备有了一个真正的机会来扩展它们的功能。但目前设置这些快捷方式的过程主要是手动的,而不是自动的:用户需要进入快捷方式应用程序或iOS设置菜单才能开始使用它们。
上图:Siri快捷键是基于工作流的,这是苹果在2017年收购的一款应用。
在用户同意的情况下,新安装的苹果设备可以要求分享设备现有的关于最近使用的应用程序的“主动帮助”信息,并使用这些信息来显示和设置Siri的有用快捷方式。还有其他方法可以做到这一点,比如“帮我设置快捷键”语音命令,但最终目标应该是相同的——让更多用户使用更多现有的快捷键。
亚马逊采取了一种行之有效的方法,打造了一系列Echo音箱:一开始价格实惠,然后增加更便宜、更昂贵的选择。事实证明,这种策略非常受消费者欢迎,以至于后来后到的苹果公司不得不做出选择,是完全照搬Echo系列产品,还是另辟蹊径。(谷歌基本上模仿了亚马逊在Home上的策略,然后更快地在Mini和Max上采用了非常低和非常高的价格点。)
售价199美元、299美元和399美元的HomePod系列产品完全没有问题;刚刚降价的299美元的型号可以放在中间,旁边是“小的单耳”和“更大的,真正的立体声”的选择。目前还不清楚苹果是否真的会发布这样做所必需的新设备,但拥有一个系列而不是一个扬声器,将大大有助于让HomePods在市场上更有生命力,让Siri在家庭中更有用。
我也赞成苹果电视的改版,把麦克风装在盒子里,或者作为HDMI电缆的一部分(用于隐藏的家庭影院苹果电视安装),作为遥控器的补充或替代。根据实现方式的不同,Siri在Apple TV上的作用可能与在HomePods和iOS设备上的一样大。
目前,所有这些为改善Siri性能而进行的硬件和软件调整都只能算是一厢情愿的想法。即使苹果的工程师们一直在幕后忙忙地工作,面向消费者的改进也一直进展缓慢且不均衡,往往会被其他地方出现的新问题或不断深化的问题所抵消。
展望未来,我对Siri最大的希望是看到它继续一个接一个地消除问题,而不会在列表中添加新的问题。不管现在有多少人在使用这项服务,放弃使用Siri的人数远远超过了它应该达到的水平,而且这是苹果产品中罕见的三流产品。