谷歌拟人语音AI助理将投入公开测试 甚至能模仿人类语气停顿
2018-06-30 14:40:49爱云资讯阅读量:664
(图:谷歌副总裁尼克·福克斯在加州的新闻发布会上讨论了公司的Duplex人工智能。图源:CNET)
这家搜索巨头让我们更近距离地了解了它备受争议的人工智能软件,同时它也在努力平息人们对该技术的担忧。
谷歌正在开发Duplex,这是一款听起来令人惊叹的人工智能软件,其背后的新自动化系统可以为你提供自然类人语音而不是机械语音的电话服务。
这家搜索巨头周三说,它将开始对这款软件进行公开测试。这款软件于今年5月首次亮相,旨在帮企业打电话和预约。
Duplex立刻引起了关于使用人工智能助手进行逼真的对话所涉及的道德和隐私问题的质疑。
谷歌公司表示,他们的计划是在一小群“值得信赖的测试人员”和选择接受Duplex电话的企业的帮助下,开始公开测试。
在“未来几周”,该软件只会打电话给企业,确认营业时间和假期时间,比如7月4日的营业时间和关门时间。
从“今年夏天晚些时候”开始,人们可以开始使用软件在餐馆和美发沙龙预订。
周二,谷歌邀请记者来到位于加州的Oren's Hummus Shop,这家以色列小餐馆距公司园区2.5英里(约合1.6公里)。
不过谷歌不允许录制演示视频。
此前一天,在纽约一家泰国餐馆也举行了类似的演示发布会。
谷歌首席执行官桑达尔•皮查伊(Sundar Pichai)在I/O开发者大会上公布这项技术的那一刻起,就一直受到外界的密切关注。
谷歌拒绝给予一个现场演示机会,这让人们当时很难评估这项技术在现实生活中的实际工作方式。
与我们今天听到的半机器人语音助手不同——想想亚马逊(Amazon)的Alexa、苹果的Siri或谷歌助手用谷歌家庭智能扬声器发出的声音——Duplex的语音听起来令人瞠目结舌,栩栩如生。
它模仿人类的语言模式,使用像“uh”和“um”这样的语气助词。它会像你或我一样,停顿、拉长单词和语调。
但这种逼真也吓坏了人们。
批评者担心一个人工智能机器人欺骗一个人类的道德含义,让人以为他或她在和另一个人类说话。
5月,谷歌的工程副总裁约西•马蒂亚(Yossi Matias)表示,该公司可能会向人们披露他们正在与一个机器人交谈,但他不会就此做出承诺。
然而,经过几天的批评之后,该公司明确表示将对该产品进行披露。
周三,谷歌公布了如何让人们知道他们正在与人工智能对话。
在软件向电话线另一端的人打招呼后,它会立即表明自己的身份:“嗨,我是谷歌助理,打电话来为客户预定。该自动呼叫将被录音。”
(披露的确切语言在一些不同的演示中略有不同。)
该公司表示,在那些“法律要求”这种披露的州中,它将披露该电话会被录音。
根据数字媒体法律项目,包括加州、伊利诺伊州和佛罗里达州在内的11个州“要求每一方都同意进行电话或对话,以使录音合法”。
对于州与州之间的通话,需要执行更严格的法律——例如,加利福尼亚州的法律要求这样做,但纽约州的法律不要求这样做。
设定一个标准
谷歌如何处理Duplex的发布是很重要的,因为这将为其他行业如何大规模地对待商业人工智能技术奠定基调。
谷歌的母公司Alphabet是世界上最具影响力的公司之一,它现在制定的政策不仅为其他开发人员树立了先例,也使得用户产生了期望。
Duplex是科幻传说中的东西,现在谷歌想让它成为我们日常生活的一部分。
展望未来数年,如果这项技术大获成功,它将开启一个人类与自然语言机器人交谈成为正常现象的时代。
因此,在类似的类人机器人出现之前就把它弄清楚是至关重要的。
“嗨,我是谷歌助理,打电话来为客户预订房间。这个自动呼叫将被录音。”
谷歌助理产品和设计副总裁尼克·福克斯(Nick Fox)说:“我们认为,制定一套标准的技术方法是很重要的。”
“对于披露这些信息之类的事情,重要的是我们要在其中表明立场,这样其他人也能跟进。”
谷歌已经在更广泛地考虑其人工智能的影响。
本月早些时候,皮查伊发表了一份关于人工智能道德的宣言,强调了该公司在考虑道德责任时,会发展什么,不会发展什么。
他表示,Alphabet不会开发用于武器的人工智能,但仍将寻求签订军事合同。
新的指导方针出台之前,谷歌的一名员工抗议该公司参与了五角大楼的专家项目,该项目旨在利用人工智能分析无人机镜头。
福克斯在周二谈到了有关Duplex发行的问题时提到了这些指导方针。福克斯说:“这些都是我们作为一个科技社区的想法。”
谷歌让记者接听来自Duplex的模拟电话,就好像我们是在Oren's Hummus Shop订的一样。
接到谷歌助理的电话既怪诞又让人放心。软件的灵活性令人印象深刻。
一方面,与软件对话令人不安,因为它的语调听起来很自然。
但是其中有一些停顿,可能仅仅是长了一毫秒,这可能会使对话的动态失去平衡。
不过,听到有人透露说“这是谷歌的助理”,还是让人放心。一旦你听到它,你的大脑就会开始像接到其他机器人电话一样处理它。
整件事有点像听到那些烦人的语音留言。有些人会说:“你好?(暂停)嘿,大声点,我听不见你说什么。只是开个玩笑!你已经来到了史蒂夫的语音信箱……”
记者和Duplex聊天的目的是在三分钟的谈话中尽可能地把软件弄糟。
“他记下了它提供给我的姓名、日期和其他预订信息,但他也试着提出一些随机的话题。我问它关于运动成绩的问题——它只是重复说我是谷歌的助理,想预订座位。”
“然后我问我能不能和一个人说话。最后,它告诉我,它会让我和一个代理人联系。在听到三次报时声后,我被转到了谷歌的一个呼叫中心。他有我的电话记录,所以他确认了预定,然后结束通话。”
在Duplex系统发布之后,人们对该软件背后的实际逻辑提出了质疑。
有些人想知道,例如,这个演示是不是为舞台上的展示而编辑的。周二,福克斯坚称舞台上的演示是真实的,但经过编辑,删除了包括餐厅名称和来电者电话号码在内的个人信息。
他还说,Duplex的通话每五次就有四次可以通过全自动化来处理。
另一些人则批评了产品本身的意图:如果谷歌不想欺骗人们,那么为什么一开始就不嫌麻烦地让软件听起来更人性化呢?
谷歌助理的工程副总裁斯科特·霍夫曼(Scott Huffman)说,让人工智能听起来像人,会让人们在电话上呆得更久。
他说,“uh”和“um”这类语气助词不仅仅是填充物。它们是向另一端的人承认你仍然在线的方法。
赫夫曼说,如果打电话的人在预订单上犯了错误,说“um”是请求更正的一种更礼貌的方式。
Huffman说,Duplex有限制地发布的原因之一是谷歌仍在试图弄清楚企业将如何应对电话技术。没有正式发布或大规模发布的时间表。
霍夫曼说:“这与我们通常的发布方式非常不同。”
“我们的速度比谷歌通常发布产品时的做法要慢一些。”
相关文章
- 谷歌Gemini作为原生应用登陆iPhone
- 谷歌推出Learn About实验性新AI工具,重塑学习新方式
- ChaGPT网页搜索引擎上线 OpenAI挑战谷歌
- 谷歌超过四分之一的新代码是由人工智能生成
- Meta在开发自己的人工智能搜索引擎,减少对谷歌和微软的依赖
- 谷歌宣布开源水印识别工具SynthID,可供开发人员和企业免费使用
- 谷歌将于11月21日起从搜索结果中移除站点链接搜索框
- 谷歌宣布搜索与广告业务高管人事变动 人工智能部门结构调整
- 七个核反应堆为谷歌的人工智能野心提供电力能源
- 谷歌签署购买核电的协议,解决人工智能数据中心用电需求
- 荣耀在HONOR Magic V3和HONOR 200系列手机上推出谷歌Circle to Search功能
- 谷歌Gemini 1.5 AI 模型全新升级,字节跳动/微美全息加速AI驱动数字化变革
- 谷歌扩大人工智能搜索功能,将广告整合到移动设备的概述中
- 谷歌推出基于Gemini的Gmail更新,上下文智能回复功能更加智能
- 谷歌即将更新全球近80个国家的街景地图,又有新增一些国家
- 谷歌Chrome改进跨平台标签同步,不同设备之间的切换更加天衣无缝