老罗大秀语音识别 但它真的重要吗?
老罗在发布会上现场展示语音识别确实惊艳了一把,但语音识别真的是发展的重点吗?
如果没有人工智能,语音识别如同鸡肋,食之无味,弃之可惜。
http://www.keke289.com/Uploads/Bingdu/2016-10-19/58072b0c361ea.jpg
1
科客网
http://www.keke289.com/news/14788.html
科客点评:如果没有人工智能,语音识别如同鸡肋,食之无味,弃之可惜。
在10月18日晚上的锤子手机发布会上,老罗现场展示了科大讯飞97%正确率的语音输入。时间定格于发布会106分40秒,在老罗一阵碎碎念之后的不到一秒之内,文字转换完成。其转换速度之快,准确率之高以及现场展示的特殊环境,都让人惊艳了一把。
语音识别实用吗?
事实上,语音输入并不是什么新鲜词,但这次借助老罗的“单口相声”,语音输入又跳到众人视线中。令人奇怪的是,讯飞的语音输入在很早以前就有了,这次展示却令我们有种重新认识语音输入的感觉。
几年前,语音输入的准确率也不低,基本都有90%以上。然而,放到实际生活中,语音输入的实用性仍然不是很高。在使用语音输入的时候,其准确率会受到非常多的因素影响,在不同的环境下使用会有差别,在不同使用者的口音下更是差别巨大。
但放到今天,语音识别还是不实用吗?
应该说,由于准确率的提高,语音识别的实用性对普通用户来说有所上升。但从科客的实际体验来说,哪怕是讯飞,其准确率仍然受限于使用者的音量、发音标准程度、环境干扰诸多因素。其中最大的影响因素应该是口音。拿广东地区来说,光是粤语,不同地区的人发音都有所区别。对于人类来说,我们可以较为轻松的识别不同口音,并较为准确领会他人表达的意思。然而对机器而言,它就需要更大的数据库。倘若哪一天,语音输入能够只能判断方言口音,并且能在街头随机抽取不同口音的人进行语音输入准确率的测试,那相信其实用性将会非常的大。但就目前而言,语音输入的进步对不少年纪大的,只会用手写输入的用户来说,其实用性确实不小。
竞争者众多
需要承认,讯飞的多语言识别率确实是世界顶尖,中文是最好的。但是,其他竞争者要做到90%甚至95%以上也不是难事。另外,这些竞争者中不乏像谷歌、百度这样拥有大量数据库的企业,他们在海量用户数据和人工智能技术上的优势,能让他们迅速的发展出优秀的语音智能。除此之外,这类互联网企业还有足够的能力发展诸多产品线,形成生态,以提供更优质而全面的服务。从这个角度来说,讯飞的发展道路有些窄。
语音识别的应用
另一方面,必须注意到,语音输入本身只是一个途径,它最终仍然要和实际操作相结合。比如在无人汽车领域,发展语音输入就很有必要。试想一下,当你坐上一辆无人汽车,满怀新奇和期待,结果屏幕却弹出一块键盘,那时你对这项高科技是否会感到失望?
而智能家居又是未来一大利用语音识别进行交互的重要领域。语音识别与智能家居的结合在几年前就有了。微软在win10发布会上主打的一点就是跨平台,并利用Cortana这个语音识别进行更便捷的操作。也许这是第一步,在整合数码设备之后, 微软甚至能一步步逐渐渗透,从电视到洗衣机,从窗户到整个房屋,全都用人工智能进行操作。而语音识别自然理所当然会成为更智能家居体验的主要交互方式。这是能够改变人们生活的重要领域,以语音识别为基础建构起来的整个生态,就成了目前各大语音识别厂商追逐和竞争的目标。
重点还是人工智能
从语音识别在未来可能涉及的领域可以看到,虽然语音识别能让生活工作变得更加的高效便捷,然而,其核心却是人工智能。虽然微软CEO萨提亚·纳德拉对语音识别不吝赞美,甚至称语音识别突破的意义不亚于将图形界面引入电脑,然而,没有人工智能为核心,语音识别会出现下图这样的答非所问,就算再准确又如何?
无论是无人汽车,还是智能家居,或者是其他领域,语音识别只能算是第一步。毕竟如果计算机无法理解我们的指令,那么也不会有后续的操作。要想在这些领域有所发展,给用户更好的体验,那就必须着眼于人工智能。如果语音识别没有依托于人工智能,不能和其他产品相互配合,那语音识别的意义也就没有那么大了。由此来看,语音识别真的是重点吗?恐怕不见得。关注科客网官方微信kekebat,获取更多精彩资讯。
注:科客网原创文章,欢迎转载与分享,转载请注明出处。
梅儿莉薇
████████████看 黃 魸 手 机 浏 覽 噐 咑 幵:275236.c○m 郗蒛資羱!无需下载、直接欣赏,妳嬞鍀!████████████缀做