动动嘴就知道你在说什么 搜狗中文唇语识别秒杀乌镇一众黑科技

2018-11-08 09:45:23  阅读 2866 次 评论 0 条

“床前明月光,疑是地上霜。”

“今天天气怎么样啊?”

机器通过语音识别得出准确的文字内容,早已不新鲜。

但是和机器沟通一定要发声吗? 

搜狗展台的黑科技“中文唇语识别技术”打破了这个常规:当央视记者来到搜狗展台体验时,就默声说出了这两句话,而机器准确地识别了出来。换句话说,仅通过识别说话人唇部动作,搜狗中文唇语识别就得到了用户的讲话内容,而这也是业内首个中文非特定人唇语识别技术的公开演示。

4aeb0001d2f7d9bfc022.gif

乌镇大会“互联网之光博览会”开展以来,搜狗展台的中文唇语识别系统已经吸引了大批的参观者驻足参观,不少人在体验后大呼“太神奇了!”“厉害厉害,我动动嘴它就知道我说的是什么”。CCTV4前来体验的记者,在机器识别了她说出的两句话后,也表示“很准确”。
搜狗展台的工作人员介绍到,这项中文唇语识别技术主要有三大应用场景。“一是噪音较大对语音识别产生干扰的环境里;二是安保领域;三是服务于听障、失语人士,帮助他们更好地理解和表达自己。”

比如在车载环境中,周围过大的噪音很容易使得用户的一些语音指令无法被准确捕获、识别,从而影响人车交互。唇语识别则可以帮助规避这一影响,确保输入的准确率,保证交互的稳定性。在安保领域中,目前很多监控场景,如电梯、马路中只有摄像头,并没有麦克风,通过唇语识别技术,则可以获取重要的用户讲话信息,为公共安全提供有效支持。 

4ae500048481c3f7316d.jpeg

在央视《人工智能改变生活》系列访谈中,搜狗CEO王小川也同样提及了这项技术。他解释说,搜狗研发唇语识别的初衷是因为“搜狗搜索和输入法其实都是在和语言打交道。一方面是帮助人们用语音表达,另一方面是通过语言获取互联网上的信息。”语音正逐渐成为主流的人机交互方式,但是在一些嘈杂,甚至无声的环境里,语音所能发挥的作用是有限的,王小川表示“这种情况下,我们就需要发展基于视觉的识别能力。”

 据了解,在业内大多唇语识别技术实用性尚待考证的环境下,搜狗的中文唇语识别系统是国内首个公开演示的唇语识别系统,基于数千小时真实唇语数据,首创了复杂端到端深度神经网络技术进行中文唇语序列建模,在搜狗的自然语言处理技术的指导下,最终取得了业界领先的唇语识别效果。


本文地址:http://www.bloguan.com/?id=461
温馨提示:文章内容系作者个人观点,不代表博观网对观点赞同或支持。
版权声明:本文为转载文章,来源于 太平洋电脑网 ,版权归原作者所有,欢迎分享本文,转载请保留出处!

发表评论


表情

还没有留言,还不快点抢沙发?