历史上的今天

今天是:2024年09月12日(星期四)

正在发生

2019年09月12日 | 谷歌全新推出低功耗的离线语音识别模型

发布者:吾道明亮 来源: eefocus关键字:谷歌  低功耗  离线语音识别模型 手机看文章 扫描二维码
随时随地手机看文章

语音识别是Siri、Alexa和Google等智能手机的重要组成部分,但这些语音识别系统有一个很大的缺点,那就是会有相应的延迟,用户必须等待Siri或其他虚拟助手来响应查询,而且如果语速过快就有极大可能造成误解。有延迟出现是因为用户的语音以及从中获取的数据必须从要手机传输到服务器,在那里进行分析后再发回。这可能需要从几毫秒到几秒的时间,如果数据包在过程中不小心失,则需要更长时间。


为什么不能直接在设备上进行语音识别呢?因为将语音转换成毫秒级的文本需要相当大的计算能力,这不仅仅是听一段声音和写一个单词,而是逐字逐句地理解一个人在说什么以及涉及到意图和整个语境。当然,手机其实是可以做到这一点的,但这并不会比把手机上的内容发送到云端快多少,而且会大量耗电。但随着该领域的稳步发展,这一目标似乎已成为可能,谷歌就使得这一功能在Pixel上得到实现。

谷歌推出全新低功耗的离线语音识别模型

为实现这一转变,Google团队花了五年时间研究问题并简化用于语音识别的AI系统。例如,旧版Gboard的听写软件由三个独立的组件来模拟音频波形,将声音与音素匹配,然后将这些音素组合成文字输出,更新后的版本将所有这些工作集合到一个步骤中。


新模型还缩小了系统中被称为“解码器图形”的部分,这个组件的功能类似于书中的索引,将音频波形与书面文字相匹配。在Gboard的听写模型的旧版本中,这个解码器图形大小为2GB,对于设备上处理来说太大了。相比之下,新版本仅为80兆字节,缩小了25倍。

你只需要说出你的查询,它会立刻被转录下来,并直接显示。它听到了你的声音后会立刻响应,而不用等到你完成整个句子再去揣测你的意思。但目前它只在谷歌键盘应用程序Gboard中工作,只在Pixel上工作,而且它只适用于美式英语。


“考虑到行业趋势,随着专业硬件和算法改进的融合,我们希望这里介绍的技术可以很快用于更多语言和更广泛的应用领域,”谷歌写道。


关键字:谷歌  低功耗  离线语音识别模型 引用地址:谷歌全新推出低功耗的离线语音识别模型

上一篇:AI技术在家电行业中的发展将如何?
下一篇:AI语音识别和分析的感知技术是如何获得的?

推荐阅读

使用Stm32CubeMx生成的源文件数量比较多,编译的时候会占用很长的时间,我们仔细观察这些文件除了main.c外,其它的文件我们基本上是调用其中的函数,并不需要对其进行改动。所以,可以仿照Freescale MQX的设计方法,分层进行编译,下图是在进行项目设计时候的层次结构。 第0层用于存储Stm32CubeMx生成的工成文件,第2层处理除main.c以外的所有...
今年8月,美国政府书面告知,经过 “长时间的”调查,认定该批设备不需要出口许可,华为公司在转运设备过程中也没有违反美国出口管制法,随后美国政府主动付费将设备退还给华为美国公司。近日,美国政府将两年前无故扣押的一批电信设备归还华为公司,从事实上承认了其行为的违法性和随意性。 考虑到起诉的理由消失,华为美国子公司于9月9日提交撤诉申请...
9月10日消息,据国外媒体报道,一名行业知情人士表示,三星电子旗下三星显示已申请一项出口许可证,以便持续向华为供货。三星显示的竞争对手LG显示已发布声明称,由于对华为的面板出货量有限,美国的限制措施对LG显示影响极小,公司将持续分散客户基础。三星显示拒绝对外媒置评。
重播 播放 00:00 / 00:00 正在直播 00:00 进入全屏 画中画 点击按住可拖动视频 2021世界机器人大会9月10日至13日在北京举办。做饭、沏茶、写字、打太极……还有更多你意想不到的酷炫黑科技!跟梦竾和宇辰一起打卡这场地表最强机器人盛会,感受...

史海拾趣

问答坊 | AI 解惑

电子应用入门知识(一)

一、电阻 电阻在电路中用“R”加数字表示,如:R1表示编号为1的电阻。电阻在电路中的主要作用为 分流、限流、分压、偏置等。 1、参数识别:电阻的单位为欧姆(Ω),倍率单位有:千欧(KΩ),兆欧(MΩ)等。换算 方法是:1兆欧=1000千欧=1000 ...…

查看全部问答∨

贴片LED的封装

replyreload += \',\' + 370078;表面贴片二极管(SMD)是一种新型的表面贴装式半导体发光器件,具有体积小、散射角大、发光均匀性好、可靠性高等优点。其发光颜色可以是白光在内的各种颜色,可满足表面贴装结构的各种电子产品的需要,特别是手机、 ...…

查看全部问答∨

怎么都是提问的?

没有分享下自己的成果? …

查看全部问答∨

hFBmp = SHLoadImageFile(imagePath);

hFBmp = SHLoadImageFile(imagePath); 图片的尺寸一大就报data abort的错误(大约长度超过100就报错了),为什么?咋解决?…

查看全部问答∨

usb同步新发现!!

调试2440板子一个星期了,发现插上LCD,usb就不能与pc同步,去掉LCD就同步正常,请问是什么原因那 ?? 是否电源干扰引起的 ? 期待解决方法 。。。…

查看全部问答∨

设备输出一个0-2V的直流电,怎么样通过RS232线读入到计算机里面?

设备输出一个0-2V的直流电,例如一个1.5V的电池,怎么样通过RS232线读入到计算机里面? 再通过JAVA写一个程序,让电压值显示在屏幕上面?并且可以保存和绘图? 这个功能也类似于笔记本的电池监控。…

查看全部问答∨

keil,如何看debug时候,的idata内容

有memory windows 在address 中输入d:0xf0,发现好像看到的是sfr,而不是高128字节的数据 (因为我已经执行了,所有数据区清零,可是在memory windows看到的依旧是FF???)…

查看全部问答∨

请教:vxworks下u盘的识别问题

关于在vxworks下使用u盘,我的u盘是4g的,想在vxworks下使用,用来记录在vxworks中采集到的一些信息。但是在vxworks下好像不识别。我的一些工作如下: 我用的是Tornado2.2,Vxworks版本是5.5,包含USB模块, 新建立工程后,工程中加入USB支持, ...…

查看全部问答∨

准备用STM32F103LQFP64封装的片子,不知道手工焊接好焊吗?

                                 准备用STM32F103 LQFP64封装的片子,不知道手工焊接好焊吗?我们的产品量很小,只有自己焊接,不知道大家有 ...…

查看全部问答∨
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
随便看看

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved