历史上的今天

今天是:2024年09月12日(星期四)

正在发生

2019年09月12日 | 谷歌全新推出低功耗的离线语音识别模型

发布者:吾道明亮 来源: eefocus关键字:谷歌  低功耗  离线语音识别模型 手机看文章 扫描二维码
随时随地手机看文章

语音识别是Siri、Alexa和Google等智能手机的重要组成部分,但这些语音识别系统有一个很大的缺点,那就是会有相应的延迟,用户必须等待Siri或其他虚拟助手来响应查询,而且如果语速过快就有极大可能造成误解。有延迟出现是因为用户的语音以及从中获取的数据必须从要手机传输到服务器,在那里进行分析后再发回。这可能需要从几毫秒到几秒的时间,如果数据包在过程中不小心失,则需要更长时间。


为什么不能直接在设备上进行语音识别呢?因为将语音转换成毫秒级的文本需要相当大的计算能力,这不仅仅是听一段声音和写一个单词,而是逐字逐句地理解一个人在说什么以及涉及到意图和整个语境。当然,手机其实是可以做到这一点的,但这并不会比把手机上的内容发送到云端快多少,而且会大量耗电。但随着该领域的稳步发展,这一目标似乎已成为可能,谷歌就使得这一功能在Pixel上得到实现。

谷歌推出全新低功耗的离线语音识别模型

为实现这一转变,Google团队花了五年时间研究问题并简化用于语音识别的AI系统。例如,旧版Gboard的听写软件由三个独立的组件来模拟音频波形,将声音与音素匹配,然后将这些音素组合成文字输出,更新后的版本将所有这些工作集合到一个步骤中。


新模型还缩小了系统中被称为“解码器图形”的部分,这个组件的功能类似于书中的索引,将音频波形与书面文字相匹配。在Gboard的听写模型的旧版本中,这个解码器图形大小为2GB,对于设备上处理来说太大了。相比之下,新版本仅为80兆字节,缩小了25倍。

你只需要说出你的查询,它会立刻被转录下来,并直接显示。它听到了你的声音后会立刻响应,而不用等到你完成整个句子再去揣测你的意思。但目前它只在谷歌键盘应用程序Gboard中工作,只在Pixel上工作,而且它只适用于美式英语。


“考虑到行业趋势,随着专业硬件和算法改进的融合,我们希望这里介绍的技术可以很快用于更多语言和更广泛的应用领域,”谷歌写道。


关键字:谷歌  低功耗  离线语音识别模型 引用地址:谷歌全新推出低功耗的离线语音识别模型

上一篇:AI技术在家电行业中的发展将如何?
下一篇:AI语音识别和分析的感知技术是如何获得的?

推荐阅读

小米越来越会营销啦,小米手环已经不是第一次搞限量版了,这次小米手环3 NFC限量版,全球只有666个,而且有钱也买不到,因为只送不卖。昨天,小米官方宣布,小米手环全球累计出货量突破5000万支,小米手环3 NFC版本也将于9月19日全渠道开售,售价199元。今天,小米更是通过米家微博宣布了小米手环3 NFC限量纪念版,全球限量666支。小米表示,这一款小米...
航空装备中,最受关注的当属航空发动机。航空工业被比作现代工业的皇冠,航空发动机更被称为现代工业皇冠上的明珠,是飞机的心脏。 航空发动机要求在极为有限的空间内和极端恶劣条件下保证长期、稳定的、极端的性能,其承受的温度在1700℃以上,压力相当于3倍蓄满水后三峡大坝的底部压力。因此,航空发动机是研发制造难度最大最顶级的现代工业造物。 叶轮...
9月9日,深圳国际电子展(ELEXCON)暨5G全球大会(中国站)于深圳国际会展中心召开。展会利用深圳产业与区域核心的双重优势,将不断推动本土电子行业品牌化、国际化发展,加速粵港澳大湾区电子信息产业的创新突破与转型升级,迎接电子行业市场的快速反弹和有序发展。作为此次参展商之一的合肥健天电子有限公司(以下简称“健天电子”)携芯片、应用方案、...
近日,思灵机器人(AGILE ROBOTS)宣布完成2.2亿美金C轮融资,软银愿景基金2期领投,跟投的财务投资人包括阿布扎比皇室集团(Chimera)、高瓴创投、红杉中国、线性资本等,产业投资人包括小米集团、工业富联、富士康原高管创立的满得投资等。思灵机器人是一家智能机器人系统研发及应用服务商,致力于智能机器人系统的研发及应用,核心产品包括7自由度轻...

史海拾趣

问答坊 | AI 解惑

两线制4-20mA信号隔离现场应用方案举例(4-20mA信号隔离、变送及两线制回路输出方式

一、两线制4-20mA信号隔离器:ISO 4-20mA  ISO 4-20mA电流环隔离芯片是单片两线制隔离接口芯片,该IC内部包含有电流信号调制解调电路、信号耦合隔离变换电路等。很小的输入等效电阻,使该IC的输入电压达到超宽范围(7.5—32V),以满足用户无需外 ...…

查看全部问答∨

一种嵌入式微调度器的实现方法

智能仪表是自动控制技术的重要组成部分。随着智能仪表在工业控制、通信和汽车电子中的广泛应用,智能仪表逐渐向数字化、网络化、智能化方向发展;同时,智能仪表复杂度不断增加,对实时性要求几乎达到了苛刻的程度。在编程方式和代码重复利用等方面 ...…

查看全部问答∨

那位高人指点EEPROM程序

我做好了一个数码显示的程序,数码管显示从1走到999.但是有的时候断电后就自动又从零开始走,我现在想让它断电把数据记下来我已经做好了一个断电检测电路我已经写了一点断电的程序,但是就是实现不了断电之前的数据记下来,每次还是断电后就从0开始 ...…

查看全部问答∨

华为通信入门教材

华为通信入门教材…

查看全部问答∨

请教高手93C46的8位、16位读写程序怎么区分

请教高手93C46的8位、16位读写程序怎么区分 SB+OP1=10B,OP0+写允许=01100000B 比如93C46的写允许8位是  1001100000既  00000010,01100000(0X02,0X60)                 ...…

查看全部问答∨

nesC中文手册

ZIGBEE 中的NESC语言…

查看全部问答∨

在linux内核空间用vmalloc最大能分配多少内存?

请问: linux在内核空间用vmalloc最大能分配多少内存? 在用户控件用malloc最大能分配多少内存? 分配的最大值在内核中可以修改吗?怎么修改? 我用的ARM2440,内存128M,linux内核是2.6.13 谢谢!…

查看全部问答∨

打开串口成功,但是ReadFile确不成功,为什么

我在WinCE下作GSM打电话程序,有CreateFile可以打开串口,但是在串口接收线程里用ReadFile读数据却不成功 但是CreateFiel打开串口确实成功了啊,用GetLastError得到的错误码是:〖6〗-句柄无效。为什么 下面是我的程序 BOOL fReadState = ReadFi ...…

查看全部问答∨

程序获取wince系统密码

我通过BOOL NTLMSetUserInfo( LPTSTR pszUser, LPTSTR pszPassword )这个函数给系统添加了用户名和密码,请问如何通过过程序来获取这个密码呢?我看了看Ntlmssp.h 这个头文件,好像没有类似NTLMGetUserInfo函数用来获取用户信息的。 …

查看全部问答∨

程序错在哪里啊,请高手指点一下,都写了一天了,还不知道错在哪里

//保存为1.h #ifndef lcd1602_h #define lcd1602_h sbit rs= P2^7; //定义接口 sbit rw= P2^6; sbit e = P2^5; #define shuju P0 #define unch unsigned char #define unin unsigned int void shortdelay(unin m); //延时 vo ...…

查看全部问答∨
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved