语音识别是Siri、Alexa和Google等智能手机的重要组成部分,但这些语音识别系统有一个很大的缺点,那就是会有相应的延迟,用户必须等待Siri或其他虚拟助手来响应查询,而且如果语速过快就有极大可能造成误解。有延迟出现是因为用户的语音以及从中获取的数据必须从要手机传输到服务器,在那里进行分析后再发回。这可能需要从几毫秒到几秒的时间,如果数据包在过程中不小心失,则需要更长时间。
为什么不能直接在设备上进行语音识别呢?因为将语音转换成毫秒级的文本需要相当大的计算能力,这不仅仅是听一段声音和写一个单词,而是逐字逐句地理解一个人在说什么以及涉及到意图和整个语境。当然,手机其实是可以做到这一点的,但这并不会比把手机上的内容发送到云端快多少,而且会大量耗电。但随着该领域的稳步发展,这一目标似乎已成为可能,谷歌就使得这一功能在Pixel上得到实现。
为实现这一转变,Google团队花了五年时间研究问题并简化用于语音识别的AI系统。例如,旧版Gboard的听写软件由三个独立的组件来模拟音频波形,将声音与音素匹配,然后将这些音素组合成文字输出,更新后的版本将所有这些工作集合到一个步骤中。
新模型还缩小了系统中被称为“解码器图形”的部分,这个组件的功能类似于书中的索引,将音频波形与书面文字相匹配。在Gboard的听写模型的旧版本中,这个解码器图形大小为2GB,对于设备上处理来说太大了。相比之下,新版本仅为80兆字节,缩小了25倍。
你只需要说出你的查询,它会立刻被转录下来,并直接显示。它听到了你的声音后会立刻响应,而不用等到你完成整个句子再去揣测你的意思。但目前它只在谷歌键盘应用程序Gboard中工作,只在Pixel上工作,而且它只适用于美式英语。
“考虑到行业趋势,随着专业硬件和算法改进的融合,我们希望这里介绍的技术可以很快用于更多语言和更广泛的应用领域,”谷歌写道。
上一篇:AI技术在家电行业中的发展将如何?
下一篇:AI语音识别和分析的感知技术是如何获得的?
推荐阅读
史海拾趣
面对数字化时代的挑战和机遇,星海公司开始积极推进数字化转型。公司引入先进的生产管理系统和数字化营销手段,提高生产效率和市场响应速度。同时,星海公司还积极探索新的商业模式和合作方式,以适应不断变化的市场需求。展望未来,星海公司将继续秉承“质量为本、创新为魂”的发展理念,致力于成为全球领先的乐器制造商和音乐教育服务提供商。
在电子行业这个竞争激烈的领域里,技术的更新换代速度非常快。为了保持领先地位,Exclara高度重视研发投入,不断引进高端人才和先进设备,加强研发团队建设。通过持续的研发投入,公司不仅保持了技术的领先地位,还成功开发出了一系列具有自主知识产权的核心技术。
Cantherm公司一直把产品质量放在首位。在一次产品质量检测中,公司发现某批次产品存在微小瑕疵,尽管这些瑕疵并不会影响产品的正常使用,但公司仍然决定召回该批次产品并进行全面检查。这一举动虽然给公司带来了一定的经济损失,但却赢得了消费者的信任和好评,进一步巩固了公司在电子行业中的地位。
兆欣科技股份有限公司成立于2003年,由一群怀揣梦想的电子工程师创立。在创立之初,公司就明确了自己的目标:开发和量产全自动、小型化的SMD绕线电感。这一决定在当时的市场上并不常见,但兆欣团队坚信这是未来的趋势。他们投入大量时间和精力进行研发,成功推出了共模滤波器、高频芯片电感以及薄型功率电感等主力产品。
南京中科微电子有限公司(CSM)的创立源于一群海归科学家和工程师的激情与梦想。他们曾在国外知名半导体公司如Marvell、ADI、Linear Tech等积累了丰富的研发经验,并在国家重点研究院所中从事前沿研究。这群人深感国内在射频/模拟关键芯片领域的落后,于是决定回国创立CSM,旨在打破国外技术垄断,实现自主创新和产业化。
广州西博臣科技有限公司(简称西博臣)成立于2001年,从创立之初就专注于湿度传感器的研发和生产。公司是国内最早从事高分子湿度传感器研发并进行规模化生产的厂家之一,凭借其独特的技术实力和对行业的深刻理解,逐渐在市场中崭露头角。
两线制4-20mA信号隔离现场应用方案举例(4-20mA信号隔离、变送及两线制回路输出方式 一、两线制4-20mA信号隔离器:ISO 4-20mA ISO 4-20mA电流环隔离芯片是单片两线制隔离接口芯片,该IC内部包含有电流信号调制解调电路、信号耦合隔离变换电路等。很小的输入等效电阻,使该IC的输入电压达到超宽范围(7.5—32V),以满足用户无需外 ...… 查看全部问答∨ |
智能仪表是自动控制技术的重要组成部分。随着智能仪表在工业控制、通信和汽车电子中的广泛应用,智能仪表逐渐向数字化、网络化、智能化方向发展;同时,智能仪表复杂度不断增加,对实时性要求几乎达到了苛刻的程度。在编程方式和代码重复利用等方面 ...… 查看全部问答∨ |
我做好了一个数码显示的程序,数码管显示从1走到999.但是有的时候断电后就自动又从零开始走,我现在想让它断电把数据记下来我已经做好了一个断电检测电路我已经写了一点断电的程序,但是就是实现不了断电之前的数据记下来,每次还是断电后就从0开始 ...… 查看全部问答∨ |
|
请教高手93C46的8位、16位读写程序怎么区分 SB+OP1=10B,OP0+写允许=01100000B 比如93C46的写允许8位是 1001100000既 00000010,01100000(0X02,0X60)   ...… 查看全部问答∨ |
|
请问: linux在内核空间用vmalloc最大能分配多少内存? 在用户控件用malloc最大能分配多少内存? 分配的最大值在内核中可以修改吗?怎么修改? 我用的ARM2440,内存128M,linux内核是2.6.13 谢谢!… 查看全部问答∨ |
我在WinCE下作GSM打电话程序,有CreateFile可以打开串口,但是在串口接收线程里用ReadFile读数据却不成功 但是CreateFiel打开串口确实成功了啊,用GetLastError得到的错误码是:〖6〗-句柄无效。为什么 下面是我的程序 BOOL fReadState = ReadFi ...… 查看全部问答∨ |
我通过BOOL NTLMSetUserInfo( LPTSTR pszUser, LPTSTR pszPassword )这个函数给系统添加了用户名和密码,请问如何通过过程序来获取这个密码呢?我看了看Ntlmssp.h 这个头文件,好像没有类似NTLMGetUserInfo函数用来获取用户信息的。 … 查看全部问答∨ |
程序错在哪里啊,请高手指点一下,都写了一天了,还不知道错在哪里 //保存为1.h #ifndef lcd1602_h #define lcd1602_h sbit rs= P2^7; //定义接口 sbit rw= P2^6; sbit e = P2^5; #define shuju P0 #define unch unsigned char #define unin unsigned int void shortdelay(unin m); //延时 vo ...… 查看全部问答∨ |