历史上的今天

今天是:2024年11月13日(星期三)

2018年11月13日 | 谷歌AI新突破:实时聊天中识别“谁说了什么”正确率高达92%

发布者:BlissfulDreams 来源: cnBeta关键字:谷歌  AI 手机看文章 扫描二维码
随时随地手机看文章

分割聚类(Diarization)是指根据“谁说了什么”将多人语言样本分割成相应的碎片段,再对所有碎片段进行聚类,把属于同一个说话人的片段都聚在一起,标注出这些碎片段属于谁。对于机器来说整个处理过程并不能像人类那样得心应手,而且机器学习算法的培训也要比想象中的更难。一个强大的分割聚类系统还要识别出此前并未关联的新语音碎片段。



        不过朝着高性能模式发展的道路上,谷歌的人工智能研究部门已经取得了令人鼓舞的突破性进展。在最新发表的论文“Fully Supervised Speaker Diarization”[PDF]以及官方博文中,谷歌研究人员描述了一种全新的人工智能系统,能够让系统以更又有效的方式来使用声音样本标签。



        这篇论文的核心算法在 NIST SRE 2000 CALLHOME的跑分中,能够在实时语音聊天应用中将在线分割聚类错误率(EDR)降低至7.6%。而谷歌此前在GitHub上开源的方式EDR为8.8%。谷歌研究人员的新方法就是通过递归神经网络(RNN)模拟说话者的输入(例如用数字方法表示说话者的单词和短语),这种机器学习模型类型能够使用内部状态来处理输入序列。




关键字:谷歌  AI 引用地址:谷歌AI新突破:实时聊天中识别“谁说了什么”正确率高达92%

上一篇:想与高通抗衡?Intel提前半年发布XMM 8160 5G基带
下一篇:1.39亿美元!英飞凌宣布收购Siltectra,有望将晶圆生产芯片数

推荐阅读

英特尔5G芯片现在有发热量过大问题          新浪数码讯 11月13日上午消息,来自外媒消息称,英特尔的5G芯片预计明年用于iPhone测试,如果顺利将在2020年装配到iPhone产品上。  英特尔对部分外媒发布了一份新闻稿,详细说明该公司的首个5G调制解调器XMM 8160将比最初预期的生产时间更快到来。在未来6个多月之内,苹果和其他智能手机制造商,...
单片机源程序如下://////////////////////////////////////////////////////////////////////////////////// PIC16F877 + HC-SR04 + LCD03 example// Written October 2008 , using HITECH PIC16 compiler// // Note - assumes a 20MHz crystal, which is 5MHz timer clock// ...
据宁波市经信局消息,宁波南大光电材料有限公司的首条ArF光刻胶生产线已正式投产。据报道,按照计划,该项目总投资6亿元,项目完全达产后,预计实现约10亿元的年销售额,年利税预计约2亿元。目前,该公司研制出的ArF(193nm)光刻胶样品正在供客户测试。193nm 光刻胶作为当前高端芯片制造( AI芯片、5G芯片、大容量存储器和云计算芯片等)中最为核心的原材...
2021年11月12日,鸿海举行线上法人说明会,鸿海董事长刘扬伟分享了集团在电动车方面的整体布局。据台媒中央社报道称,明年上半年,在中国台湾,鸿海将正式销售电动巴士E-bus;中国大陆方面,将携手Gogoro制造电池模组和建立换电站;在墨西哥则规划扩充现有车用工厂规模。对于明年下半年的规划,刘扬伟谈到,美国商用电动轻型卡车供应商Lordstown Motors的...

史海拾趣

问答坊 | AI 解惑

分享我的LM3S8962串口外设调试心得

LM3S8962 共有两个串口外设, 分别是GPIO A口的A0(RXD),A1(TXD); GPIO D口的D2(RXD),D3(TXD); 我现在使用的轮询方式: 第一步:  设置LM3S8962工作时钟:   SysCtlClockSet(SYSCTL_SYSDIV_4 | SYSCTL_USE_PLL | SYSCTL_OSC_MAIN | SYSCTL_ ...…

查看全部问答∨

windows CE开发之基础入门

Windows CE开发之基础入门   最近一段时间,移动设备开发越来越多的成为了程序员社区的话题。移动设备主要包括智能手机和PDA,是嵌入式开发中很重要的一个方向。在智能手机领域被大多数手机厂商支持的J2ME无疑是领头羊,随着多普达推出了515手机 ...…

查看全部问答∨

把短信恢复回去后不能删除

我在写一个备份程序,数据成功备份出来了,恢复的时候也把删除了的短信(未读)写进去了,数据都正常. 但是我想删除恢复的短信,但是没有用.点击阅读能显示正常,但读完后出来,那个标志还是未读短信,但是在已删除邮件里这条短信却变成了已读. 这是什么原 ...…

查看全部问答∨

7146视频采集卡问题

请问有没有人做过7146芯片的视频采集卡驱动,刚开始接触驱动开发,对过程不是很了解…

查看全部问答∨

[求助]谁能帮我看看这个问题怎么解决,如何调试啊?

二层交换机,从vxworks5。4移植到5。5,同事费了好多劲终于能把交换机调起来 现在用脚本在cli下建vlan 1-1000时,telnet功能崩溃,只能通过串口连接 下面是出错的log machine check Exception next instruction address: 0x0171d75c Machine St ...…

查看全部问答∨

LM3S9B96 Development Board

有谁在使用LM3S9B96吗?   在LM3S9B96 Development Board 里的QVGA LCD是用它的GPIO来驱动LCD,为什么不用EPI啊?   GPIO来驱动LCD,那刷新LCD会不会太慢?…

查看全部问答∨

对学习使用MATLAB同学的几个建议

MATLAB是我们常用的工具。而快速学习和熟练掌握MATLAB对于高效完成工作很有意义。本文从亲身的经验出发,介绍一下怎样学习和使用MATLAB,这些办法都是已经被若干人证明很不错的。 1. 学习MATLAB的基础语法略过了。如果你不太确定,可以在command下 ...…

查看全部问答∨

双核F28M35的RAM问题

F28M35中单独的m3核中的ram区是怎么读写的?其中的ram分成了四个区,应该怎么使用ram呢?可以四个作为一个用吗?还是有什么说法?哪位大虾知道讲解下,如果能有个例程就更好了…

查看全部问答∨

【FPGA(cyclone4)第二期 】 瓶颈与心境

刚开始学习FPGA的时候,看过很多学习笔记与心得,当初看到一句话,FPGA入门简单,学精却很难。现在发现的确是这样的,学习FPGA也有一个月了,Verilog基本语法,编程思路,小的实验从简单的流水灯,蜂鸣器,数码管,液晶,到稍复杂的VGA,UART,慢慢 ...…

查看全部问答∨

关于功率放大的问题

现在我需要用单片机做一个100V、50Hz的三相交流电源,功率要求500w,单片机产生出的正弦波要经过功率放大电路才能把功率给提上来,这个功率放大器该如何做呢????…

查看全部问答∨
小广播
最新手机便携文章
换一换 更多 相关热搜器件
随便看看

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved