历史上的今天

今天是:2024年09月23日(星期一)

正在发生

2019年09月23日 | 人工智能时代兴起,NLP何时能进入成熟期?

发布者:WhisperingWind 来源: eefocus关键字:NLP  人工智能  深度学习 手机看文章 扫描二维码
随时随地手机看文章

NLP是计算机科学,人工智能和语言学的交叉领域。目标是让计算机处理或“理解”自然语言,以执行语言翻译和问题回答等任务。

 

随着语音接口和聊天机器人的兴起,NLP正在成为信息时代最重要的技术之一,同时它也是人工智能的关键部分。充分理解和表达语言的含义是一个非常困难的目标。

 

大部分NLP技术都是由深度学习提供技术支持。在深度学习中,表示学习试图自动学习来自原始输入的良好特征或表示。而在机器学习中手动设计的特征通常过多且不完整,需要花费很长时间进行设计和验证。而且深度学习提供了一个非常灵活、通用且可学习的框架,用于呈现视觉和语言信息的世界。最初,它在语音识别和计算机视觉等领域取得突破。最近,深度学习方法在许多不同的NLP任务中表现出了非常高的性能。这些模型通常可以通过单一的端到端模型进行训练,并且不需要传统的,特定于任务的特征工程。

 

虽然 NLP 研究领域已经在深度学习的帮助下取得了长足的发展,许多技术也已经商业化落地,但我们也需要知道,这个领域还有几个开放性问题等待解决 —— 如果它们也能比较好地解决,也许我们能迎来 NLP 科研成果与商业落地的一个新的高潮。


下面列举的 5 个开放性问题来自自学 NLP 的机电一体化本科生 Deepak Garasangi 在 Reddit 上的发帖讨论内容总结,并且参考了 Sebastian Ruder 曾经总结的 4 个开放性问题。按重要性从轻到重排序:

 

5. 评价指标

这个问题在领域内不算很大的瓶颈,但是经常有研究人员觉得有必要重新讨论这个问题,因为现行惯例里往往不问原因就沿用某些固定的架构、数据集和评价指标。有人这样总结:「随着我们探索越来越高级的认知任务,弄明白为什么某些方法、某些架构在某些时候能起到好的效果,这对我们非常有帮助。」

 

另外一种担忧是对于评价指标自身的,这些评价技巧、这些生成的数字到底能在多大程度上对应人类语言的多样性和表达能力?对这个问题的回答也可以帮助我们构建出更有趣的自然语言推理数据集。


拓展阅读:EMNLP 2017 论文《Why We Need New Evaluation Metrics for NLG》(https://www.aclweb.org/anthology/D17-1238)


4. 终生学习(Life long learning)

NLP 领域遇到的另一个棘手问题是为这几个问题设计解决方案:


低阶模型用于下游任务时的终生适配

迁移学习的应用

视觉、文本、音频等等语言相关模态的无缝整合

低资源情境中高效的跨任务迁移

拓展阅读:Sebastian Ruder 近期写了一篇文章,总结了 NLP 领域迁移学习的现状,AI 科技评论也做了编辑,可以点击阅读


3. 面向目标的对话系统

面向目标的对话系统(Goal oriented dialogue systems)


从 ACL 学会出版的论文集来看,近一两年的 ACL 会议、EMNLP 会议中研究面向目标的对话系统的论文都有大幅增加。这就是又一个开放性问题:如何设计具备常识、能在真实世界语境中与人类进行较长的、面向目标的交谈的机器对话系统。目前的研究思路包括:带有状态追踪的任务驱动的对话系统,使用强化学习的对话系统,以及很多别的新点子。


拓展阅读:在 NLP 中应用强化学习
https://www.csie.ntu.edu.tw/~yvchen/doc/KAIST19_Tutorial.pdf


2. 低资源语言

这可以算是最紧迫的问题。目前全世界大约有 7000 种语言,但这些语言中只有很小的一部分,大概 20 种左右,可以算是资源丰富的语言。这个问题除了很实际之外,在其中找到灵感、取得进展也相对比较容易。专家们认为可行的方向包括:


为低资源语言设计收集数据、用较小数据训练语言模型的方法

可以有效用于低资源语言的跨任务迁移方法

拓展阅读:详细的说明文章参见 http://www.cs.cmu.edu/~ytsvetko/jsalt-part1.pdf


1. 自然语言理解

没错,这就是那个最开放的问题,它和 NLP 领域中的许多具体问题也都息息相关。想要解决这个高阶的认知问题,可能需要我们从强化学习、领域适应、小样本/零样本学习等等领域中借鉴很多思想和方法,也还需要 NLP 研究人员们做出更多创新。


现阶段的研究落脚点包括:
共指消歧(Coreference resolution)、多义词解析(Polysemy)、文本/文档总结(Text/Document Summarization)

论证与推理,讽刺与幽默

高效地表征大文本

环境中的语言学习(Grounded language learning),比如联合学习一个世界模型和语言模型,并且学习如何在语言模型中使用世界模型。

 

Yoshua Bengio 曾说:「要有野心。不要(因为做 NLP 就)仅仅读 NLP 论文。要读很多机器学习、深度学习、强化学习的论文。」我们也希望各位研究者们可以打开眼界,多多参考以前和现在的包括别的领域的有用经验,才能解决更难的问题、做出更大的成果。


关键字:NLP  人工智能  深度学习 引用地址:人工智能时代兴起,NLP何时能进入成熟期?

上一篇:面板行业寒冬,中华映管已宣布破产
下一篇:LG显示或将OLED E2 工厂关闭,年内停产?

推荐阅读

   每个人都喜欢黑暗的主题?好吧,也许不是每个人,但很多Android爱好者都是原生黑暗模式的粉丝。谷歌最新的Material Theme有些应用已经采用了黑暗模式。 YouTube和Android内置消息应用是最新的案例,看起来另一个重要的应用Google Chrome也可能会出现黑暗模式,但它很有可能首先在macOS上启动。  苹果在macOS 10.14中添加了一项功能,允许用户...
近日,意法半导体工业巡演北京站顺利举办。2019年5月,意法半导体在深圳举办了首届工业峰会,而为了延续工业峰会的成功,意法半导体于下半年分别在广州、上海、北京、台湾地区以及新加坡和印度等地举办巡演。今年意法半导体将工业应用聚焦在了三大领域,分别为电机控制、电力和能源以及自动化。意法半导体亚太区资深销售经理陆春雷加大研发力度配合客户发...
浩亭技术集团在今年5月即着手准备的“浩亭专家营”将于秋季正式启动。浩亭专家营为连通技术专家提供了一个强大的平台,促进客户对话和沟通,而今秋的重点则是“未来技术连通”领域的最新发展和解决方案。 “全球化、人口变化和气候变化这三大趋势是当今世界的严峻挑战,浩亭“新技术与开发”管理委员会成员库尔特·贝滕豪森(Kurt D. Bettenhausen)博士...
1、汽车销量的冬天已经过去,春天还远么,2021年及未来5年整体销量趋势原购车群体主体60-70后加速老龄化,快速退出中国车市 ,后续主要是低速电动车的老年乐购车为主;原购车主体80后步入增购换购的阶段,但是对于增量贡献非常有限,想想上有老下有小,增购换购的主体也是非常有限的。 新增量主体90后人口逐年减少,持续稀释车市消费根基;社会财富正在加...

史海拾趣

问答坊 | AI 解惑

求助一个遥控电路设计

本人正在试制小型机械设备,需要用遥控方式来控制机器动作!有哪位大侠能帮助设计?请联系!QQ:553568248,13307173810!谢谢!…

查看全部问答∨

pic定时器0的初始值

void init_tmr0() {      T0CS=0;             //TMR0工作于定时器方式      T0IE=1;//Timer0中断允许      GIE=1;    &nbs ...…

查看全部问答∨

wince开发问题

各位大虾:       用PB5.0开发Wince时,locale specific support下没有MUI文件 请问MUI文件那里有下载,并且如何加载?       知道请教一下,万分感谢!!!!…

查看全部问答∨

wince 高手们,用什么函数能启用PDA的无线功能

wince高手们,小弟现在用的是华硕的626的一款pda,操作系统是windows mobile6.0,支持无线Wi-Fi; 小弟现有一个问题,我在程序中用什么函数能够自动启用无线功能?…

查看全部问答∨

有没有modelsim的高手,帮忙进来看看

本人新手,刚下载了个modelsim6.5,结果编译任何模块都出现:** Error: E:/modelsim SE 6.5/NAND.vhd(1): near \"module\": syntax  的错误,这是为什么啊? 请Verilog方面的大神出面指教,或者加我QQ:552104827,帮忙传个没问题的modelsim6 ...…

查看全部问答∨

请教2407 FLASH烧写的问题

2407自己作的板子,烧写flash没问题:ok:flash sectors programmed 但擦除的时候出现问题: unexpected fatal error encountered which may have been caused by a stack overflow,out of memory condition, or access violation I\\\'m going ...…

查看全部问答∨

如何在AQ430对MSP430IO口进行位操作?

请教,如何在AQ430对MSP430IO口进行位操作? 以前用过PIC 如果想对PA口的第一位操作 格式是 PORTAbits.RA0 不知道MSP的 如何操作IO口的位啊??…

查看全部问答∨

51单片机学习板------适用初学

能实现的功能:        一、6按键键盘:作为人机对话的输入设备,键盘设计下方,对于我们使用按键更加方便好用。其中两个按钮还可做中断实验用。 二、4位数码管:数码管共阳极采用三极管恒流驱动。学习数码管的静态与动态扫描显示技术。 ...…

查看全部问答∨

Verilog三段式状态机描述

 二段式:状态切换用时序逻辑,次态输出和信号输出用组合逻辑。        三段式:状态切换用时序逻辑,次态输出用组合逻辑,信号输出用时序逻辑。信号输出的process中,case语句用next state做条件,可以解 ...…

查看全部问答∨
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved