搜索
亲爱的,你连阅读理解都做不过AI了
10-23
865

从这个逻辑上看,阅读理解对于AI来说绝不仅仅是个测试,或者商业应用的技术加持,更重要的是开启AI纪元里理解力的加速器。


亲爱的,你连阅读理解都做不过AI了


提起阅读理解这四个字,你会想到什么?

被四六级、雅思、托福支配的恐惧?英语试卷上连原作者都搞不懂的选择题?

不管哪种答案,肯定都逃不出一个规律:进行阅读理解这项“有益身心运动”的主体,必然是跟你我一样的人类。

毕竟嘛,这东西需要阅读一大段文字,然后理解了意义之后再做题目,堪称一场英语考试中最复杂最费脑筋,也最考验综合能力的一个环节。所以你的英语老师一定说过这样一句话:得阅读理解者得天下。

但是,我如果告诉你今天得这个天下的,已经不再是人类而是AI了,你会怎么想?也许此前我们想象过AI可以完成单词听写、句子翻译甚至写作,但可能很多人可能都没有想到,AI做阅读理解现在也能甩人类几条街。

可事实就是这样,1月11日,斯坦福大学著名的机器阅读理解赛事SQuAD刷新了全球排名,阿里巴巴凭借82.440的精准率打破了世界纪录,超越了人类82.304的平均得分。

当然了,AI是不会去跟你比托福刷分的,这件事的背后,脑洞有点大哦......

什么是机器阅读理解?

机器阅读理解,虽然看起来只是让AI上阵来一场考试。但是却是自然语言处理技术中,继语音判断、语义理解之后最大的挑战:让智能体理解全文语境。

而斯坦福大学发起的SQuAD挑战赛,则是业内公认的机器阅读理解最高水平赛事。



SQuAD挑战赛的基本规则,是通过众包的方式构建一个包含10万个问题左右的大规模数据集,并给出来源于维基百科长度大约在几百个单词左右的文章。参赛者提交的AI模型在阅读完数据集中的一篇短文之后,回答若干个基于文章内容的问题,答案与标准答案进行比对,最终得出成绩。

由于阅读理解这项“智能”调整,需要运用到大量逻辑、细节和结构分析能力,并且直接作用于现实中的文本资料,所以实际价值很大。

比如说,我们首先要面对的问题就是,假如AI已经比人类平均水平更擅长于对文本中的精准信息进行理解和回答,会带给我们什么呢?

当AI的“阅读理解”得分超越人类,意味着什么

举个例子或许可以很简单地理解这个问题:英语考试上,当AI可以翻译单词的时候,我们一点都不惊奇;但AI可以听写整句话的时候,我们会感叹技术进步了;当AI自己做阅读理解的时候,我们大概会想,还要我考这个试干什么?

这里面的差别,在于处理阅读理解相关问题时,AI不只是要运算和记录,而是要主动去分析和理解。所以阅读理解问题一直被人当成是NLP的标志性临界点。但这个点被AI破解,直接意味着原本很多必须由人类才能完成的工作,已经能够被AI接管。

因为阅读理解问题,不只是要处理语音和简单的语义,而是要理解和关注词汇、语句、篇章结构、思维逻辑、辅助语句和关键句等等元素构成的复杂组织网络。

机器阅读理解“达标”,最直接的产业影响是大多数今天还必须由人工完成的规则、对话、服务信息类的相关工作,都可以被AI所取代。比如说客服、信息管理和推荐类的工作,都可以考虑用不眠不休、高运算速度的机器来取代。

机器阅读理解如何工作

或许我们都注意到了这样一个问题:今天的互联网世界,文本内容在变得越来越多,各种各样的信息爆炸而来。太多你知道的、你不知道的、你以为自己知道的却实际不知道的事情呼啸而过。甚至你双11想要剁个手,都有各种各样的游戏规则等着你。自己读吧,太累太痛苦还没时间,问客服吧,很可能出错还很慢,简直是薛定谔式问题。

这里或许就可以用AI阅读理解来解决了。比如客户对某个电商促销规则有疑问,就可以直接向AI提问,而AI就可以把这个问题当做阅读理解来进行解决方案回馈。

AI的阅读理解能力,将在如何向客户提供非模板式的智能客服服务中发挥作用。而当AI在这些能力上超越人工,那么AI客服的利用价值将可能快速提升。换句话说,AI客服终于可以不那么机械化了。

由此不难看出,这种关键能力的突破,对大量强调与普通消费者交互的产业线益处最多。

推而广之,AI阅读能力也是文娱领域进行内容寻找和推荐的有效方式,比如阅读用户提出的复杂需求,进行精准推荐;与IoT产品相结合,给出对用户大段语言的回馈,乃至对话互动,都必须以机器理解能力为依托。

理解力,让我们在未来面前不仅是个孩子

除了知道AI可以充当更好的客服之外,究竟我们为什么应该关注AI阅读理解这件事?或许关键,是我们应该知道“理解力”在目前AI世界中的重要程度和期待指数。

AI作为一种从计算机科学下的分支,一个智能体先天具备的是运算能力,而希望进行仿人类智慧的智能模拟,第二步就是模仿人类的感知。今天我们看到的机器视觉、语音识别、语义理解,都是在做这件事。而第三步,就是让AI产生理解力。



显然,识别有着庞大应用场景,并会在接下来很长一段时间内占据主流。但是AI的理解能力是大多数识别能力的进化,假如单纯识别出却无法产生输出,那么AI无非只是更灵活的传感器而已。

从这个逻辑上看,阅读理解对于AI来说绝不仅仅是个测试,或者商业应用的技术加持,更重要的是开启AI纪元里理解力的加速器。

更广阔的意义在于,当我们不再考虑AI是否能理解人类文本和语言,那么DeepNLP将可能达成,人机交互的范围将级扩大。AI可以开始捕捉人类的逻辑和函指。

可能那还很远,也可能很近,但机器理解力让我们在未来面前不再是个孩子,这应该是毫无疑问的。(原文链接:https://www.huxiu.com/article/229679.html)


'