第八讲语言智能.docx
《第八讲语言智能.docx》由会员分享,可在线阅读,更多相关《第八讲语言智能.docx(6页珍藏版)》请在第壹文秘上搜索。
1、第八讲语言智能教学内容:本章主要学习机器语言智能基本原理,包括自然语言处理技术及应用、语音识别、机器翻译等内容。教学重点:自然语言处理技术、语音识别。教学难点:语音识别、机器翻译。教学方法:课堂教学为主,结合智慧树等在线平台实时提问、收集学生学习情况,充分利用网络课程中的多媒体素材来表示语言智能技术的实现原理和过程。讨论五分钟。课后布置作业,要求学生查找、阅读与自然语言处理技术有关的经典论文等。学习慕课第八章语言智能并完成章节测试。教学要求:重点掌握自然语言处理句法分析、词法分析、语义分析、语用分析等原理,智能问答原理、聊天机器人原理、语音识别原理、机器翻译原理。课程思政内容:本章无相关内容。
2、学习目标:1 .理解语言智能的含义,语言与认知的关系。2 .掌握自然语言处理的基本原理与方法。3 .了解语言智能在实现机器智能方面的应用,包括智能问答系统、聊天机器人、语音识别、机器翻译。学习导言人类的语言及其意义十分更杂,不同的文化、种族、地域所形成的语言和意义有很大差别。蒙古语中与“马”相关的词汇有几十种,爱斯基摩人用于表示“雪”的词汇也有几十种,而不生活在马和雪的世界的人用于描绘“马”和“雪”的词汇就很少。是语言造就了概念,还是概念造就了语言?语言是如何形成的,与人类的智能有什么关系?语言的机制是什么?语言与大脑功能区域有什么关系?这些问题不仅对于理解人类的语言秘密很重要,对于机器而言,
3、具有基于语言的认知智能更加重要。对人类而言,利用语言进行日常交流、表达思想和文化传承是人类智能的重要体现,也体现为一种语言智能。对于机器而言,机器的优势在于拥有更多的记忆能力,但却欠缺语意理解能力,包括对口语不规范的用语识别和认知等。目前还没有出现能像人与人之间一样正常交流的机器,也不存在理解人类语言含义的机器。但是,为了让机器与人类进行交流,研究人员开发了许多使机器能够处理人类语言信息的方法,利用这些方法,一定程度上,机器能够依靠算法和计算机与人类进行交流,这主要是依靠自然语言处理技术来实现。机器通过自然语言处理技术对人类语言包含的信息进行解析并做出相应的反应,就表现出一定程度的语言智能。本
4、章主要介绍机器实现语言智能的一些初级方法和技术。8.1语言与认知在人类认知的五个层级中,语言认知处于非常特殊的地位。其一,语言区分了人类认知和动物认知。语言的发明是人类进化关键的一步。自从使用表意的符号语言和文字,人类的经验就可以形成知识,积淀为文化,从此人类的进化不再是动物的基因层级的进化,而是语言、知识和文化层级的进化;其二,语言使思维成为可能。人类的语言能力表现在:主要通过隐喻的方法,产生和使用抽象概念,并在抽象概念的基础上,形成判断,进行推理。应用判断和推理,人类可以进行决策和丰富多彩的思维,包括数学思维、物理学思维、哲学思维、文学思维、历史思维、艺术思维等等。语言和思维形成知识,知识
5、积淀为文化,非人类的动物则只能由每一代和每一个个体重新开始积累经验,其进化只能是基因层次的进化。人类知识绝大部分来源于前人创造和积累的间接知识,其进化不仅仅是基因层次的进化,更主要的是知识和文化的进化。8.2自然语言处理自然语言处理(NaturalLanguageProcessing,NLP)就是用计算机来处理、理解以及运用人类语言(如中文、英文等),它属于人工智能的一个分支,是计算机科学与语言学的交叉学科,又常被称为计算语言学。从微观上讲,自然语言理解是指从自然语言到机器(计算机系统)内部之间的一种映射。从宏观上看,自然语言理解是指机器能够执行人类所期望的某些语言功能。这些功能包括:(1)回
6、答有关提问;计算机正确地回答用自然语言输入的有关问题。(2)提取材料摘要;机器能产生输入文本的摘要同词语叙述;机器能用不同的词语和句型来笈述输入的自然语言信息。(3)不同语言翻译。机器能把一种语言翻译成另外一种语言1)自然语言理解的源起自然语言处理的兴起与机器翻译这一具体任务有着密切联系。第二次世界大战之后,二十世纪五十年代,当电子计算机还在襁褓之中时,利用计算机处理人类语言的想法就已经出现。当时,美国希望能够利用计算机将大量俄语材料自动翻译成英语,以窥探苏联科技的最新发展。2)自然语言处理的功能应用自然语言处理研究的内容十分广泛,美国认知心理学家G.M.OlSOn提出语言理解的判别标准:(1
7、)能成功地回答语言材料中的有关问题,就是说,回答问题的能力是理解语言的一个标准;(2)在给予大量材料之后,有做出摘要的能力;(3)能够用自己的语言,即用不同的词语来复述这个材料;(4)从一种语言转译到另一种语言。如果能达到上述标准,机器就能实现如下功能和应用:(1)机器翻译:实现一种语言到另一种语言的自动翻译。(2)自动摘要:将原文档的主要内容和含义自动归纳、提炼出来,形成摘要或缩写,(3)信息检索:信息检索也称情报检索,就是利用计算机系统从海量文档中找到符合用户需要相关文档。(4)文本分类:其目的就是利用计算机系统对大量的文本按照一定的分类标准(例如根据主题或内容划分等)实现自动归类。近年来
8、情感分类或称文本倾向型识别成为本领域研究的热点。(5)问答系统:通过计算机系统对用户提出的问题的理解,利用自动推理等手段,在有关知识资源中自动求解答案,并做出相应的回答。问答技术有时与语音技术和多模态输入、输出技术以及人机交互技术等相结合,构成人机对话系统。(6)信息过滤:通过计算机系统自动识别和过滤那些满足特定条件的文档信息(7)信息抽取:指从文本中抽取出特定的事件或事实信息,有时候又称事件抽取。例如从时事新闻报道中抽取出某一恐怖事件的基本信息:时间、地点、事件制造者、受害人、袭击目标、伤亡人数等;从经济新闻中抽取出某些公司发布的产品信息:公司名称、产品名称、开发时间、某些性能指标等。(8)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 语言 智能