复习题 - Shandong University.docx
《复习题 - Shandong University.docx》由会员分享,可在线阅读,更多相关《复习题 - Shandong University.docx(2页珍藏版)》请在第壹文秘上搜索。
1、1) Web搜索引擎一般有哪3个部分组成(Web网页收集,中间的索引处理和对用户查询的检索排序),能叙述各自的主要功能。2)信息检索系统的数学模型是怎么描述的,能给出数学模型中的参数的含义说明?3)信息检索的两种不同检索形式及含义:特别(adhocretrieval)检索,用户可以不断地提出新的检索需求或新组合,检索系统中的文献不变;-Google9Baidu,.过滤(filtering):用户的检索需求描述是固定不变的,当得到新的文档后,把与用户需求相关的文档留下,并分类和排序后提交给用户。-股票,新闻,天气,航班4)简述向量空间模型(VSM),其中包括文挡的向量表示方式,tf,idf的含义
2、(看课件),以及如何计算向量之间的相似度的方法。这种方法的优缺点是什么?当维数比较大时,利用隐性语义索引模型降维的方法是什么?其数学原理是什么?(见课件)5)因为字符串操作是信息检索的关键性计算,能掌握常用的对字符串处理的算法,包括字符串A.B的编辑距离、A在B出现位置的精确匹配的定义和算法,k-近似匹配的定义和算法,以及求A,B之间的最大公共子串的定义和算法。6)能给出信息检索中常用的测度,如查全率、查准率和Fl计算公式。知道11个标准查准率是如何规定的,查准率直方图、E测度指标的含义是什么?面向用户的测试集合及信息检索系统的性能是如何确定的?对目前常用的MRR,NDCG的测度又是怎样定义的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 复习题 Shandong University
