浅谈人工智能在信息检索中的应用

2022-04-07 08:44
37
0
添加收藏

李玲

【摘 要】人工智能是对人的意识、思维的信息过程的模拟。本文介绍了当前信息检索面临的问题和现有人工智能方法,并阐述了现阶段人工智能在信息检索方面的应用。

【关键词】人工智能;信息检索;检索技术

【Abstract】Artificial intelligence is the simulation of the information process of human consciousness and thinking. This paper introduces the current problems of information retrieval and the existing artificial intelligence methods, and expounds the application of artificial intelligence in information retrieval.

【Keywords】Artificial intelligence; Information retrieval; Retrieval technologies

一、引言

人工智能(Artificial Intelligence)是当前科学技术发展中的一门前沿学科,是在计算机科学、控制论、信息论、神经心理学、语言学等多种学科基础上发展起来的一门综合性很强的边缘学科。它是研究机器模拟人的大脑所从事的感觉、认知、记忆、学习、联想等思维活动,解决人类才能处理的复杂问题,实质上是模仿人的大脑而展开思考。目前,人工智能技术已经应用在许多方面,而信息检索(Information Retrieval)就是其中的一个重要应用。

二、信息检索存在的问题

信息检索将分散的信息以某种方法提炼、整合成数据资源,然后从数据资源中正确找出用户指定的信息。信息检索存在很难成立信息检索的专家库、计算机识别自然语言能力差等问题。

(1)获取知识,关键是很难成立信息检索的专家库。用户因为年龄、受教育程度、爱好、职业等方面的原因,对获取信息的需求不同。专家能满足人们知识领域的专业需求。对计算机来说,合理定位用户是一件困难的事情。术业有专攻,各种领域的知识专业性,严重阻碍了计算机对系统化知识的整理。每一位专家在信息检索知识方面具有独特的见解,而计算机对专家经验认知的偏差,导致难以成立信息检索的专家库。例如,计算机工程师和商店服务员分别查询“无人商店”的信息,计算机工程师检索需求侧重于技术,商店服务员检索需求侧重于应用。

(2)知识的表示,关键是计算机理解自然语言的能力。人们重要的沟通交流工具是语言,它会根据人们生活的发展而不断改进。人们拥有丰富的语言能力,能轻松地表达各种情感,描述各类词语。用户可以通过一句话的语调,表达自己的两种态度。例如“你真讨厌”,这句话对于情侣来说,有可能是厌烦,也可能是撒娇。计算机面对词语,没有情感,不能准确描述信息的内容。因此,计算机对语言环境缺乏精确判断,阻碍了信息检索技术的发展。

要想提高计算机的数据信息处理能力和自然语言的理解能力,要将人工智能技术与信息检索技术有效地结合起来。

三、人工智能方法

人工智能就是为了帮助人们更快的解决问题,它包括两方面:对于确定性事物的判断和对于不确定性事物的判断,它的主要方法包括以下几种。

(一)启发式搜索

不断地尝试各种方案的准确性,对各种可能性进行反复测试,直到找到合适的解决方案,是人们常用的方法。常用的搜索策略有盲目搜索和启发式搜索。盲目搜索是按顺序测试各种方案的可行性;而启发式搜索则可以根据经验和启发式信息进行搜索,对希望不大的搜索方向就直接摒弃掉。

启发式搜索可以利用问题本身的定义,还可以利用与问题有关的一些特定的知识进行搜索,因而可以找到更有效的解决方案,大大缩短了搜索过程。

(二)智能规划

智能规划主要是面向实际问题,基本思想是:对周围环境进行认识与分析,根据要实现的目标,对若干可供选择的动作及所提供的资源限制施行推理,综合制定出实现目标的规划。规划要依靠启发式信息,成功与否,很大程度上决定于启发信息的可靠程度。而智能规划问题的操作的前提之间也存在着很强的依赖与冲突关系,即一个操作的使用常常使另一个操作无法执行,甚至导致最终目标无法实现。因此,在智能规划中也要考虑如何避免操作间的冲突。

智能规划目的是建立起高效实用的智能规划系统。该系统的主要功能可以描述为:给定问题的状态描述、对状态描述进行变换的一组操作、初始状态和目标状态。智能规划系统能够给出从初始状态变到目标状态的一个操作序列,其复杂性和所处的环境以及Agent的功能有关。

(三)知识的表达技术

知识及其表达是计算机科学中智能程序设计研究的主要领域,也是人工智能领域关心的基础性问题。知识表达(Knowledge Representation),即知识表示或知识描述,也就是知识的形式化或模型化,是研究在机器中表示知识的方法、可行性、有效性及一些通用的原则。而智能程序,就是把现实世界的知识有机地结合到计算机程序中,使程序具有识别、学习、推理和适应环境等能力。主要技术包括:如何把各类知识进行编码、存储;如何快速寻找需要的知识;如何对知识进行运算、推理;如何对知识进行更新、修改等。

四、人工智能在信息检索中的应用

人工智能是对人的意识、思维的信息过程的模拟,已被应用于电商零售、教育等各个领域。智能信息检索系统是模拟人類关于数据处理的思维过程和智能活动,实现知识的检索、表示和推理,还为用户提供智能辅助。从技术方面,将智能信息检索技术分为三类:基于垂直搜索的信息检索技术、基于语料库的信息检索技术和基于语义网的信息检索技术。

第一种垂直搜索的信息检索技术,是基于研究各种信息的专业性,采用结构化信息加工、全文深度搜索、分组和捕获等核心技术,检索信息。垂直搜索的信息检索技术具有查询时间短、搜索效率高的优点,其缺点是应用范围有限、查全率低、需要人工建模分类。例如,大学生毕业找工作,可以去求职网页上,按照工作岗位、工资薪酬、工作地点等检索条件查找自己需要的岗位。

第二种语料库的信息检索技术,是基于多种多样的自然语言,采用解析目标信息的语义,在语料库中搜索到与内容相匹配的信息。语料库的信息检索技术具有查询信息范围大、正确率高、查全率高的优点,其缺点是检索时间长、需要人工构建语料库。

第三种语义网的信息检索技术,是基于研究数据之间的关系,使用语义网技术,完成信息查找。语义网的信息检索技术提高了数据检索层面、增强了自然语言的理解力、提升了查全率,其缺点是检索速度慢、查询复杂、耗费大量人工。

五、结语

随着各个领域信息量的不断增加,人们对信息检索的需求也日益增加,传统的信息检索方法逐渐被智能信息检索系统取代。智能信息检索满足人们对信息多样化的需要,有利于提高信息检索的效率。

【参考文献】

[1]吕进来.人工智能技术在信息检索中的应用[J].山西电子技术,2016(5):34-35.

[2]宋文宾,钱兴华,刘鹏.智能信息检索应用技术研究[J].船舶电子工程,2015(7):136-140.

[3]付存君.智能信息检索发展现状的研究[J]. 信息与电脑,2015(12):23-24.

全部评论