全文检索者站内搜索引擎,数据库搜索引擎!
网站地图
业务联系
客户服务
栏目导航:  
网页库级垂直搜索引擎技术
全文检索者搜索软件系列介绍
搜索业内新闻动态
全文检索相关知识介绍
好文推荐:  
 
WEB网页结构化信息抽取技术介绍..
什么是垂直搜索?[原创]
如何量化用户体验UE(How T..
站内搜索引擎真伪鉴别[原创]
网站站内搜索成盲点,成功率仅33%
Google新闻对中国媒体网站的..
使用站内检索的五大理由
站内搜索成为电子商务网站收入关键点
 
中文全文检索网首页 > 全文检索相关知识介绍 > 全文检索概念
 
全文检索概念
http://FullSearch.Com 中文全文检索网 2006-8-18 10:15:08
关键词:全文检索

全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。


全文检索的方法主要分为按字检索和按词检索两种。按字检索是指对于文章中的每一个字都建立索引,检索时将词分解为字的组合。对于各种不同的语言而言,字有不同的含义,比如英文中字与词实际上是合一的,而中文中字与词有很大分别。按词检索指对文章中的词,即语义单位建立索引,检索时按词检索,并且可以处理同义项等。英文等西方文字由于按照空白切分词,因此实现上与按字处理类似,添加同义处理也很容易。中文等东方文字则需要切分字词,以达到按词索引的目的,关于这方面的问题,是当前全文检索技术尤其是中文全文检索技术中的难点,在此不做详述。


全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。一般来说,全文检索需要具备建立索引和提供查询的基本功能,此外现代的全文检索系统还需要具有方便的用户接口、面向WWW的开发接口、二次应用开发接口等等。功能上,全文检索系统核心具有建立索引、处理查询返回结果集、增加索引、优化索引结构等等功能,外围则由各种不同应用具有的功能组成。结构上,全文检索系统核心具有索引引擎、查询引擎、文本分析引擎、对外接口等等,加上各种外围应用系统等等共同构成了全文检索系统。图1.1展示了上述全文检索系统的结构与功能。


全文检索


在上图中,我们看到:全文检索系统中最为关键的部分是全文检索引擎,各种应用程序都需要建立在这个引擎之上。一个全文检索应用的优异程度,根本上由全文检索引擎来决定。因此提升全文检索引擎的效率即是我们提升全文检索应用的根本。另一个方面,一个优异的全文检索引擎,在做到效率优化的同时,还需要具有开放的体系结构,以方便程序员对整个系统进行优化改造,或者是添加原有系统没有的功能。比如在当今多语言处理的环境下,有时需要给全文检索系统添加处理某种语言或者文本格式的功能,比如在英文系统中添加中文处理功能,在纯文本系统中添加XML或者HTML格式的文本处理功能,系统的开放性和扩充性就十分的重要。


 


 

本文地址:http://www.FullSearcher.Com/n200681810140735.asp
网站地址:http://www.FullSearcher.Com/
文章来源:
 

相关文章: 最新文章:
·全文检索概念
·互联网需要全文检索
·全文检索者站内搜索引擎门户版2...
·通知:停止一切对外技术服务
·网页搜索引擎竞争分析[原创]
·酷讯
·全文检索概念
·刑侦角度看搜索
·搜索引擎antispam系统设计指南[转..
·搜索引擎机器人研究报告
业务联系  客户服务  网站地图  合作联系  关于我们  友情链接    广告:cheap wow gold
Copryright (c)2003-2004 FullSearcher.Com. All Rights Reserved.
京ICP备05007519号