-------------
-------建立本地门户,发展网络资讯!--------------
英德视窗支持手机访问欢迎你订阅英德视窗信息 Rss2.0
资讯区:
服务区:
地方:
 
 
  您现在的位置: 英德视窗 >> 软件 >> 建站相关 >> 优化技术 >> 文章正文
  搜索引擎Yahoo的分类体系及性能评价  
作者:广西门户… 文章来源:不详 点击数: 更新时间:2006-8-18 14:07:45 【字体: 】        
 
 

搜索引擎Yahoo的分类体系及性能评价

  目前很多的搜索引擎都是将人工编制的等级式主题目录和计算机检索软件提供的关键词等检索手段结合起来,完成网络信息资源的组织任务。Yahoo就是这种等级式主题指南类搜索引擎的典型代表。
  Yahoo的魅力,就在于它的可浏览式等级主题索引。按照主题建立分类索引,提供全面的分类体系结构,并结合高质量的检索软件,Yahoo成功地建立起了一套独特的信息管理和组织机制,使得对网络信息的全面检索变成现实。现对Yahoo的类目体系、分类原理、检索方式、性能评价等作进一步的探讨。

 ■ 一、类目体系
Yahoo由14个基本大类组成,包括Art&Humanities(艺术与人文)、Business&Economy(商业与经济)、Computers&Internet(电脑与网际网路/网络)、Education(教育)、Entertainment(娱乐)、Government(政府)、Health(健康与医药)、News&Media(新闻与媒体)、Recreation&Sports(休闲与运动)、Reference(参考资料)、Regional(国家与地区)、Science(科学)、SocialScience(社会科学)、Society&Culture(社会与文化)。

  根据其拥有的信息或网站的多寡及知识组织的需要程度,每一个基本类目下细分不同层次的次类目或子类目,愈往下的子类目中的网站其主题愈特定。它建立了一个由类目、子类目等构成的可供浏览的相当详尽的目录等级结构。其类目设计合理,结构完整、全面,类目等级层次鲜明,各级详略、宽泛程度不一,从而为网上丰富的信息资源的归类,尤其是确切归类提供了基础。

 ■ 二、分类原理
  InternetScoutProject的分类专家AimeeGlassel认为,“印度著名分类专家和图书馆专家阮岗纳赞的冒号分类法理论体系与Yahoo网络信息资源的主体目录之间存在着密切的联系”,从而揭示了Yahoo应用分面分析方
法进行网络信息资源的分类实质。具体说来,可从以下几点来深入地理解Yahoo的分面分类原理或基本过程。

1.采用宽泛的主题领域建立分类索引

为了使其分类体系既具有无限的容纳性,又具有相当的专指性,Yahoo采用较为宽泛的主题领域,通过分析兼综合的方法建立较为完整的分类索引。这与分面分类的思想不谋而合,因为将知识分为宽泛的类目即分面,多方面地反映主题内容以避免列举式类表的线性单向式的结构正是阮岗纳赞冒号分类法的主要原则所在。

2.根据上下文进行信息内容的组合

  从Yahoo的分类结构外表看,也许会认为它与叙词表很相近,因为Yahoo也是使用词汇而非符号来组成相应的概念词串。但是,从组合类目的能力看,它远远比普通的叙词表复杂得多。通过分析Web页面的内容特征,得
到由Yahoo分类体系结构中某些类目词组成的概念词串或标引词串,将其放入相应的类目层次中。在Yahoo的概念词串或检索词串中包含的独立的词汇都含有自身的名字,但是一旦与其它词组合,则产生了一个上下文关系,拥有了一深层次的涵义。从这一点上说来,与分面分类法也是极为相似的。

3.利用冒号标记信息内容

现以“20世纪60年代印度在肺结核治疗方面的研究”作为待分类标引的信息内容来具体考察两者的标记制度:

在阮岗纳赞的冒号分类法中,该内容标引为:L,45;421;6;253;f.44‘N5

用词代替相应的符号,则为:

  Medicine,Lungs;Tuberculosis:Treatment;X-ray:Research.India‘1950

  如果将分面公式中的相应标点符号用冒号代替,由此所形成的字符串形式就是在Yahoo中用于描述信息内容的
方法,相应地表示为:

  Health:DiseasesandConditions:Tuberculosis

  可见两者在信息描述上何其相似!Yahoo利用冒号作为统一的分隔符进行了信息内容的组织和描述,既保留了
原先的分面标记的特点,又在一定程度上简化了标记制度,从而极大地提高了信息分类标引的效率。

4.提供不同的分类路径入口

  “虚拟的信息集合”是Yahoo的一大优点,体现在其拥有的概念模式和引用次序(即分面排列次序)的灵活性
上。在传统的图书馆中,一本书只能放在书架的某一固定位置上。但在数字化的世界里,电子信息资源却不用再限制在唯一的物理位置上。我们可以将某一信息源分到类目结构的不同位置上。通过将分面分析方法应用到网络信息资源的组织中,Yahoo能够为某一信息源在其巨大的分类等级结构中提供不同的路径分支入口,这样就使其能够从不同的路径,为检索相同内容的不同用户提供服务,从而完成查询。

  例如,现欲查找美国Wisconsin-Madison大学所在的网页,Yahoo就能提供如下几种分类或检索路径:

(1)若从Regional:类目入手,则相应的分类路径为:Regional:U.S.States:Wisconsin:Cities:Madison:Education:CollegesandUniversities:
UniversityofWisconsin-Madison。

[当前第1页/共2页]     <<上一页   下一页>>

文章录入:admin    责任编辑:admin 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
     
         
     
    相 关 图 片
     
     
    热门排行
     
     
    --------
     
     
    相关信息
     
    没有相关文章

     
    Copyright © 2003-2006 Ydnet.CoM.Cn Inc. All rights reserved. 英德视窗 版权所有
    未经英德视窗书面特别授权,请勿复制或建立镜像,违者依法必究
    网站备案号:
    粤ICP备06034210号 QQ:50814947