2.6、知识技术类开源软件

大纲
1、开放源码软件的政策和战略
    1.1美国    1.2欧盟     1.3英国    1.4联合国
2、主要的数字图书馆开放源码系统和软件
    2.1检索和搜索引擎类开源软件     2.2门户类开放源码软件
    2.3OAI、OpenURL、Z39.50等标准和协议接口类开放源码软件
    2.4机构仓储类开放源码软件     2.5内容管理类开放源码软件
    2.6知识技术类开源软件     2.7其它重要的开源软件
3、数字图书馆开放源码软件的研究和交流
    3.1eIFL(图书馆电子信息协会)     3.2IFLA(国际图联)     3.3DLF(数字图书馆联盟)     3.4美国图书馆和信息技术协会(LITA)     3.5D-Lib期刊     3.6Oss4Lib和Code4Lib
4、开放源码软件在数字图书馆中的应用实例分析
    4.1NSDL:转向基于Fedora的框架的数字图书馆  4.2CDL:开放源码软件构建数字保存仓储
    4.3IIPC:构建基于开放源码软件的Web存档方案
5、结论


越来越多的图书馆员认识到,数字图书馆的服务不能仅仅停留在文献的检索和传递之上。为了提高数字图书馆的信息处理能力,很多原来属于自然语言处理、人工智能领域的研究领域也被数字图书馆研究人员所关注,文本分析、知识抽取、知识发现、数据挖掘、知识建模、可视化技术等都成为了当前数字图书馆研究的一个重要前沿,很多这些领域的优秀开放源码软件也得到了数字图书馆界的关注。表6列出的是这些领域的开源软件,其中GATE[66]包括了许多语言分析工具,能够在非结构化文本中抽取出关键的信息,实现非结构文本向结构化数据的转变;Protégé[67]是目前广泛使用的Ontology建设工具; WEKA[68]和YALE[69]则是两个优秀的机器学习软件,可以通过多种算法实现数据挖掘;Graphviz[70]能够实现结构化信息的可视化呈现;Sesame[71]则是一个重要的语义Web工具,可以存储RDF数据,并进行语义推理。

表6知识发现和知识表现类开源软件

软件名称

开发团体

主要特点

环境

GATE

NLP of University of Sheffield

通用的文本工程框架,领先的文本挖掘工具,开源的信息抽取系统

Java

Protégé

National Library of Medicine

Ontology编辑器基于知识的开发框架

Java

WEKA

University of Waikato

包括一系列实现数据挖掘和知识发现机器学习算法的软件

Java

YALE

University of Dortmund

快速构建数据挖掘原型系统的环境,一个集成化的数据挖掘开发工具

Java

Graphviz

 

结构化信息的可视化呈现工具

 

Sesame

openRDF.org

支持RDF推理和查询的RDF数据库

Java

版权所有© 2008 中国科学院国家科学图书馆 制作维护:中国科学院国家科学图书馆信息系统部
地址:北京中关村北四环西路33号 邮政编码: 100190