数字图书馆研究

2008/10/10   点击数:365

[作者] 图人话图

[单位] 图人话图

[摘要] 图书馆面临的挑战:互联网搜索引擎巨头、商用数据库、维基百科以及文摘和剪报等个性化收藏WEB。图书馆的出路到底在哪里?开放、免费、知识服务和保留传统图书馆阅读文化。图书馆、档案馆、情报机构、博物馆以及出版发行机构的多位一体。图书馆为教学与科研工作提供的一个支撑作用:量身定制、自动计算和辅助决策。数字图书馆是采用现代高新技术所支持的数字信息资源系统,是下一代因特网网上信息资源的管理模式,将从根本上改变目前因特网上信息分散不便使用的现状。但是形成的如此“超大规模的知识中心”使用不便的问题并没有根本改变或改善不大。

[关键词]  数字图书馆 文献信息 知识挖掘



一、研究背景:

图书馆面临的挑战:互联网搜索引擎巨头、商用数据库、维基百科以及文摘和剪报等个性化收藏WEB。

图书馆的出路到底在哪里?开放、免费、知识服务和保留传统图书馆阅读文化。图书馆、档案馆、情报机构、博物馆以及出版发行机构的多位一体。

图书馆为教学与科研工作提供的一个支撑作用:量身定制、自动计算和辅助决策。

数字图书馆是采用现代高新技术所支持的数字信息资源系统,是下一代因特网网上信息资源的管理模式,将从根本上改变目前因特网上信息分散不便使用的现状。

但是形成的如此“超大规模的知识中心”使用不便的问题并没有根本改变或改善不大。

数字图书馆的特征主要表现在以下几方面:

文献信息资源数字化

文献信息资源共享化

信息传播网络化

文献信息中心的虚拟化

文献信息工作的产业化

文献信息人员专家化

文献信息提供的智能化

二、意义:

1、为馆藏提供策略支持。全面广泛收集各学科、各语种和各国家的资料是不可能的,英国图书馆理事会业已承认这一点,重点应该放在目前最常使用,或将来最有可能使用的资料上。

(鼓励公共资金机构面向公众的政策。)

2、致力于对学术、研究和创新作出更多贡献。

3、支持广义上的学习。

4、让需要图书馆馆藏的人充分利用知识和信息。

三、途径:

渠道分类:专业文献、专业数据库、专业网站和其他相关资源;

资源分层:本领域核心资源、本领域相关资源、相关领域核心资源、其他领域资源;

形成“学术关系网”。

1、高品质期刊

2、综述性期刊或文章

3、本学科著名学者及研究机构的研究成果

4、专业文献数据库

5、ISI Current Contents(期刊题录快讯)

6、CALIS西文期刊目次库(CCC)

7、专业网站

8、专业学会或团体机构网站

9、本课题网上论坛

10、“最新文献通报”(Current Awareness)

11、图书馆"新书通报"栏目

四、如何?

“知识挖掘”

“知识挖掘就是一个从数据集中识别有效的、潜在有用、最终可理解的模式的过程。模式是一个用语言来表示的表达式,它可用来描述数据集的某个子集。我们所说的知识,是对数据包涵的信息更抽象的描述。对大量数据进行分析的过程,包括数据准备、模式搜索、知识评价,以及反复的修改求精。该过程要求有一定程度的智能性、自动性。有效性是指发现的模式对于新的数据仍保持有一定的可信度;新颖性要求发现的模式应该是新的;潜在有用性是指发现的知识将来有实际效用,如用于决策支持系统里可提高经济效益;最终可理解性要求发现的模式能被用户理解,目前它主要是体现在简洁性上。有效性、新颖性、潜在有用性和最终可理解性综合在一起可称之为兴趣性。”

知识挖掘全过程

◆数据清洗(data cleaning)

其作用就是清除数据噪声和与挖掘主题明显无关的数据;

◆数据集成(data integration)

其作用就是将来自多数据源中的相关数据组合到一起;

◆数据转换(data transformation)

其作用就是将数据转换为易于进行数据挖掘的数据存储形式;

◆数据挖掘(data mining)

它是知识挖掘的一个基本步骤,其作用就是利用智能方法挖掘数据模式或规律知识;

◆模式评估(pattern evaluation)

其作用就是根据一定评估标准(interesting measures)从挖掘结果筛选出有意义的模式知识;

◆知识表示(knowledge presentation)

其作用就是利用可视化和知识表达技术,向用户展示所挖掘出的相关知识。

原文连接:http://xxmulibrary.blog.sohu.com/101701702.html