You are on page 1of 43

网络信息检索

1 、网络信息资源特点及其类型
2 、 Web2.0 环境下的网络信息资源
3 、免费网络学术资源检索
4 、馆藏文献检索系统
5 、搜索引擎介绍
1 、网络信息资源特点及其类型

1.1 网络信息资源特点
*信息数量增长迅速
*信息质量良莠不齐
*存在状态无序且不稳定
*具有高度开放性
*使用方便共享度高
1 、网络信息资源特点及其类型

1.2 网络信息资源的类型
*从信息资源的内容角度划分
( 1 )新闻信息资源
( 2 )商业信息资源
( 3 )法律信息资源
( 4 )学术信息资源
( 5 )娱乐信息资源
*从所采用的网络传输协议角度划分
( 1 ) WWW 信息资源
( 2 ) FTP 信息资源
( 3 ) Telnet 信息资源
( 4 ) 用户服务组信息资源
2 、 Web2.0 环境下的网络信息资源

• 博客( Blog)
• 播客 (Podcasting/Podcast )
• 社会化标签 (Tag)
• 内容聚合 (RSS)
• 维基 (Wiki)
2 、 Web2.0 环境下的网络信息资源——博客

“ 博客”一词是从英文单词 Blog 翻译而来。 Blog 是 Webl


og 的简称, Weblog 就是在网络上发布和阅读的流水记录,通常称为
“网络日志”,简称为“网志”。

Blog 就是一个网页,通常由简短且经常更新的帖子构成,这些帖
子一般是按照年份和日期倒序排列的。而作为 Blog 的内容,它可以
是你纯粹个人的想法和心得,包括你对时事新闻、国家大事的个人看
法,或者你对一日三餐、服饰打扮的精心料理等,也可以是在基于某
一主题的情况下或是在某一共同领域内由一群人集体创作的内容。 Bl
og 是私人性和公共性的有效结合,它绝不仅仅是纯粹个人思想的表
达和日常琐事的记录,它所提供的内容可以用来进行交流和为他人提
供帮助,是可以包容整个互联网的,具有极高的共享精神和价值。
2 、 Web2.0 环境下的网络信息资源—播客

“ 播客”是数字广播技术的一种,初期借助一个叫 iPodde
r 的软件与一些便携播放器相结合而实现。
国内知名播客网站
土豆网 http://www.tudou.com/
QQvideo http://video.qq.com/home.htm
Youtube http://www.youtube.org.cn
新浪播客 http://v.blog.sina.com.cn/
Mofile TV http://tv.mofile.com/
优酷 http://www.youku.com/
56 http://www.56.com/
6 间房 http://www.6.cn/
UUme http://www.uume.com/
偶偶 http://dv.ouou.com/
酷6 http://www.ku6.com/
派派网 ( 音频播客平台 ) http://www.piekee.com
2 、 Web2.0 环境下的网络信息资源—标签

标签【 TAG 】
– 类似写文章给的关键词,有网民自己给的自由词,反应文章的特征。
标签的好处:
– 添加标签的文章就会被直接链到网站相应标签的页面,这样浏览者在访
问相关标签时,就有可能访问到个人的文章,增加了文章被访问的机会。
– 可以很方便地查找到与使用了同样标签的文章,延伸文章的视野;可以
方便地查找到使用了同样标签的作者,作为志同道合的朋友,可以将他
们加为好友或友情博客,扩大朋友圈。
– 增加标签的方式完全由个人自主决定,不受任何的限制,不用受网站系
统分类和自己原有日志分类的限制,便于信息的整理、记忆和查找。
2 、 Web2.0 环境下的网络信息资源—标签

如何添加“好”的标签?
①Tag 应该要能够体现出自己的特色,并且是大家经常采用的熟悉的词语。
② 用词尽量简单精炼 , 词语字数不要太长,两三个字的词语就可以了,尽量是有
意义的词汇,不要使用一些只作为装饰的符号,如{}等。
③ 不要使用一些语义比较弱的词汇,如“我的家”,“图片”等。

例:您写了一篇到北京旅游的文章,按照文章提到的内容,您可以给这篇文章加
上如下标签:
  北京旅游 , 天安门 , 长城 , 故宫
2 、 Web2.0 环境下的网络信息资源—标签

RSS (Really Simple Syndication) 是一种用于发布和获取网络内


容 ( 例如头条新闻 ) 的 XML 格式。使用 RSS 阅读器来阅读,你可以
不用一个个去开页面,也能够很快地知道关注网络内容更新了没有 ...

RSS 的特点:
1) 来源多样的个性化“聚合”特性,省去了在各个网站之间的奔波之
苦!
2) 信息发布的时效、低成本特性
3) 无“垃圾”信息、便利的本地内容管理特性
2 、 Web2.0 环境下的网络信息资源— RSS

RSS 利用
RSS 的阅读工具 ( 即 RSS 的阅读器 )——
抓虾、鲜果
看天下、周博通等
2 、 Web2.0 环境下的网络信息资源—维基

维基( Wiki )是多人协作的写作工具。同时也是一种思想(开放、


参与、整合)和网聚人力的模式。既是名词,指的是一些维基项目,又是动
词,指的是参与写作,贡献知识。

特点:任何人都可创建、改写、删除。
维基应用:
– 维基百科 http://zh.wikipedia.org/wiki/ 自由的百科全书
– 维基词典 http://zh.wiktionary.org/
– 维基资源 http://zh.wikisource.org/ 自由的图书馆
– 维基新闻 http://zh.wikinews.org/
– 维基教科书 http://zh.wikibooks.org/
– 维基语录 http://quote.wikipedia.org/
2 、 Web2.0 环境下的网络信息资源—维基

• 目前,维客技术主要的应用方式包括:基于同一主题的共享协作式创
作(例如新浪网等组织的“网同百家姓维客计划”)、资源共建、学
术课题的协作研究、传统会议拓展等。

• 从一般意义上来看,维客技术打破了网络上某些人垄断信息发布、更
新与维护工作的局面,进一步体现了信息自由共享的思想。同时,它
也为个人的信息与知识更新提供了一种方便的途径。与博客相比,维
客更强调多人协作。而对于新闻传播来说,维客未来将产生的冲击,
可能不亚于博客。
2 、 Web2.0 环境下的网络信息资源—维基

维基百科与传统百科全书的区别:
① 在维基百科发布材料的任何部份或全部都是使用 GNU 自由文档许
可证 ( 采用该协定的材料可以用做商业用途,但必须允许任何愿意
遵守该协定的人士在该协定下进一步修改或传播材料 ) ,维基百科
将自己定位为一个包含人类所有知识领域的百科全书,而不是一本
词典、网络论坛或其他任何商业性质的网站。
② 计划本身也是一个 wiki ,这允许了大众的广泛参与,维基百科是第
一个使用 wiki 系统进行百科全书编撰工作的协作计划。
③ 还有一个重要的特点,那就是维基百科是一部内容开放的百科全书,
内容开放的材料允许任何第三方不受限制地复制、修改。
3 、免费网络学术资源检索—外文图书

① 古腾堡项目( http://promo.net/pg)
② Bartleby 免费电子图书(
http://www.bartleby.com/)
③ 宾夕法尼亚大学的在线图书主页( The O
nline Books Page ) http://
digital.library.upenn.edu/books/
3 、免费网络学术资源检索—中文图书

① 起点中文网 http://www.qidian.com/
② 红袖添香小说网 http://www.hongxiu.com/
③ 晋江原创网 http://www.jjwxc.net/
④ 幻剑书盟 http://html.hjsm.tom.com/
⑤ 北极星书库 http://www.help99.com
⑥ 白鹿书院 http://www.oklink.net/
⑦ 亦凡公益图书馆 http://www.shuku.net
3 、免费网络学术资源检索—报纸

1 )国内报纸资源
① AB 报 http://www.abbao.cn/
② 8 点报 http://www.15525.com
③ 上海图书馆电子报纸导读 http://
newspaper.digilib.sh.cn/website/index.asp
3 、免费网络学术资源检索—报纸

2 )电子报纸推荐网站(美国)
① 《纽约时报》 (New York Times) http://www.nytimes.com
② 《华盛顿邮报》 (Washington Post) http://
www.washingtonpost.com
③ 《洛杉矶时报》 (Los Angeles Times) http://
www.latimes.com
④ 《今日美国》 (USA Today) http://www.usatoday.com
⑤ 《华尔街日报》 (Wall Street Journal) http://online.wsj.com
⑥ 《芝加哥论坛报》 (Chicago Tribune) http://
www.chicagotribune.com
⑦ 《纽约每日新闻》 (Daily News, New York) http://
www.nydailynews.com
3 、免费网络学术资源检索—报纸

3 )电子报纸推荐网站(英国)
① 《金融时报》( The Financial Times )
http://www.ft.com
② 《经济学人》( The Economist ) http://
www.economist.com
③ 《泰晤士报》( The Times ) http://
www.times.com.uk
3 、免费网络学术资源检索—开放获取资源

• 开放获取 (Open Access) 是国际学术界、出版界、图书情报界为了推


动科研成果利用互联网自由传播而采取的运动。其目的是促进科学及
人文信息的广泛交流,促进利用互联网进行科学交流与出版,提升科
学研究的公共利用程度、保障科学信息的长期保存,提高科学研究的
效率。

• 开放获取数字资源是网络上重要的共享学术信息资源,提供期刊论文
全文的免费阅读,是获取学术信息的一种新模式。

• 国外的一些研究表明,在很多学科领域,开放获取的文章比非开放获
取的文章具有更大的研究影响力。
3 、免费网络学术资源检索—开放获取资源

信息资源开放获取的三个途径:
① 开放获取仓储( Open Access Repository )
a) 对于有版权,但是出版社允许进行自存储( self-archiving )的
作品,作者可以放到信息开放存取仓库中,例如论文、专著等;
b) 对于没有版权的作品,作者可以直接放到信息开放存取仓储中,
例如讲义、 PPT 等。
② 开放获取期刊( Open Access Journals )
a) 出版提供信息开放获取的杂志,或者将原有杂志改造为信息开
放获取的杂志;
b) 期刊运行经费来源:一种是主办者全部筹集资金,杂志对作者
和读者都是免费的,
③ 个人网页
a) 对于有版权,但是出版社允许进行自存储的作品,作者可以放到
个人网页上;
b) 对于没有版权的作品,作者可以直接放到个人网页上
3 、免费网络学术资源检索—开放获取资源

部分国外开放获取数字资源:
• 加州工学院的开放数字文档收集项目
• Directory of Open Access Journals
• HighWire Press
• The Open Access Publisher
• Public Library of Science Journals
• J-STAGE E-Journal
• Scientific Electronic Library Online
• FreeFullText
3 、免费网络学术资源检索—开放获取资源

电子预印本特点
① 作者自愿提交:作者按照一定的格式将论文进行排版后,
通过网络、 E-mail 等方式,按学科类别上传至相应的目
录或库中。
② 文责自负:送入预印本库中的论文是不经过任何审核的,
也没有任何先决条件决定某一论文能否送入库中。只要作
者所投论文遵守国家相关法律,有一定学术水平,符合系
统的基本投稿要求。
③ 共享性:任何人在尊重作者版权的基础上都可利合理用。
④ 交互性:有些系统允许对论文进行评论和交流。
⑤ 多载体性:作者可发表到正式的刊物或其它载体形式上
⑥ 交流速度快、利于学术争鸣、可靠性高的特点。
3 、免费网络学术资源检索—开放获取资源

• 中国科技论文在线
http://www.paper.edu.cn/
• 中国预印本服务系统
• http://prep.istic.ac.cn/eprint/
• 奇迹文库预印本 http://www.qiji.cn/eprint/
• e-Print arXiv 预印本文献库
3 、免费网络学术资源检索—开放获取资源

更多的开放获取数字资源
• 开放仓储注册系统 (ROAR)
• http://archives.eprints.org/
• 有 1351 个开放资源。可根据地区、软
件平台、内容类型查询,或简单浏览。每
一个开放资源列有资源数量。
3 、免费网络学术资源检索—其他免费学术资源

学科信息门户网站

① Biz/ed - 网上的商业和经济教育门户( http://


www.bized.ac.uk/)

② DutchESS - 荷兰电子主题服务门户 ( http://


www.konbib.nl/dutchess/)

③ EEVL - 爱丁堡工程虚拟图书馆 ( http://


www.eevl.ac.uk/)

④ SOSIG - 社会科学信息门户 ( http://


www.sosig.ac.uk/)
3 、免费网络学术资源检索—其他免费学术资源

学科专业论坛

① 丁香园( http://www.dxy.cn/cms/)
—— 医学、药学、生命科学专业论坛

②小木虫( http://emuch.net/bbs/
—— 化学、物理、理工、人文社科等专
业的论坛
4 、馆藏文献检索系统
馆藏书目数据库(又称馆藏目录)——用来揭
示某个图书馆所收藏文献的基本信息的数据库。
具有以下特点:
① 它以一种、一册文献为单元,描述文献基本特征、展
示收藏情况(包括数量、收藏地点、流通状态等等)。
② 能够指引用户查找原始文献收藏地址的线索,进而方
便用户进行原文借阅、利用。
③ 现代图书馆馆藏目录通常在网上免费向公众开放(故
又称 OPAC ( Online Public Access Catalog )系
统),检索入口多、操作使用简单易学。
4 、馆藏文献检索系统 - OPAC 系统

OPAC 系统基本功能
一般图书馆的 OPCA 系统都可以为读者
提供多种检索途径,包括文献名称(如书
名、刊名等)、作者、出版机构、图书分
类号、主题词、 ISSN/ISBN 等,并支持多
种检索策略,如布尔逻辑检索、截词检索
和全文检索等。
4 、馆藏文献检索系统 - 联合目录

联合目录( union catalogue ) ——是揭示多个图书馆所收藏文献的基


本信息的数据库,主要用来帮助用户了解、利用非本单位图书馆的文
献资源。

它具有一般的馆藏书目数据库的特点,并可划分为:
( 1 )国际性的、国家性的和地区性的联合目录(根据收录文献机构
的地域组成。)
( 2 )图书联合目录、期刊联合目录、电子文献联合目录等等(根据
所反映的文献类型情况)。
( 3 )综合性的、专科性的联合目录(根据收录文献的内容范围决
定)。
4 、馆藏文献检索系统 - 联合目录

常见联合目录举例

① 《CALIS公共目录检索系统》
(反映全国主要高校图书馆文献资源收藏情况)
② 《中科院文献情报中心全国期刊联合目录》
(反映中科院系统图书馆文献资源情况)
③ 《北京高校图书馆电子化资源联合目录数据库》
(反映北京地区部分高校电子文献收藏信息)
④ OCLC ( Online Union Catalog )
(反映了世界上 76 个国家和地区的 39517 图书馆的馆藏信息 )
4 、馆藏文献检索系统 - 原始文献

原始文献( Original Article )——简


称原文,具有内容翔实、可信和实用的特点。

一般情况下,只有通过对原始文献的
阅读才能判断和利用所需要的信息,因此,它
是大多数用户进行文献信息检索的最终目标。
4 、馆藏文献检索系统 - 原始文献

为什么需要原始文献索取?
首先,没有一个图书馆能保证所收藏的文献能够满
足其用户的全部需求,求助馆外资源是十分必要
且常见的情形。
其次,尽管全文数据库正在日益增多,但一些著名
的检索系统(如 SCI/EI/CA/BP 等等)还是以提供
文献的题录、文摘为主。
因此,原文索取活动将不断持续进行。
4 、馆藏文献检索系统 - 原始文献

原始文献索取的要领
① 熟悉文献类型,辨别著录格式。
首先,需要了解从各种检索工具或参考文
献中获得的文献线索(即所要查找的原始文献)的
特征,(如期刊论文一般有篇名、作者、刊名等著
录事项;专利说明书则一定有相应的专利(申请)
号;而专著除了作者和名称外,还应当著录出版机
构及版本情况等)。
其次,正确识别、判断文献类别,是帮助
用户确定选择适当的检索系统获取原始文献的关键。
4 、馆藏文献检索系统 - 原始文献

原始文献索取的要领
② 准确记录相关信息
在查找之前,务必准确记录有关的文献线索。
例如:
* 刊名 \ 篇名 \ 卷 \ 期 \ 年 \ 起止页码及作者
* 书名、出版者、出版时间、起止页码
* 完整的编号( GB7713-87 ; US 5342578…… )
4 、馆藏文献检索系统 - 原始文献

原始文献索取的要领
③ 将缩写名称转换为全称
在查找外文资料时,常常会发现其中的刊名
著录采用了缩写形式。而在进行原文索取时却需要采用
准确的刊物的全称,因此必须解决让缩写刊名还原为刊
名全程的问题。
常见做法有:
★ 利用《国际期刊名称缩写表》( ISO-833 )等等等检索工
具予以查证。
★ 将已知缩写直接放到 Google 等搜索引擎上进行查证。
4 、馆藏文献检索系统 - 原始文献

④ 原始文献信息的查找原则及步骤
查找原文的总原则是“由近及远”。即
首先应该在本单位、本地区范围内查找,若没有结
果,再考虑到外地乃至全国、全世界范围去查找。
具体步骤是:根据已经掌握的文献线索
(书名、刊名、专利号、标准号等),先查本单位
图书馆馆藏目录( OPAC )。如果本馆缺藏,就
应当利用联合目录进行检索。
总之,应当选择地理位置相对近的单位
作为原文索取对象,以节省人力、时间、费用。
4 、馆藏文献检索系统 - 原始文献

⑤ 原始文献的索取具体做法
一般情况下,用户亲自前往相关
原文收藏地点索取原文。当原文收藏单位
与用户相距不近时,用户可以考虑借助图
书馆提供的相关服务(如、原文传递、馆
际互借等形式)来索取原文。这种服务一
般用户需要支付一定的费用。
5 、搜索引擎介绍
搜索引擎原理
利用自动搜寻软件,不断发现与收集各类新网址及
网页,利用自动索引软件对网页进行标引,建立记录的数据
库。当用户输入提问关键词之后,以不同的检索方法在其数
据库中找 出相关的记录,并按相关性顺序排列,将包含此关
键词或符合检索条件的所有网址信息和指 向这些网址的链接
反馈给用户,从而实现查询目的。

搜索引擎的主要任务
信息搜集
信息处理
信息查询
5.1 搜索引擎原理及类型
搜索引擎的类型
① 按搜索引擎包含检索工具的数量划分
—— 独立搜索引擎
—— 多元搜索引擎(或集合搜索引
擎)

② 按搜索收录内容区分
—— 综合搜索引擎
—— 垂直搜索引擎
5.2 综合性搜索引擎
① 百度 http://www.baidu.com
② 谷歌 Google http://www.google.com
③ 有道搜索 http://www.yodao.com/
④ 新浪爱问搜索 http://iask.com/
⑤ Alltheweb http://www.alltheweb.com/
⑥ AltaVista http://www.altavista.com
⑦ MetaCrawler http://www.metacrawler.com/
⑧ Dogpile http://www.dogpile.com/
5.3 垂直搜索引擎
① 生活搜索:酷讯 http://www.kooxoo.com
② 电子商务搜索:亨者 http://www.hengzhe.com
③ 旅游搜索: 去哪儿 http://www.qunar.com
④ 招聘搜索:搜职 http://www.globehr.com
⑤ 比价搜索: 顶九 http://www.ding9.com
⑥ 娱乐搜索: 视频搜索 http://www.openv.tv
课后思考题
1 . 了解并掌握 web2.0 环境下的网络资源
及其特点。
2. 根据专业,选择某一主题,利用网上的
开放获取资源进行检索,并给出结果。
3. 使用不同的搜索引擎查找同一主题的信
息,试比较查找结果的异同。

You might also like