导航菜单
首页 > 管理学论文 > 情报论文 » 正文

寻求信息偶遇研究的突破

马翠嫦 吴育冰




收稿日期:2020-06-01

基金项目:中央高校基本科研业务费项目“支持跨学科知识发现的学术论文信息单元识别与聚合研究” (项目编号:17wkpy56);广东省图书馆科研课题“基于知识图谱的学术会议演示文稿深度聚合研究”(项目编号:GDTK1810)。

作者简介:马翠嫦(1981-),女,副研究馆员,博士,研究方向:信息行为、信息组织与信息聚合、信息计量。吴育冰(1990-),女,馆员,硕士,研究方向:信息组织、信息计量。

摘  要:[目的/意义]信息偶遇日渐成为图书情报学、计算机科学等多学科研究的热点。国内外关于信息偶遇理论已建立若干标志性的模型和框架,但由于数据来源和研究方法的瓶颈,造成实证研究的困难与理论检验的不足。本研究试图以信息偶遇领域知识图谱构建與分析结果为依据,探索该领域未来突破的可能与发展的方向。[方法/过程]本研究以1995年至今国内外期刊论文和学位论文及相关引文数据为来源,采用文献计量学相关方法,以SATI、UCINET、NetDraw和CiteSpace等为数据分析和可视化工具构建信息偶遇领域的知识图谱。[结果/结论]研究结果揭示了20多年来国内外信息偶遇研究从理论探索到面向新环境和新技术的适应性研究与应用的发展轨迹,既呈现出由图书情报学、计算机相关学科和工商管理等学科形成的相对独立的研究领域,也呈现出图书情报学研究向相关学科扩散的趋势。计算机相关学科基于社会网络分析和行为数据分析的方法可为突破数据获取与分析的瓶颈提供方法参考;特异性的技术环境和信息使用情景的探索可能带来理论突破。

关键词:信息偶遇;非线性信息行为;非目的性信息获取;知识图谱;文献计量;中国台湾地区;中国大陆;国外

DOI:10.3969/j.issn.1008-0821.2020.12.016

〔中图分类号〕G252.7  〔文献标识码〕A  〔文章编号〕1008-0821(2020)12-0156-14

Breakthrough of Information-encountering Research

——Based on Knowledge Map of Information-encountering During the Past Two Decades

Ma Cuichang1  Wu Yubing2

(1.Library,Sun Yat-sen University,Guangzhou 510275,China;

2.Library,Jinan University,Guangzhou 510632,China)

Abstract:[Purposes/Significance]The research of information-encountering has become a hot topic in Library and Information Science and other disciplines,however,it is not easy to carry out empirical research due to the bottleneck of data sources and research methods.This paper aims to find out cues for future research through construction of knowledge map for information-encountering research.[Method/Process]With research papers published from 1995 till now at home and abroad,a knowledge map in the field of“information encountering”was formed by using the method of bibliometric and the tools of SATI,UCINET,NetDraw and CiteSpace.[Conclusion/Discussion]According to the results,the topic of information-encountering research at home and abroad has transformed from theoretical exploration to application research in new environment and with new technology from 1995 till now.As an interdisciplinary research field,the information-encountering research were carried out independently within the fields of Library and Information Science,computer related disciplines,Business Management,etc.Theories rooted in Library and Information Science research was spreading to related disciplines.The methods based on social network analysis and behavioral data analysis from computer related disciplines give insights into the research method of information-encountering in the filed of LIS.

Key words:information-encountering;non-linear information behavior;non-purposeful information acquisition;knowledge map;citation analysis;China Taiwan;China mainland;foreign countries

1  研究背景

在信息丰富的环境下,信息偶遇不仅已成为跨学科信息查寻中的常见现象,更逐渐成为用户信息获取的途径之一。近20多年来,国外和国内学者纷纷对偶遇式信息行为进行现象探索和理论构建,逐渐构建起与信息行为理论密切联系的信息偶遇理论体系。然而,信息偶遇研究发展到现阶段,图书情报领域学者已不止一次提出,该领域的发展已面临数据获取与研究方法的瓶颈[1-2]。为此,本研究拟通过知识图谱的方法对20余年来(1995—2019年)国内外信息偶遇研究进行梳理,形成信息偶遇研究的发展历史、学科概貌、内容体系与发展趋势,着重从该领域研究的关键节点、研究内容、跨学科性等方面探索演化轨迹与未来的发展路径,从而寻求当前发展的突破。

2  方法与数据

本研究以国外、中国大陆与中国台湾地区“信息偶遇”主题的期刊论文和学位论文及相关引文数据为研究与分析对象,采用文献计量相关方法,借助文献题录信息统计分析工具SATI和社会网络分析软件Ucinet及其自带的NetDraw绘制“信息偶遇”关键词共现网络,通过CiteSpace绘制信息偶遇的关键词共现时区图谱、文献同被引聚类图谱。

在数据来源方面,国外期刊论文及其引文以Web of Science核心合集数据库(下文简称为WOS核心合集数据库)中SCIE、SSCI、A&HCI為数据来源,国外学位论文以Proquest PQDT博硕士学位论文数据库(下文简称为PQDT)为数据来源;国内论文以中国知网(下文简称为CNKI)、万方、中国台湾学术文献数据库为期刊论文与学位论文数据来源,引文以中国社会科学引文索引(下文简称为CSSCI)为数据来源。

在检索词选择方面,本研究参考姜婷婷等总结的信息偶遇相关术语作为初始检索词[1],以检索文献中新增术语为补充检索词,在中外文各数据库进行迭代检索。获取数据集后对其进行人工清洗,剔除与信息偶遇行为研究不相关文献与重复文献,形成4个数据集,分别是:国外信息偶遇学术论文数据集(174条)、国外来源论文引文数据集(6 249条)、国内信息偶遇学术论文数据集(129条)和国内来源论文引文数据集(387条),如表1所示:

3  结  果

3.1  文献分布概貌

3.1.1  时间分布

学术论文数量的时序变化是衡量学科领域发展轨迹的重要指标,对评价该领域所处的阶段、预测发展趋势和动态具有重要意义。本研究按照文献出版时间对国内外信息偶遇主题学术论文进行计量分析,论文数量的年代分布情况见图1。

如图1所示,国外最早的研究是Erdelez S在1995年发表的关于信息偶遇研究的论文[3]。而在国内,最早的研究则于2005年在中国台湾地区发表[4],可见国内研究起始时间比国外晚了整整10年。1995—2009年间国外该主题年均发文量为5篇以下,从2010年起有较明显的增长,2011年增

长至1年12篇,之后呈逐年上升趋势,至2019年国外年均发文量已达到26篇。2012年以前,国内年均发文量在5篇以下,2013年1年发表论文数量已达14篇,虽然2016年发文数量较少,但2013年之后总体呈现逐年上升的趋势,2018年1年发文量超过25篇。由此可见,自2010年开始信息偶遇研究越来越受到学界的关注,至今形成较高的热度和明显的研究趋势。

3.1.2  学科分布

学术论文的学科分布方面,收藏国外论文的WOS核心合集数据库和PQDT学位论文数据库对于文献学科的标注均存在交叉与跨学科标注的现象。鉴于WOS核心合集数据库与PQDT数据库对于学科标注类别并不统一,作者对两个数据库中相同学科进行合并归类,再按学科类目进行统计,论文量≥4的15个学科类别如图2所示。

从图2可见,国外学术论文中属于图书情报学领域的论文最多,占54.02%,属于计算机科学信息系统领域的论文数量排第二,占41.38%。值得注意的是,由于WOS核心合集数据库对于计算机科学相关学科的分类细分为:计算机科学信息系统、计算机科学人工智能、计算机科学控制论、计算机科学理论与方法、计算机科学软件工程5大类。如果将计算机科学相关的5类合并计算,则属于计算机科学相关学科的论文数量最多,占59.20%。

国内学术论文学科分布方面,鉴于国内信息偶遇学术论文分布在CNKI的12个类别、万方的3个类别及中国台湾学术文献数据库的4个类别中,本研究以CNKI学科分类为基础,按照万方、中国台湾学术文献数据库中的论文学科分类,将相应论文归入CNKI对应类别进行学科分布统计,如将中国台湾地区的电算机学门归并到CNKI中的计算机类、传播学门归并到CNKI中的新闻传播类、教育学门归并到CNKI中的教育类等,将万方的计算技术、计算机技术归并到CNKI中的计算机类等。由于在CNKI和万方数据库中跨学科论文被纳入多个学科重复计数,所以学科图中的论文数量大于来源数据的数量。按照学科类目进行统计结果如图3所示。

从图3可见,国内学术论文中属于图书情报学学领域的论文最多,占59.69%,属于新闻传播领域的论文数量排第二,占22.48%。此外,还有部图3  国内信息偶遇主题学术论文的学科分布

分论文属于教育学、计算机科学等领域。可见,国内信息偶遇研究更明显地集中在图书情报学领域。新闻传播领域则从信息传播与扩散的角度对于信息偶遇问题展开研究。

3.1.3  高影响力论文

本研究采用国外来源论文引文数据集进行国外信息偶遇论文被引频次统计分析,获得被引频次论文≥100的论文共4篇,如表2所示。

从表2可见,国外4篇高影响力论文均属于信息偶遇领域早期的研究。其中,Foster A E等于2003年和2004年发表的关于偶遇式信息搜寻和信息搜寻的非线性模型两篇论文的总被引频次最高[5,7]。Ross C S关于阅读信息偶遇和Williamson K关于偶然性信息获取在信息利用模型中角色研究的论文的总被引频次也较高[6,8]。

采用国内来源论文引文数据集对国内信息偶遇论文的被引频次进行统计分析,获得被引频次论文≥10的论文共4篇,如表3所示。

从表3可见,国内4篇高影响力论文总体上属于国内信息偶遇领域中期的研究,这一时期国内正处于信息偶遇主题论文数量剧增的爆发期。在研究内容上,王知津等关于非线性信息搜寻行为的研究[11]属于概念与理论层面的探索,而其余3篇论文均属于实证研究。其中,关于科研人员信息偶遇的影响因素和特点的2篇实证研究论文被引频次最高[9-10]。

3.2  主要研究内容

3.2.1  主题分布

关键词表达了论文的研究主题,是论文内容的核心与精髓。通过绘制高频关键词共现网络,利用关键词之间的紧密程度形成关于研究主题的知识图谱。其中,网络中的节点代表关键词,节点的大小代表节点在网络中的中心度,中心度越高,节点越大,该节点在网络中的地位就越重要;节点之间的连线表示两个关键词之间的关系,连线越粗,表示共现次数越多,联系越紧密。

本研究以国外学术论文数据集中关键词频次≥2的高频关键词为对象,进行关键词共现分析,如图4所示。 结果显示,该网络中关键词Serendipity的中心度最高,并与关键词Information Encountering构成最紧密的联系。与Serendipity和Information Encountering聯系密切的主要有Information Seeking、Recommender Systems、Algorithms、Information Discovery、Information Retrieval、Design、Novelty、Information Seeking Behavior、Experimentation等。其中,关于行为、检索、算法、创新和设计等高频关键词的出现,反映了信息偶遇是一个多学科关注的领域,包含了图书情报学领域以信息行为为主的研究和计算机相关学科以人工智能、交互、知识发现等应用为主的研究。

对于国内学术论文数据集,首先进行关键词预处理,包括将繁体中文关键词转换为简体中文关键词(如将“资讯”转换为“信息”)、将“综述”“现状”等类型关键词删除等。然后,以数据集中词频≥2的关键词为对象,绘制国内信息偶遇研究关键词共现网络如图5所示。结果显示,该网络是一个以信息偶遇为核心的大型网络,而信息行为和影响因素则为该网络的次要核心,且信息行为与信息偶遇形成非常紧密的联系,说明信息偶遇作为信息行为研究的趋向性非常明显。因而,与国外主题共现网络相比,国内研究更注重信息行为理论框架内的研究及信息偶遇影响因素的研究,而国外则更关注对信息偶遇与信息查寻关系、信息偶遇应用探索等主题。

3.2.2  主题的变迁

通过学术论文数据集的关键词绘制时区图,可展示关键节点知识的演化轨迹及其相互关系。其中,不同时区节点之间连线的多少反映研究传承性的强弱,关键词所在的时区是该节点主题首次出现的时间,可以显示研究主题的时间分布和变迁。

通过国外学术论文数据集中关键词首次出现的时间绘制时区图如图6所示。从图6可知,近20年来国外信息偶遇研究主题演变历程可概括为:用户生活信息交流-偶遇-信息查寻与信息偶遇-信息查寻与理论模型-推荐系统。中心性最高的Serendipity从2001年起,在之后的时区中几乎都有出现,表明其研究持续性较好。

通过国内学术论文数据集绘制关键词时区图如图7所示。从图7可知,近15年来国内信息偶遇研究主题的演变历程可概括为:信息行为-信息搜寻-信息偶遇-影响因素。中心性最高的信息行为从2007年起,在之后的时区中几乎都有出现,表明国内信息偶遇研究在信息行为理论框架内保持较好的持续性。

收藏此文 赞一个 ( ) 打赏本站

如果本文对您有所帮助请打赏本站

  • 打赏方法如下:
  • 支付宝打赏
    支付宝扫描打赏
    微信打赏
    微信扫描打赏
留言与评论(共有 0 条评论)
   
验证码:
二维码