dxy logo
首页丁香园病例库全部版块
搜索
登录

如何进行文献计量分析

发布于 2022-02-16 · 浏览 6670 · IP 上海上海
这个帖子发布于 3 年零 74 天前,其中的信息可能已发生改变或有所发展。
iconWOrange 推荐

文献计量学了,英语叫“bibliometric analysis”,是情报学和文献学的一个重要学科分支,现在已经广泛的用在各类学科;相比系统评级/meta分析、生信分析、网络药理学等,文献计量学相对简单,只要下载数据,导入软件,生成图就可以写文章了;以Title/abstract为字符段,“bibliometric analysis”为检索词,这两年PubMed发表的计量学分析文章疯涨,2022年已经177篇,笔者近期投的一篇计量学文章收到修改,审稿人给我推荐了一篇paper(DOI: 10.1016/j.jbusres.2021.04.070)作为其中的参考文献,正好拿来分享,希望对大家有所帮助~文章有点长,认真看完。

1.前言

近年来,文献计量学分析在商业研究中获得了巨大的人气,它的流行可以归因于(1)文献计量学软件(如Gephi、Leximancer、VOSviewer)和科学数据库(如Scopus和Web of Science)的进步、可用性和可得性,以及(2)文献计量学方法从信息科学到商业研究的跨学科。更重要的是,文献计量学分析在商业研究中的流行不是一种时尚,而是反映了它在以下方面的效用:(1)处理大量的科学数据,以及(2)产生高研究影响力。

学者们出于各种原因使用文献计量学分析,比如发现文章和期刊表现的新趋势、合作模式和研究成分,以及探索现存文献中特定领域的知识结构。在文献计量学分析中占据中心位置的数据往往是大量的(如数百,甚至数千)和客观的(如引文和出版物的数量,关键词和主题的出现),尽管其解释往往依赖于通过知情技术和程序建立的客观(如绩效分析)和主观(如主题分析)评价。换句话说,文献计量学分析有助于通过以严格的方式对大量的非结构化数据进行理解,来破译和描绘成熟领域的累积科学知识和演变的细微差别。因此,做得好的文献计量学研究可以新颖和有意义的方式推动一个领域的发展打下坚实的基础--它使学者们能够(1)获得一个一站式的概述,(2)确定知识差距,(3)得出新的调查想法,以及(4)定位他们对该领域的预期贡献

尽管文献计量学分析有其优点,但它在商业研究中仍然相对较新,而且在许多情况下,其部署并没有充分利用其潜力。当文献计量学研究依赖于一套有限的文献计量学数据和技术,并且只提供对所研究领域的零星了解时,就会出现这种情况(例如,没有科学映射的绩效分析--例如,Brown, Park, & Pitt, 2020)。值得注意的是,关于商业研究中的文献计量分析的权威指南仍然缺失,这对那些希望以全面而又容易消化的方式了解文献计量方法及其在商业研究中的应用的商业学者来说是一个重大挑战。虽然有关于系统性文献综述的权威指南,但它们并没有提供关于文献计量方法的足够广度和深度。

鉴于上述差距,本文旨在提供(1)文献计量方法的概述和(2)为商业研究进行文献计量分析的分步指南。特别是,本文向商业学者介绍了文献计量分析,其中提供了其基本原理、技术和程序,并提供了范例和理由。本文的贡献是多方面的。首先,本文介绍了文献计量分析的概况以及如何进行文献计量分析的指南,可以帮助商业学者了解文献计量方法,并利用这种了解来评估具有大量文献计量数据和语料库的现存文献中的特定领域。其次,本文就可用于文献计量分析的不同技术以及何时使用这些技术提出了一些建议,可以拓宽商业学者对使用文献计量分析的不同变体的选择和理由的看法。作为一个整体,本文以清晰和严谨的态度加强了对商业研究中文献计量方法的理解,从而为商业学者在未来的研究中恰当地、有意义地、严谨地使用文献计量分析铺平了道路。

本文的其余部分结构如下。本文首先概述了文献计量学分析,接着介绍了文献计量学分析的可用技术工具箱,并附有何时使用这些技术的指南。接下来,本文深入探讨了在文献计量数据的网络分析中使用的不同研究指标和聚类算法。然后,本文解释了进行文献计量学分析的过程,最后对文献计量学的局限性作了总结。

2.计量学方法学

文献计量学方法囊括了定量技术(即文献计量分析-如引文分析)在文献计量数据(如出版单位和引文)上的应用。关于文献计量学的早期讨论开始于20世纪50年代,这表明文献计量学方法并不新鲜。然而,文献计量学的扩散是最近才开始的,这可以从它在Scopus的“商业、管理和会计”、“经济学、计量经济学和金融”以及“社会科学”领域的增长中看出,在 “文章标题、摘要和关键字”中使用“bibliom*”作为关键词(见图1)。具体来说,使用文献计量学的出版物多年来一直在增长,在过去十年中平均有1021篇出版物,这可以归因于科学研究本身的增长。然而,庞大的书目数据集使得经典的审查方法变得繁琐而不实用。值得注意的是,Scopus和Web of Science等科学数据库的出现使得获取大量的文献计量数据变得相对容易,Gephi、Leximancer和VOSviewer等文献计量软件能够以非常实用的方式分析这些数据,从而在近代提高了学者们对文献计量分析的兴趣。事实上,文献计量方法已经被应用于商业研究的各个领域,包括商业战略、电子商务、金融、人力资源、管理和营销,其中文献计量学的应用范围包括研究出版和合作模式,以及探索研究领域的知识结构。这里,研究领域也可以表现为期刊。事实上,文献计量学方法已被应用于提供期刊(如《商业研究杂志》)的回顾,这通常发生在里程碑式的年份。

在这个时候,将文献计量学分析与其他经常使用的综述方法,如meta分析和文献系统评价进行比较是很重要的。实质上,meta分析估计(1)“效应或关系的总体强度和方向”,以及(2)“效应大小估计分布的跨研究差异以及解释这种差异的因素”,而文献系统评价,如基于领域、方法和理论的回顾,概括了使用系统程序对现有文献的获取、整理和评估,通常由学者手动进行(例如,内容和主题分析)。

与文献计量分析类似,meta分析能够处理大量的文献,并对特定领域进行细微的总结,尽管所考虑的文献往往不太多样化,而且现有研究的异质性和出版偏倚的存在会对通过meta分析获得的结果的有效性产生不利影响。相比之下,使用经典方法的系统性文献综述需要一个狭窄的研究范围,因此倾向于包括较少数量的论文进行综述(例如,在几十篇[如40篇]和低百篇[如100-300篇]之间)。从这个意义上说,系统性文献综述更适合于限定的(如社交媒体上的客户参与)或研究领域(如社交媒体影响者营销)。系统性文献综述往往依赖定性技术,可能会受到来自不同学术背景的学者的解释偏见的影响,而文献计量分析和meta分析则依赖定量技术,因此可以避免或减轻这种偏倚。

由于meta分析和文献计量分析在本质上都是定量的,所以这两种方法的区别会让一些学者感到困惑。为了阐明这种区别,商业学者应该注意到,它们的定量方法在使用上相对不同,尽管它们都可以处理大量的文献。具体来说,meta分析集中于通过分析影响的方向和强度以及变量之间的关系来总结经验证据,并且“有助于用比任何单一的主要研究报告更接近于确定的数据来解决开放的研究问题”。它的执行是为了阐明混合的经验发现和边界条件。因此,meta分析经常被用作理论扩展工具。相比之下,文献计量分析通过分析不同研究成分(如作者、国家、机构、主题)之间的社会和结构关系,总结了一个领域的文献计量和知识结构。

总之,本文讨论的三种审查方法中的任何一种的使用都取决于综述的目标和被综述文献的规模和性质。尽管如此,这些综述方法仍然是相互补充的,它们为那些有兴趣使用它们的学者提供了独特的优势。表1介绍了文献计量分析、meta分析和系统文献综述在不同标准下的方法学比较,以帮助作者在选择适当的综述方法方面做出明智的决定。

3. 文献计量分析技术工具箱

文献计量分析的技术体现在两个类别中。(1)绩效分析和(2)科学绘图。从本质上讲,绩效分析说明了研究成分的贡献,而科学绘图则侧重于研究成分之间的关系。接下来的小节将阐明绩效分析和科学映射的可用技术,如图2所示。

3.1 开展分析

绩效分析考察了研究成分对特定领域的贡献。属于描述性的分析,是文献计量学研究的标志。绩效分析可以在大多数综述中找到,即使是那些不从事科学绘图的综述,因为综述的标准做法是介绍该领域不同研究成分(如作者、机构、国家和期刊)的绩效,这类似于经验研究中通常介绍的参与者的背景或情况,尽管分析性更强。

绩效分析的衡量标准有很多。最突出的衡量标准是每年或每个研究成员的出版物和引文数量,其中出版物是生产力的代表,而引文则是衡量影响和影响力的标准。其他衡量标准,如每篇出版物的引文和h指数,结合了引文和出版物来衡量研究成员的绩效。这种分析尽管是描述性的,但也承认一个研究领域中不同成分的重要性。表2列出了适合进行绩效分析的指标样本。

3.2 科学图谱

科学图谱研究了研究成分之间的关系。该分析涉及到研究成分之间的知识互动和结构性联系。科学图谱的技术包括引文分析、共引分析、文献耦合、共词分析和共同作者分析。这类技术与网络分析相结合,有助于呈现书目结构和研究领域的知识结构。表3列出了用于科学绘图的不同技术的摘要,重点是它们的用法和数据考虑。

3.2.1引文分析

引文分析是科学绘图的一项基本技术,其运作的假设是,引文反映了出版物之间的知识联系,当一个出版物引用另一个出版物时,就会形成这种联系。在这种分析中,一个出版物的影响力是由其被引用的次数决定的。这种分析能够确定一个研究领域中最有影响力的出版物。虽然有多种方法(如网络指标)来确定出版物在一个研究领域的重要性,但衡量其影响力的最客观、最直接的方法是其引文。因此,利用引文,人们可以分析一个研究领域中最有影响力的出版物,以了解该领域的知识动态。

3.2.2 共引分析

共引分析是一种科学映射技术,它假定经常被一起引用的出版物在主题上是相似的。这种分析可以用来揭示一个研究领域的知识结构,例如其基本主题。在共引网络中,当两份出版物共同出现在另一份出版物的参考文献列表中时,它们就被连接起来。使用共引分析的好处是,除了找到最有影响力的出版物之外,商业学者还可以发现主题集群。这里,主题集群是根据被引用的出版物得出的。然而,共引分析只集中在高引用率的出版物上,而把最近的或小众的出版物排除在其主题集群之外。从这个意义上说,共引分析适合于那些希望发现开创性出版物和知识基础的商业学者

3.2.3 文献耦合

书目耦合是一种科学映射的技术,其运作的假设是,有共同参考文献的两个出版物在内容上也是相似的。这种分析集中于根据共同的参考文献将出版物划分为主题集群,并且最好在特定的时间范围内使用。在这里,主题集群是根据引用的出版物形成的,因此,最近的和小众的出版物可以通过文献耦合获得知名度(与共引分析不同)。在这个意义上,文献耦合适合那些希望发掘广泛的主题及其最新发展的商业学者。因此,该分析可以提供研究领域现状的代表。

3.2.4 共词分析

前面三种科学图谱技术的重点是出版物,而共词分析的分析单位是“词”。换句话说,与引文分析、共引分析和文献耦合不同的是,共词分析采用的是被引或引用的出版物作为焦点或代理,而共词分析是一种考察出版物本身实际内容的技术。共词分析中的词通常来自“作者关键词”,如果没有它,也可以从“文章标题”、“摘要”和“全文”中提取显著的词来进行分析。与共引分析类似,共词分析假设经常一起出现的词彼此之间有主题关系。

然而,使用单词作为分析单位也有其弊端。例如,某些词被用在多种语境中,因此,要理解词与词之间的关系,就必须(重新)阅读出版物。此外,有些词可能非常笼统(例如,主题领域的名称--如广告),因此,将它们归入任何一个主题群可能是一个挑战。

为了减轻共词分析的潜在弊端,我们鼓励商业学者战略性地使用这种分析。在此,我们提供两个建议。首先,共词分析可以作为一种补充,以丰富对通过共引分析或文献耦合得出的主题集群的理解,因为通过出版物中的共性形成的主题往往是相对普遍的,因此,使用共词分析可以帮助商业学者阐述每个主题集群的内容。其次,共词分析可以用来预测该领域的未来研究,当出版物的意义和未来研究方向中的显著“词”被用于分析时,就会发生这种情况。在这个意义上,共词分析适合那些希望丰富他们对共引分析(过去)或文献耦合(现在)的解释并预测未来轨迹的商业学者。因此,共词分析可以为研究领域的未来提供一个预览。

3.2.5 共作者分析

合著分析考察的是研究领域内学者之间的互动关系。由于合著是学者之间智力合作的一种正式方式,因此了解学者之间如何互动(包括相关的作者属性,如附属机构和国家)非常重要。随着研究中方法和理论的日益复杂,学者之间的合作已经成为一种普遍现象。事实上,学者之间的合作可以导致研究的改进--例如,不同学者的贡献可以促进更清晰和更丰富的洞察力。在这里,合作的学者形成了一个被称为“无形的拼贴”的网络,他们的研究可以帮助发展研究领域的事业。例如,分析可以揭示来自特定地区的学者之间的集群研究,这种洞察力可以用来证明和激发代表不足地区的学者的新研究。该分析还可以绘制不同时期的合作图,从而使学者们能够对照合作网络回顾知识发展的轨迹,同时使未来的学者掌握有价值的信息,以便与研究领域的知名学者和趋势性学者进行接触和合作。

4. 文献计量分析的丰富工具箱

在文献计量分析的核心技术的基础上,本节介绍了可以增加的附加物,以丰富文献计量研究中应用的分析技术的结果。总的来说,我们提出了三种以网络分析为前提的充实途径,即网络指标、聚类和可视化。

4.1. 网络度量

网络指标可以用来丰富文献计量分析的评估内容。特别是,网络指标揭示了研究成分(如作者、机构、国家)的相对重要性,这些成分不一定通过出版物或引文反映出来。重要的是,网络指标通常被用来丰富文献计量学研究中对研究领域的讨论,因此,它们代表了丰富文献计量学评估的合法方法。为了提供更清晰的信息,我们提供了几个网络度量的范例(例如,中心度、中介中心度、特征向量中心度、接近度中心度和PageRank),以及一个可以在不同中心度量中策划的出版物排名的样本表(见表4)。

具体来说。中心度指的是一个研究成员在网络中的关系纽带的数量。例如,如果一个共同作者网络中的作者与四个不同的作者合作,那么他或她的中心度就是四。这是迄今为止最简单的中心度测量方法,因为它依赖于关系纽带的数字计算。这种衡量方法的一个变种是加权中心度,其计算方法是将关系纽带的总数与每个纽带的强度相乘。例如,如果作者A与作者B写了两篇文章,与作者C和作者D各写了一篇文章,那么作者A的中心度将是3,但他或她的加权中心度将是4。虽然这些衡量标准的简单性本身就是一种优势,但这些衡量标准并没有提出关于研究成员在研究领域中扮演什么角色的信息。

·中介中心度是指一个节点在没有联系的节点组之间传递信息的能力,其中每个节点代表一个研究成员。尽管中介中心性比中心度更复杂,但该测量方法确实提供了关于研究成员在网络中所扮演角色的信息。具体来说,中介中心度是通过计算经过某一特定节点的最短路径总数(δv,w(u)),并将其除以整个网络中的最短路径总数(δv,w)来衡量。B(u) = ∑δv,w(u) δv,w

·与其他高度连接的节点相连的节点,其特征向量中心性较高,其中每个节点代表一个研究成分。具体来说,特征向量中心性的数值越高,就反映了网络中负责向其他高度连接的节点传递信息的节点的重要性。这个网络度量的计算方法是:xi = 1λ ∑j∊M(i)xj 其中,M(i)是i的邻居集合,λ是一个常数。

·紧密性中心性指的是节点通过与网络中的其他节点更接近而有效传递信息的能力。这些节点与网络中其他节点的距离之和表明这些节点有效传递信息的相对容易程度。

- PageRank分析是衡量一个出版物影响力的另一种方法。尽管PageRank最初是为了在关键词搜索中对网页进行优先排序,但该方法已经在书目计量学中找到了它的踪迹。特别是,PageRank可以用来计算那些对研究领域有影响的出版物的声望,这些出版物尽管本身没有被高度引用,但却影响了高引用率的出版物。在这个意义上,PageRank高的出版物被认为是“高质量的”,因此是高引用率出版物中“必须引用的”。此外,PageRank还可以应用于聚类,以揭示评论领域的主题,这一点将在下一节中讨论。PageRank的计算公式如下。PR(A) = (1 - d) N + d(PR(T1) C(T1) + ⋯ + PR(Tn) C(Tn) ) 其中 A 是被高引用率出版物 T1, T2, T3, ..., Tn 引用的出版物,C(Ti) 是出版物 Ti 的引用次数,PR(Ti) 是该出版物的 PageRank,d 是一个抑制因子,N 是网络的大小。表5列出了根据PageRank的出版物排名的样本。

4.2 聚类

聚类是文献计量分析的另一种充实技术,其主要目标是创建主题或社会集群(取决于正在进行的分析类型)。策划网络聚类并观察其发展,对于理解一个研究领域的表现和发展是很有帮助的。例如,利用共引分析和文献耦合创建的主题集群,可以揭示支撑知识结构的主要主题及其在研究领域中的长期发展。有几种技术可用于聚类,如探索性因素分析、分层聚类、Island算法、Louvain方法、多维缩放和简单中心算法,它们可以相互补充(Zupic & ˇ Cater,2015)。

4.3 可视化

文献计量分析的使用往往与网络可视化软件同时进行,其范围从完全基于图形用户界面的软件如VOSviewer到基于命令的软件如R中的Bibliometrix包。其他突出使用的文献计量软件包括Bibexcel、Pajek、Gephi、SciMat、Sci2和UCINET。图3和图4分别展示了使用VOSviewer和Gephi进行网络可视化的随机示例。

大多数网络可视化软件都是开源和免费的,因此,软件的选择权在学者们手中。每个软件都有自己的优点和缺点。例如,尽管Pajek和UCINET有很多功能,但与Gephi和R等软件相比,其开发速度较慢。例如,在使用VOSviewer生成的网络中,同一单词的不同形式不能合并,而使用Gephi则可以做到这一点。解决这个问题的一个方法是将文献计量分析和网络可视化软件相互结合使用。事实上,许多文献计量学研究确实采取了这种互补的方法,以利用软件的优势,克服软件的不足。因此,在决定选择一个文献计量学或文献计量学软件组合进行分析和可视化时,应考虑到与软件功能和所产生的网络的灵活性有关的因素。

5. 计量学分析过程

在本节中,本文介绍了进行文献计量分析的步骤以及需要遵循的一般准则。图5展示了这些步骤,而表6展示了文献计量分析的准则,重点是关于学者在每个步骤中应该问自己的具体(问题)建议。

5.1. 第一步:确定文献计量学研究的目标和范围

第一步是确定文献计量研究的目标和范围,这必须在选择文献计量分析技术和收集文献计量数据之前进行。在前者之前做后者是有风险的,因为不合适的目标和范围会使文献计量分析毫无用处,从而浪费了宝贵的资源,而这些资源可以通过仔细的规划得到更好的投资。文献计量研究的目的应该是对一个研究领域的绩效和科学进行回顾。就绩效而言,文献计量学研究通常是为了解读研究领域中多产的研究成分,这些成分可能包括作者、机构、国家和期刊。就科学而言,文献计量学研究通常旨在揭示文献计量学结构,该结构概括了研究成分之间的网络,有助于建立在研究领域相关主题群基础上的知识结构。

研究的范围通常应该足够大,以便进行文献计量分析,因为这种分析旨在处理大量的文献计量数据。为了确定研究范围是否足够大,学者们可以审查利用预定研究领域进行研究的论文数量。如果有相当多的数百篇(如500篇或更多)或数千篇论文,那么可以认为该研究领域足够大,值得使用文献计量分析。如果只有几十篇(如50篇)或几百篇(如100-300篇)论文,那么该研究领域被认为是小的,因此不值得使用文献计量学分析,因为对这个小的语料库强行进行分析将是一种矫枉过正。在这种情况下,其他综述方法,如meta分析和系统文献综述可能更适合。

5.2. 第二步:选择文献计量分析的技术

第二步是设计文献计量学研究,其中选择文献计量分析的技术是为了满足第一步的研究目的和范围。学者们在这一阶段经常遇到的一个挑战是决定是根据所寻求的文献计量数据来选择一种技术,还是先选择一种技术,然后再根据所选择的技术来准备文献计量数据。为了克服这一挑战,本文建议采用后者,因为前者限制了学者们对技术的选择。此外,文献计量数据通常是以原始格式检索的,因此,学者们需要根据所选择的文献计量分析技术所要求的格式来清理和准备这些数据。在这方面,本文对后者的推荐将为学者们提供更广泛而非限制性的文献计量分析技术的选择部署。更重要的是,文献计量分析技术的选择将取决于研究的目的。例如,如果研究打算对一个研究领域的过去、现在和未来进行回顾,并拥有大量的文献计量学语料库,那么可以选择联合共引分析(过去)、文献耦合(现在)和联合词分析(例如,全文的意义和未来研究方向中的显著词汇)(未来)的组合。如果研究的目的是为了揭示一般的和特定时期的主题,那么后者(即共词分析)可以与作者关键词结合使用,以丰富前两者(即共引分析和文献耦合)的分析。如前所述,文献计量学研究中的绩效分析类似于实证研究中的参与者情况,因此,默认情况下,现在应该选择绩效分析的组成部分(如总发表量、总引用量),之后以描述性(即它是什么)而又分析性(即它意味着什么)的方式进行分析和报告。

5.3. 第三步:收集用于文献计量分析的数据

第三步是收集第二步中选定的文献计量分析技术所需的数据。在这一步中,学者们需要对搜索词进行定义,以产生足够大的搜索结果,以保证进行文献计量分析,但又足够集中,以保持在专门的研究领域或在第一步中指定的研究范围。在这方面,学者们有两种选择:第一,学者们可以查阅文献,确定相关的搜索词组合;第二,学者们可以在自己之间或与主题专家进行头脑风暴,策划合适的搜索词。在此之后,学者们需要确定需要从搜索结果中收集的文献计量数据。在这方面,学者们应该参考他们为研究选择的文献计量分析技术。例如,如果学者们在第二步中选择了共词分析,那么他们应该重点收集搜索结果中出版物的标题、摘要、关键词和全文。然而,如果没有所需的数据,那么就应该重新审视第一和第二步的工作。更重要的是,鉴于不同的数据库都有自己的文献计量数据格式,而且学者们可能会决定使用多个数据库(如Scopus和Web of Science),那么应该努力将它们合并为一种格式。然而,本文的建议是确定一个合适的数据库,以减轻这种合并的需要,因为尽量减少不必要的行动项目可以帮助减少潜在的人为错误。此外,数据清理是必不可少的,因为这些数据库并非专门为文献计量分析而设计。具体来说,学者们应该删除重复的和错误的条目。例如,文献中作者领域的隶属关系可能包括一个作者的多个机构,这可能是由于数据库因作者特征分析而进行的分配,而不是出版物中所列的机构,因此,在这种情况下,学者应该清理条目,使最终数据集中只保留一个有效的隶属关系,即作者在出版时的隶属关系。对这类错误置之不理可能会导致研究领域的不正确表述。

5.4. 第四步:运行文献计量学分析并报告结果

第四步也是最后一步是运行文献计量学分析并报告结果。理论上,运行文献计量学分析(以及生成其附带的摘要)和撰写文献计量学评论通常被定义为独立的步骤。然而,在实践中,这些行动项目往往是齐头并进的。例如,将网络划分为群组并生成可视化的网络摘要,直接为论文的写作提供信息,其中需要加强论文中的内容,反过来又会导致将文献计量摘要添加到论文中。鉴于这种反馈循环,本文将产生文献计量学摘要的文献计量学分析的运行和研究结果的写作定位为一个步骤。

在这个步骤中,写作风格也很重要。大多数情况下,写作风格是由学者的目标期刊和研究领域来决定的。例如,一本期刊可能希望学者关注研究的理论方面(如强调理论的期刊,没有明确的页数或字数限制),而另一本期刊可能希望学者直接进入研究结果的总结(如有明确和严格页数或字数限制的期刊)。在这方面,本文建议学者向目标期刊查询,看它们是否有发表综述论文的历史,如果有,就检索这些论文,如果可能,就检索那些使用文献计量学的论文,这样就可以精心设计类似的写作风格。最后,本文鼓励学者们精心设计有洞察力的讨论,直接参与相关的趋势和相当的理由,而不是简单地报告文献计量学语料库的摘要。也就是说,学者们应该在数字和表格中使用文献计量学的可视化,以策划分析性而非描述性的讨论。触及内容和背景的概念也是适当的。在解释文献计量分析的结果时,重要的是理解每个主题群的内容以及该群中的出版物主题所包含的意义。为了把握好对内容的理解,还必须研究它们与作为该内容特征的实体或事件有关的背景意义。例如,共词分析向学者们展示了不同的词簇。学者们可以依靠在集群中表现突出的词来理解其内容(例如,比其他词更有联系的词),然而他们还必须审查这些词是如何相互联系的,以便破译每个集群的背景(例如,这些词出现的研究)。

6.结论

总之,本文证明了文献计量分析是一种科学方法,对那些希望对商业研究中广泛而丰富的领域进行回顾的成熟学者和新兴学者都很有用。本文还确定,由于文献计量学软件和数据库的无所不在和实用性,文献计量学方法在近代获得了巨大的普及,这些软件和数据库便于商业研究中大量科学数据的获取和评估,包括相对较新但高度丰富的领域,如人工智能和大数据。更重要的是,本文在追求合力和务实的努力中,说明了对商业研究进行有意义的文献计量分析的解剖,其中介绍了文献计量方法,解释了各种技术,解读了文献计量分析的加强措施,并提供了相关程序。通过这一努力,本文明确指出,所选择的技术和与进行文献计量分析的每个步骤相关的决定是至关重要的,因为它们影响到所获得的结果和可以从分析中得出的推论。

尽管如此,重要的是要明白,尽管文献计量分析是总结和综合文献的有效方法,但它并非没有局限性。首先,来自Scopus和Web of Science等科学数据库的文献计量数据并不是专门为文献计量分析而产生的,因此可能含有错误,其中错误的存在必然会影响到使用这些数据进行的任何分析。为了减少错误,学者们必须仔细清理他们获得的文献计量学数据,这包括删除重复和错误的条目。第二,文献计量方法的性质本身就是一种限制。特别是,鉴于文献计量分析是定量的,其中定量和定性结果之间的关系往往不明确,文献计量学的定性论断可能相当主观。在这方面,学者们在对文献计量学观察进行定性论断时应该格外小心,并酌情用内容分析进行补充。第三,文献计量学研究只能提供研究领域的短期预测,因此,学者们应该避免对研究领域及其长期影响做出过于雄心勃勃的断言。尽管有这些限制,文献计量学方法可以使学者们克服处理大型文献计量数据集的恐惧,并对商业研究进行雄心勃勃的回顾。事实上,通过文献计量分析加强对科学的理解,不仅可以促进商业研究的知识创造,也可以促进其他领域的知识创造。我们朝着这个方向迈出了短暂而重要的一步。

最后编辑于 2022-10-09 · 浏览 6670

6 142 27

全部讨论0

默认最新
avatar
6
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部