Page 34 - 南京医科大学学报社会科学版
P. 34

南京医科大学学报(社会科学版)京医科大学学报(社会科学版)                  第6期 总第107期
                                                  南
             · 548  ·                       Journal of Nanjing Medical University(Social Sciences)of Nanjing Medical University(Social Sciences)  2021年12月
                                            Journal
             究进行分析,故未运用 CiteSpace 对 WOS 库内所得                   体呈递增的趋势。近年来发文量处于较高水平,但
             文献开展可视化分析。文献纳入标准:①发表时                             是波动较大,不够稳定,大致可以划分为三个阶段:
             间为 1995 年 1 月至 2020 年 12 月;②类别为“Arti⁃             ①1995—2004 年,论文发表数量少并且递增缓慢,
             cles”或“Review Articles”;③语言为英文;④标题或               十年时间仅由 1995 年的 1 篇增至 2004 年的 33 篇;
             关键词或摘要必须包含“商业健康保险”。文献排                            ②2004—2015 年,发文量增速明显加大,尤其是
             除标准:①以中国为研究对象的论文;②仅提及或                            2014 和 2015 年两年,增势迅猛,并于 2015 年达到顶
             仅对“商业健康保险”做简单介绍的论文;③没有                            峰 116 篇;③2015—2020 年,发文量处于较高水平,
             围绕“商业健康保险”主题做单独研究的论文;④                            但也是起伏最大的时期,最低点 2019 年的 54 篇不
             缺少标题、摘要、关键词、正文、参考文献等必要                            及 2015 年的一半。同期,国外商业健康保险发文量
             部分的残缺论文。共检索到 3 084 篇相关文献,                         亦呈整体递增的趋势。1995—2015 年国内外相关
             剔除不符合要求的文献后,共纳入有效英文文献                             论文发表数量相差不大,但自 2016 年后,国外相关
             2 323 篇。                                          论文发表数量逐年攀升,远超国内(图1)。
                 (二)研究方法
                                                                  350
                 CiteSpace 是基于 WOS 数据格式开发的文献计                                                               304
                                                                  300
             量可视化软件。可实现合作网络分析、关键词共现                               250                                    241 266
             分析、文献共被引分析等功能,在非 WOS 数据库下                           ( 篇 )  200                             213
             载 的 文 献 均 需 先 转 化 为 WOS 的 数 据 格 式 。 因               发文量  150                          134 147 149
                                                                                                     116
             CiteSpace 的功能限制,中文文献不可进行文献共被                         100                      63  69  98  109 105 71  79  106 82  88
                                                                   50          31 22 27 37 35 43 43  50  55 60  54
                                                                                          41 40 44 47
             引分析。由于共被引分析和共词分析的基本原理                                    16 1313  25 31 31 22  18  28 27
                                                                   0  1 0 1 3 2 1 2 5 17 33
             相同,因此,通过术语或关键词的共现、突现,结合                                1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020
             合作网络分析,亦可基本展现学科研究的热点、前                                                CNKI  WOS
             沿和演进趋势 。                                                                年份
                         [3]
                                                                图1 1995—2020年商业健康保险研究文献发表数量趋势
                 CiteSpace 共词分析的方法有两种,一种是关键
             词(keyword)共现,另一种是术语(term)共现,两者                        (二)研究机构与作者合作网络分析
             的区别在于,前者使用的是数据中原始的字段,后                                 通过 CiteSpace 软件对纳入的 1 063 篇文献的研
             者使用的是自然语言处理过程分析后提取的术语,                            究机构与作者进行知识图谱的可视化,该图谱共包
                                        [4]
             通常两者分析的结果相差不大 。本文采用的是关                            含 639 个节点,468 条连线,网络密度为 0.002。节点
             键词共现分析,选用默认参数设置,选择寻径网络                            的大小通常代表研究机构及作者的学术影响力,连线
                                                                                                        [7]
             算法(pathfinder pruning)+修剪合并网络(Pruning             的粗细则表示研究机构或作者之间的合作强度 。
             the merged network)绘制可视化图谱。本文采用                        结果显示,商业健康保险研究成果主要集中在
             TF×IDF 加权算法,对数似然率(log⁃likelihood rate)            财经保险类学科强势的高校和保险公司,尤以高校
             算法以及互信息(mutual information)算法相结合                  为主。合作网络节点数量甚至超过连线数量,研究
             的方式对“标题词条”“关键词词条”“摘要词条”抽                          机构、学者之间连线强度较弱,网络密度稀疏;各研究
             取的信息进行聚类,这也是对聚类最佳的诠释和                             机构或学者呈现小范围聚集,小聚落间几乎没有什么
             界定  [5] 。CiteSpace 聚类有以下几个重要的指标:网                 合作成果;在我国商业健康保险研究领域内,尚未有
             络密度(density),含义为网络中“实际关系”除以“理                     发挥中心节点作用的研究机构或学者(图 2)。发文
             论上的最大关系数”,网络密度没有一个明确的界定                           量排在第 1 位的研究机构是西南财经大学(45 篇),
             标准,通常认为越大越好;Modualarity 值(Q 值)是一                  发文量排在第 1 位的作者是来自南开大学的朱铭来
             个社团识别效果的指标,Q 值越大,表示网络的聚类                          教授(26篇)(表1)。
             效果越好,Q值一般在区间[0,1)内,Q值>3(经验值)                          (三)关键词共现分析
             就意味着划分出来的社团结构是显著的;Silhouette                           共词分析的基本原理是对一组词两两统计它
             值(S值)是用来衡量网络同质性的指标,越接近1,聚                         们在同一组文献中出现的次数,通过这种共现次数
             类效果越好,一般当 S 值>0.5 时,即认为聚类结果是                      来测度他们之间的亲疏关系,借以反映学科领域内
             合理的,当S值>7时,聚类是高效率且令人信服的 。                         研究的热点分布、前沿及变化情况                  [8] 。本文通过
                                                       [6]
                                                               CiteSpace 对样本文献的高频关键词(阈值频次≥
                               二、结     果
                                                               20 次)绘制知识图谱。结果显示,所得可视化图谱
                 (一)文献发表数量分析                                   共包含621个节点,1 058条连线,网络密度为0.006,
                 国内商业健康保险研究发文量总体偏少,整                           Q 值=0.866,S 值=0.954,说明图谱的聚类结果是高
   29   30   31   32   33   34   35   36   37   38   39