基于LDA主题模型的我国养老服务政策文本分析
doi: 10.7655/NYDXBSSS250284
李秀平1,2 , 张静1
1. 安徽中医药大学医药经济管理学院
2. 数据科学与中医药创新发展安徽省哲学社会科学重点实验室,安徽 合肥 230012
基金项目: 安徽省高校人文社科重大项目“中医药助力大黄山国际休闲度假旅游目的地建设对策研究”(2022AH040070) ; 安徽省教育厅新时代育人质量工程项目“公共管理理论前沿”(2023szsfkc086) ; 安徽省高校协同创新项目“安徽中医药数据集成与治理研究”(GXXT-2022-095) ; 安徽中医药大学专项项目“中医药文化与大思政课双向联动的理论逻辑与实践进路” (2022AH010038-1)
Text analysis of China’s senior care service policy based on LDA topic modeling
LI Xiuping1,2 , ZHANG Jing1
1. School of Medical Economics and Management
2. Key Laboratory of Data Science and Innovation Development of Traditional Chinese Medicine,Philosophy and Social Sciences of Anhui Province,Anhui University of Traditional Chinese Medicine,Hefei 230012 ,China
摘要
随着人口老龄化程度不断加深,养老服务相关政策不断出台,政策的重点也在随时代调整。文章选取2015—2025年与养老服务相关的政策文本,运用隐含狄利克雷分布(latent Dirichlet allocation,LDA)主题模型,抓取44份政策文本内容的核心内容进行热点主题识别并分类,深入分析我国养老服务政策的发展方向和趋势,揭示政策发布状况及主题特征。最终形成七个热点主题,关键词聚焦“健康”“社区”“社会”“鼓励”等内容,分别划归为养老服务供给、养老产业和基本养老服务三大类主题。研究表明,养老服务应建立多层次养老体系,加强服务供给监管;丰富产业形式,实现全要素发展;提高供给与需求的匹配度,保障基本养老服务三方面不断前行,助力我国养老服务事业高质量发展。
Abstract
With the deepening of population aging,policies related to senior care services have been successively introduced,and the focus of policies has been adjusted with the times. This paper selects 44 policy texts related to senior care service issued from 2015 to 2025 as samples,and applies the Latent Dirichlet Allocation (LDA)topic model to capture the core themes of the selected policy texts for hot topic identification and classification. This paper aims to conduct an in-depth analysis of the development direction and trend of the Chinese government in the supply of senior care service,revealing the release patterns and theme characteristics of these policies. 7 key themes were formed in the analysis,with keywords focusing on“health”“community”“society” “encouragement”and other contents,which were divided into three categories:senior care service supply,senior care industry and basic senior care service. It is concluded that the senior care service should advance in three key areas,including establishing a multi-level care system and strengthening service supply supervision;diversifying the industrial form to promote a comprehensive development of senior care;and improving the compatibility between supply and demand to ensure the long-term progress of basic senior care service. As a result,these measures will contribute to the high-quality development of China’s senior care system.
人口老龄化是人口发展的必然趋势,是中国式现代化正在面临的重大课题。国家统计局数据显示,截至2024年底,我国60周岁及以上老年人口已占总人口的22.0%,我国即将步入深度老龄化社会,我国政府及社会对于养老服务的关注度也越来越高。党的二十大报告提出实现全体老年人共同享有基本养老服务,2023年中共中央办公厅、国务院印发《关于推进基本养老服务体系建设的意见》,明确了基本养老服务的内涵、重点服务对象等内容,也为基本养老服务的发展指明了方向。随着人口老龄化程度的不断加深,我国正经历着由家庭养老向社会养老服务模式的转型[1],养老服务相关政策不断出台,政策的重点也在随时代调整。
政策文本作为精准把握政府行为及施政理念、厘清政策文本中内在机制与决策动因的重要载体,对提升公共管理与决策的科学性和精准性具有不可估量的价值[2]。随着政府信息公开化进程的加快,利用信息技术的新方法与新工具挖掘海量政策文本中的政府注意力日渐成为研究热点[3]。政策文本质性分析为养老服务的研究提供了新的视角,有助于增强政策在新时代背景下的适应性和创新能力,推动养老服务领域决策的科学化与精准化进程。隐含狄利克雷分布(latent Dirichlet allocation,LDA)主题模型通过分析政策文件的主题词、词频高低以及词语共现情况,提供有效的分析框架,从而抓取政策文件的核心内容,最终实现研究目的[4]。本文通过LDA主题模型对养老服务相关政策文本进行分析,揭示养老服务政策的发布状况及主题特征,以期为相关政策研究提供有益的参考。
一、 资料与方法
(一) 资料来源
政策文本分析融合了多学科的理论与方法,能够针对政策文本中的结构性特征进行量化及质性探究,实现对政策主题核心内容的深入剖析。为保证文本获取的全面性,参考过往此类研究文献,以 “养老服务”“公共服务”“养老”“基本养老”等作为关键词,在中国政府网等国家机构网站、北大法宝及中国知网中检索 2015—2025 年与养老服务相关的政策文本(不包含港澳台地区数据)。为保证所纳入政策文本的准确性和针对性,纳入标准为:①发文机构权威,包括中共中央、国务院及其部委等机构; ②内容与养老服务明确相关;③政策类型选取法律、规划、意见、通知等文件。排除标准为:①会议讲话、工作报告、政策解读等文本;②只出现关键词,无实质性相关内容的文本;③与其他政策文本重复[5]
(二) 研究方法
由于政策法规这类特殊文本的高维词项特性,传统的基于相似性度量的分类和聚类等文本挖掘技术实施后的结果缺乏可解释性,而主题模型则提供了新型语义降维与探索主题结构的新方法[6]。 LDA主题模型是一种文档主题生成模型,致力于从政策文本的集合中挖掘隐藏的主题信息特征,对文本数据从语义的层次进行挖掘,为揭示文档集合中的潜在语义结构提供理论指导[7]。通过 LDA 模型,可以从大量文本数据中自动提取潜在的主题结构,在政策文本分析中,LDA 模型凭借独特的建构方式,能够迅速挖掘政策的核心主题,从而深入理解政策内容的重点和方向。因此本文采用LDA主题模型进行养老服务领域政策法规原始文本的主题挖掘。
(三) 研究设计
1. 文本预处理
在构建 LDA 主题模型的过程中,针对政策文本数据集进行预处理是必不可少的步骤。由于文本中包含大量数字、人名、标点符号等对分析无实质性贡献的字符,这些元素可能会对模型构成干扰。为此,需要实施分词处理,并去除停用词,以提升模型的效率和准确性。接着对每条文本进行预处理,包括去掉标点符号、数字、英文字母并只保留中文,通过词汇切分将词汇切分长度设置为大于等于2。最终得到“养老服务”“机构”“养老”“健康”“社区” “社会”“鼓励”“管理”“居家”“老年”“设施”“政策” “照护”“民政部”“护理”等词汇。
2. 主题词选取
主题数量的选择显著地影响文本的分析效果:若主题数量过多,每个主题包含的内容不够充分,则缺乏足够的代表性,难以抓取到有价值的信息; 若主题数量过少,数据的多样性无法有效捕捉,主题过于宽泛,涵盖多个不同的概念,则模型的解释能力和准确性降低。因此,在实际操作中通常借助困惑度(perplexity)和一致性(coherence)来确定最佳的主题数量[8]。困惑度代表文档归属特定主题的不确定性,一致性代表对特定主题进行解释的难易程度[9]
困惑度衡量模型对测试数据的预测能力,值越低表示模型越好:
Perplexity (D) =expd=1M n=1Nd logPwd, nθd, Φd=1M Nd
D是测试数据集,M是文档总数,Nd是文档d中的单词数,wdn是文档d中第n个单词,θd是文档d的主题分布,Ф 是主题词分布,Pωdn| θdФ)是文档d 生成单词ωdn的概率。
主题一致性衡量主题内部词的语义相似性,使用PMI(pointwise mutual information)方法计算。
Cv=Σm=1NΣl=1LΣj=l+1LPMIωl, ωj
其中,Cv是主题一致性指标,M是主题数,L是每个主题的前L个高频词,PMI(wLwJ)是词wLwJ的点互信息,衡量两个词的共现关联性。
对主题一致性与主题困惑度进行计算,主题选择区间为1~11个,结果如图1所示。当主题困惑度为7时,困惑度最低且存在拐点,同时,主题一致性较高,说明该主题数量适宜。
1困惑度与一致性折线图
二、 结果与分析
(一) 政策文本概况
2015—2025 年,从中国政府网等国家机构网站、北大法宝及中国知网中检索到的养老服务相关文本共117份,按照纳入与排除标准筛选后得到44 份政策文本,表1列举出2015—2025年国家部分养老服务相关政策。其中,2020与2019年发文数量较多,共计16份,其他年份发文数量较为稳定。2019 年以前,养老服务相关政策多与医疗卫生、放开市场相关,2019—2020 年养老服务政策多与托育、养老机构相关,2020年后养老服务相关政策多提及基本养老服务供给。
12015—2025年国家部分养老服务相关政策
(二) LDA主题提取及结果分析
1. 政策高频词汇分析
对 44 份政策文本进行预处理后,从中获取到 4 466个关键词。其中,养老服务、机构、养老出现超千次;健康、社区、社会、鼓励、管理、居家、老年、设施、政策、照护、民政部、护理出现超200次;改革、地方、监管、指导、引导、失能等词汇出现接近 200 次 (表2)。这从侧面说明我国养老服务政策鼓励引导社会参与养老服务供给,采取机构、社区、居家等形式的多主体养老策略,重点针对困难、失能老年人提供养老服务。
22015—2025年我国养老服务相关政策高频关键词
2. 政策文本主题分析
图2中的每个圆代表了 1 个主题,每个主题都根据语料库展示了不同概念和角度,圆心之间的距离代表各个主题之间的相似度,每个主题的面积大小显示pyLDAvis所使用的“相关性分数”,展现了主题在文档中的普遍性和独特性。因此,通常认为,面积越大的主题在文档中越重要或显著,气泡与气泡之间的距离,显示了不同主题间的相关性和相对位置。圆圈有重叠说明不同主题的特征词有交叉,由于LDA主题是根据所纳入的文本内容生成的,部分主题存在范围重叠的情况,符合 LDA 主题模型分析方法的特征属性。在主题数量为7时,所生成的各主题气泡在不同的象限分布较为均匀,证明模型拟合较好,且此时气泡图中的各气泡彼此间交叉较少,表明各主题语义区分效果较好,主题识别结果理想,具有一定辨识度。
其中,主题 1 占比 43.3%,主要高频词有人才、服务质量、医疗、医养、卫生等;主题 2 占比 20.5%,主要高频词有照护、失能、对象、惩戒、名单等;主题 3 占比 5.3%,主要高频词有参与、审批、改革、服务业、培训等;主题 4 占比 7.9%,主要高频词有消费、产品、分工负责、试点、老年等;主题 5 占比 5.6%,主要高频词有中医药、农村、家政、改革、家庭等;主题 6 占比 4.5%,主要高频词有老年、供养、设施、特困、改造等;主题 7 占比 2.8%,主要高频词有疫情、防控、激励、物业、非法等。各主题内详细高频词分类见表3
LDA 主题模型已对所获取的文本关键词进行客观归类,借鉴过往学者做法,按照各个主题下聚类词汇的语义特征和联系进行人工编码主题命名[10],最终将匹配结果具象化。人工编码命名是将主题模型所获取的关键词编码为一阶或二阶主题,以呈现主题的有效性[11],在此基础上进一步概括归纳出各主题名称。本研究得到3个主题,分别命名为“养老服务供给”“养老产业”和“基本养老服务”(表4)。政策主题以养老服务供给为核心,围绕养老产业和基本养老服务等相关主题展开,旨在全方位、多角度推进养老服务体系建设。
2主题分布语义气泡图
32015—2025年我国养老服务政策主题词汇
4主题归类命名
三、 讨论
(一) 主题“养老服务供给”体现了政策层面对养老服务供给的关注
对于产生养老需求的老年群体,以满足个体老年期生存发展需要为目标,既包括衣食住行等基本需求,也包括休闲娱乐等高层次需求[12]。养老服务供给既包括养老教育培训、人力资源服务、机构服务、长期护理保险,也包括养老照护服务、护理技能培训、老年医疗卫生服务提供等多维内容。这也要求政府在采取养老服务供给促进政策的同时,通过试点改革、加大资金投入与完善基本设施、推广成功经验等方式,引导相应社会力量加入养老服务供给,同时对志愿力量进行培训、对社会资本加强监管。
(二) 主题“养老产业”注重回应老年群体日益丰富的养老需求
“养老产业”通过市场购买将养老服务递送至家庭内部,突出供给端的产业发展政策,助推产业链供应链的融合。发展养老产业以满足多样化的养老服务需求,通过提供多样化和个性化养老服务,培育经济发展新动能,提高老年人的生活品质。引导养老产业投资建设,促进养老机构服务、养老科技及智慧养老服务、养老产业与养老事业协同发展,做到养老服务沿着事业、行业、产业和经济的路径梯次推进,并逐步实现有效市场和有为政府的结合。
(三) 主题“基本养老服务”实现养老保障的兜底性作用
“基本养老服务”涉及满足老年人日常生活需求所提供的基础且必要的养老服务,由政府承担福利性养老责任,实现养老保障的兜底性作用,关注弱势群体养老问题。其中包含新冠疫情特殊阶段发布的政策文本,其政策文本及关键词占比较低,考虑到此阶段政策关键词也能体现出在特殊阶段国家对于老年人养老服务的关注,其服务也属于基本服务范畴,因此本研究亦将其作为单独的关键词主题并将其划归为“基本养老服务”主题。主题7中出现“非法”“集资”等部分词汇,是关注某些地区出现的以养老服务为名,针对老年人的非法集资行为,是政府通过政策支持保护老年人合法权益不受侵害,因此也可划归为政府为保障老年人养老而发布的基础性、普惠性、兜底性政策文本。基本养老服务的具体内涵近几年才被大众关注,基本养老服务在我国的发展仍处于初级阶段,因此政策文本更多地关注基础设施的完善、人才队伍建设、资金的投入等方面。
四、 建议
(一) 建立多层次养老服务体系,加强服务供给监管
政府不是多层次养老服务的唯一供给主体,企业和个人也要承担责任,多层次中的各部分是协调发展的,要处理好三者之间的关系,根据老年人不同收入层次提供养老服务[13]。在多层次养老体系中,第一层次是政府承担兜底责任的基本公共养老服务供给;第二层次为政府引导社会力量提供的基本养老服务,具有一定公益性质,政府对此类服务给予补贴,以解决中低收入人群的养老服务问题; 第三层次则是市场化养老服务,面向高端人群,满足多元化需求,政府及时提供政策支持,并完善行业规范与处罚标准,依法监管,营造有序良好的市场竞争环境。政府与市场主体之间需加强沟通交流,厘清双方的服务责任与职能边界,共建共享服务清单,防止出现政府“越位”或“缺位”问题,从而实现服务质量的提升。
在服务供给监管方面,首先,可考虑将养老服务供给者的服务质量纳入各级领导班子年度考核指标:将各行政区养老服务站点的普及率、覆盖率、实际运行状况、医养结合率、老人托管率、上门服务率及老年人满意度等,作为相应领导班子的年度考核内容。各地区人民政府应出台相关条例或办法,打破部门壁垒,并将街道社区医院、卫生服务中心与养老服务站点开展医养结合的情况纳入考核目标任务。其次,加强对街道社区养老服务站点的定期考核,由民政主管部门会同卫健委、街道办及社区居委会,对其养老服务情况实施平时考核和年度考核,并将考核结果作为确定财政补贴发放比例或等级的关键依据;对考核不合格或连续考核等次较低的站点,应重新招标。最后,需建立养老机构黑名单制度,整合信息资源于大数据平台,实现监管互联互通。
(二) 丰富产业形式,实现全要素发展
一方面,政府应发挥主导作用,综合运用直接财政补贴、定向税费减免等组合工具,切实减轻养老企业运营负担。同时,开发针对养老机构建设、运营和设备更新的中长期低息贷款、信用贷款产品;创新设计涵盖机构责任险、老年人意外险以及针对养老项目周期风险的专属保险方案。另一方面,政府完善融资担保体系,为养老服务供给机构破解“融资难、融资贵”问题。鼓励银行、保险、基金等市场主体,开发更多元化的商业养老保险产品、养老目标基金、养老理财产品等,完善多支柱养老保险体系和综合性养老保险产品的设计,实现养老服务业多元行动主体间的风险共担与利益共享。
对于养老领域人才储备方面,政府需与应用型本科及大中专职业院校、养老服务机构形成合力,加强宏观规划和政策引领,动态调整优化专业设置和课程体系,引导企业深度参与教学过程并提供充足的实习实训岗位,提升专业培养与就业实践质量。支持有条件的高等院校和科研机构,探索和发展老年学、老年护理学、老年社会治理、养老产业经济学等交叉学科,为行业培养高层次研究型、管理型人才。同时,积极吸纳并培育经验丰富、有意愿的“年轻型”老年群体,为养老事业和产业注入宝贵的“老年视角”和生活智慧,挖掘老年人力资源潜力,缓解养老行业人力短缺压力。
促进现代科技适老化转化。建立常态化的政府部门、互联网科技企业、养老服务机构三方沟通协作平台,共同促进“大数据+健康管理”“人工智能+照护”等智慧养老模式的规模化落地。重点支持研发和推广操作简便、功能实用的智能适老化辅助设备,让技术真正服务于老年人的实际需求。建立健全技术评估、孵化、中试和推广机制,推动创新成果快速转化为适销对路的产品和服务,并在社区养老、机构养老、居家养老等多种社会场景中开展实践,切实提升养老服务的科技含量与效率。
(三) 提高供给与需求的匹配度,保障基本养老服务
基本养老服务政策最终要靠基层政府落实,基层政府在政策执行中必须进一步明确政府保障不同层次养老服务需求的优先顺序[14]。一是从需求主体来讲,政府有限的财政资源应首先向经济困难的老年人倾斜,确保其基本生存尊严;在低收入老人中,身体机能受损、照护需求迫切者应获得最优先保障。这要求基层建立有效的失能评估和收入核查联动机制,精准锁定目标人群。二是从需求类别来讲,包括助餐、助浴、助洁、助行、如厕、卧床护理等直接维系生存和基本尊严的服务,是财政补贴和政府购买必须优先、充分保障的领域;在保障基本生活的基础上,关注老年人的心理健康和权益维护,提供精神慰藉与信息咨询服务;考量文化娱乐等发展性需求,通过市场化、社会化的方式满足,政府可适度引导但非补贴重点。文化娱乐需求要靠后。政府必须明确界定并确保养老服务机构具备提供基本公共养老服务的能力和职责。在此基础上,积极构建“保基本”与“促多元”的衔接机制:确保低收入、失能和半失能等目标人群的基本需求得到无差别覆盖;鼓励社会资本提供多样化、高品质的付费服务,满足不同支付能力和偏好人群的需求;推动政府、社会资本以及提供不同层级服务的养老服务机构之间,在设施布局、服务链条、业务协同等方面实现无缝衔接,形成服务网络。
财政补贴是保障基本服务的关键手段,必须实现从“粗放漫灌”向“精准滴灌”的转变。一是实行动态化、差异化补贴:养老服务补贴基准额度向低收入失能、半失能老年人重点倾斜;补贴标准调整挂钩当地经济社会发展水平,特别是养老服务市场平均价格以及老年人失能等级等因素,实现补贴水平与成本变化的动态匹配。二是构建主动发现系统:在确保信息安全和个人隐私前提下,整合打通民政、社保、公安、税务、银行、住建、医疗等多部门数据,科学设定识别指标及其权重,建立客观低收入失能和半失能老年人智能识别的测算模型和判定标准,系统自动生成符合补贴条件的初步人选名单,变“人找政策”为“政策找人”,最终确定补贴对象。
五、 展望
政策文本主题分析作为一项基础性且具有重要战略意义的工作,能够确保政策执行过程中各环节的顺畅衔接,提前预判政策制定及执行过程中可能出现的漏洞与偏差,从源头上降低失误率、进行科学合理的预测,为政策的制定提供坚实的技术支撑,使政策更具针对性和可操作性。LDA 主题模型作为一种先进的数据分析工具,能够对复杂的政策文本进行精准的主题提取和分类,为政策分析提供更为客观、量化的依据,使政策评价摆脱传统定性分析的局限性,更加科学、准确。基于此,在未来的工作中,将以 LDA 主题模型为核心支撑,持续在政策文本分析领域进行深耕,致力于更精细化的研究,不断提升政策分析的深度与广度,为政府治理能力的现代化提供智力支持。
1困惑度与一致性折线图
2主题分布语义气泡图
12015—2025年国家部分养老服务相关政策
22015—2025年我国养老服务相关政策高频关键词
32015—2025年我国养老服务政策主题词汇
4主题归类命名
杨定, 王丽娟. 不同类型社区居家养老服务需要与利用分析[J]. 南京医科大学学报(社会科学版),2025,25(2):139-144
汪禹, 吴彬. 情感分析视角下中文政策文本的倾向词典构建研究[J]. 情报资料工作,2025,46(5):102-112
郑新曼, 董瑜. 政策文本量化研究的综述与展望[J]. 现代情报,2021,41(2):168-177
董钰馨. 新时代以来我国工会政策的主题挖掘与分析——基于LDA主题模型[J]. 天津市工会管理干部学院学报,2025,42(1):44-56
张梦怡, 张筱荣. 多孩政策实施以来妇幼政策特征分析及展望[J]. 南京医科大学学报(社会科学版),2024,24(3):224-230
杨慧, 杨建林. 融合LDA模型的政策文本量化分析——基于国际气候领域的实证[J]. 现代情报,2016,36(5):71-81
张成磊. 我国全民健身政策演进历程及理念特征研究——基于LDA主题模型的分析[D]. 武汉: 武汉体育学院,2025
关鹏, 王曰芬. 科技情报分析中LDA主题模型最优主题数确定方法研究[J]. 现代图书情报技术,2016(9):42-50
李鑫, 韩一冰, 李祥飞. 基于LDA主题模型的我国医疗健康政策特征分析[J]. 中国公共卫生管理,2024,40(3):311-315
马鸿佳, 肖彬, 韩姝婷. 创业领域动态能力研究综述——基于LDA主题模型[J]. 南开管理评论,2025,28(1):163-174
范柏乃, 盛中华. 数字经济安全的维度识别、特征提取及分层模型——基于LDA主题分析与扎根理论编码的混合研究[J]. 浙江大学学报(人文社会科学版),2024,54(2):5-29
李磊, 杜孟飞, 曾之遥. 银发经济、养老产业、银龄消费概念及其关系辨析——基于“主体—内容—政策”的分析框架[J]. 财经理论与实践,2025,46(3):57-66
汪璐蒙, 曾泉海. 县域视角下农村多层次供需均衡养老保障体系: 概念厘定、体系构建与实现路径[J]. 西南金融,2023(4):83-95
谢来位. 低收入老年人基本养老服务有效供给的政策优化研究——重庆市“机构建中心带站点进家庭”养老服务调查[J]. 重庆社会科学,2025(2):54-71
关闭