[目的/意义]社交媒体因其受众广和传播速度快的特点, 成为网络谣言传播的重要媒介。鉴于网络谣言的危害性,如何有效控制谣言传播和及时进行辟谣,对网络谣言的辟谣工作和网络空间生态治理具有重要的理论和现实意义。[方法/过程]本文提出网络辟谣主题识别及用户情感态度划分的方法,根据LDA 算法确定划分主题数, 在最优主题数下构建用户层级和社区层级的回音室网络,并给出社交媒体网络辟谣的回音室效应分析模型, 确立了回音室效应分析公式及检验参数。结合“东航MU5735坠机” 网络舆情话题中网络谣言辟谣数据进行分析,对6个网络辟谣主题进行识别和情感分布进行分析, 并结合6个辟谣主题进行用户评论网络与转发网络回音室网络结构进行分析, 计算每个辟谣主题下回音室效应的虚拟社区层级的评论网络和转发网络中每个虚拟社区主题的同质性。[结果/ 结论] 研究发现,社交网络中辟谣信息的传播过程中存在回音室效应,其中转发过程比评论过程具有更强的网络同质性, 而评论用户比转发用户具有更高的矛盾心理。
[目的/ 意义] “科学—技术” 的知识融合和重组过程往往会因为面临一系列权衡抉择, 但学界对于背后的机制还缺乏了解。[方法/ 过程] 本文采用网络分析的随机行动者模型, 对2011—2019年基因泰克公司的1339名专利发明人构成的专利合作网络进行了跨时段的网络演化机制分析。[结果/ 结论] 本文发现了学术发明家在专利—论文跨界发表时发生的权衡抉择现象, 在学术发明家发表论文后, 学术发明家在专利合作网络中的合作倾向反而会下降。本文从“小世界性”“网络根植性” 和“网络中介人”的角度分析了学术发表影响专利网络结构的3种演化机制。本研究有助于理解近年来逐渐引起关注的企业从事基础研究的现象,也为目前企业的科学研究参与提供了实证参考。
[目的/意义]交叉学科正在成为我国科技创新的重要驱动力, 并不断催生新的科学前沿。如何识别并测度交叉前沿主题, 对于理解学科知识流转、把握新的交叉前沿方向至关重要。[方法/过程]本文从引文分析和主题分析相结合的角度, 提出基于引文—主题双重测度的交叉前沿识别方法。首先,综合运用自然语言处理、文本主题识别、引文关系矩阵等方法获取交叉主题;其次,通过构建基于引文—主题的交叉测度指标进一步遴选交叉主题; 最后, 提出主题影响力、新颖度、吸引度及热度的多维测度指标,获取交叉前沿。[结果/结论]通过信息科技与宇航交叉领域进行实证研究, 结果表明该方法能够有效识别出该领域的热点交叉前沿、新兴交叉前沿、潜在交叉前沿以及衰弱交叉前沿。
[目的/ 意义] 分析大模型时代背景下大数据政策生态链, 旨在提升大数据政策效能, 促进大数据共享。[方法/ 过程] 基于大模型时代大数据政策新特性, 结合生态学理论、大数据生命周期理论与政策生命周期理论, 阐述了大数据政策生态链内涵,并以科学数据政策为例, 总结了大数据政策生态链面临的新挑战, 并推理出相应优化策略。[结果/结论] 大数据政策生态链是生态学、社会生态、政治生态交集子生态的下级单元,是大数据背景下衍生贯穿于大数据生产、传播、消费、分解、再生全数据生命周期, 串联政策颁发、传递、接受、反馈、改革众多政策过程, 以配置大数据资源、监管大数据生态活动为工作内容, 以控制数据质量、保障数据安全、促进数据共享为目标的, 具有互动性、循环性、价值性、权威性、合法性、专有性、科学性的双螺旋链式生态结构,但其正面临着节点弱、链条短、网络疏等新挑战。
[目的/ 意义] 随着移动社交媒体的普及, 用户对移动设备和移动社交媒体应用的过度依赖已经对个人健康和社会生活造成了消极影响, 数字成瘾问题日益凸显。因此, 通过阐明移动社交媒体用户数字脱瘾行为影响因素间的作用关系与影响程度, 有助于用户培养良好的数字脱瘾行为习惯, 维持用户在正常生活和使用数字设备的时间之间的健康平衡, 同时也为数字脱瘾行为研究提供理论与应用指导。[方法/ 过程] 本研究采用元人种志和粗糙集相结合的方法分析识别出15 个影响因素, 并通过Grey(灰数理论)—DEMATEL(决策试验和评价实验法)法阐明各个指标对数字脱瘾的作用关系与影响程度。[结果/ 结论] 研究发现, 感知成本、感知危害性、结果期望、痛苦回避、自我控制力、正念能力、时间感知力、社会影响为关键影响因素, 并根据分析结果提出了培养移动社交媒体用户数字脱瘾行为习惯的建议, 同时也为平台商及相关社区提供管理决策参考。
[目的/ 意义] 随着信息技术的持续发展与普及, 互联网中滋生出网络暴力、谣言散播、饭圈失范等一系列非理性群体行为, 严重扰乱了网络空间乃至整个经济社会的运转秩序。在理论层面上, 系统深入地探讨网络非理性群体行为, 有利于对其进行科学认知和有效治理。[方法/ 过程] 首先依据社会技术互动网络的观点剖析网络非理性群体行为的概念内涵, 其次梳理国内外的现有相关研究成果, 最后归纳提炼出网络非理性群体行为的理论基础、研究视角与方法、驱动因素及作用机制, 形成理论框架。[结果/ 结论] 网络非理性群体行为的概念包含群体非理性、人—技术互动、社会互动3个核心构件。本研究构建的框架整合了现有成果, 可以促进未来的研究实现更多元、更深层次的问题探讨, 推动治理实践更全面、更有针对性地开展。
[目的/ 意义] 软件在现代科学研究中发挥着重要作用, 高效识别学术文献中的软件实体对深入认识软件的学术价值、促进软件可持续发展和学术生态体系均衡发展具有重要意义。[方法/ 过程] 本研究首先对软件实体进行定义;然后基于小型知识库的程序辅助标注方案, 构建软件实体识别领域语料库; 在此基础上, 提出改进的SciBERT-BiLSTM-CRF-wordMixup模型并对该模型的识别效果进行评估。[结果/ 结论] 实验结果显示,本研究提出的改进模型SciBERT-BiLSTM-CRF-wordMixup 在软件实体识别任务中表现最优, 其整体F1值达到87.5%,说明该模型能够有效地从学术论文文本中识别出软件及其相关信息实体。
[目的/意义] 可拓理论是一种围绕矛盾问题本质和转化变换机理寻求解决问题途径的方法论, 将其引入技术演化与预测分析, 是应对当下国际科技竞合环境、面向国家科技自立自强需求的创新融合举措。在揭示复杂技术创新过程中,不仅可以强化分析方法科学性, 提高信度和效度, 也为更深入地理解技术演化机制, 寻找潜在发展机会提供可能。[方法/ 过程] 本文在系统梳理技术演化与预测主流方法、可拓理论在知识管理与技术创新典型应用的基础上, 总结当前方法存在的不足。以面向农业遥感领域作物估产问题为例,进行可拓分析和定性验证。[结果/结论] 从理论基础、表达方式和分析过程3个角度,探讨可拓理论用于挖掘领域技术发展前沿方向的意义与潜力, 指出利用可拓理论分析领域技术演化过程需要注意的问题, 并通过案例分析证明理论思想的适用性。
[目的/ 意义] 研究构建科技人才知识图谱, 实现高潜质科技人才的智能化分析与识别, 为科技人才评价、人才梯度培养等提供决策支撑。[方法/ 过程] 本文从青年科技人才的特征出发, 融合多源异构科技大数据, 设计形成了科技人才知识图谱技术架构。从成长经历、科研环境、创新能力、科技领域等维度, 构建了基于三层科技数据治理的青年科技人才知识图谱技术架构, 建立了湖南青年人才数据资源池和画像系统。[结果/结论] 本研究构建了涵盖湖南科技管理系统2 万余条青年科技人才实体和40万条关系数据的湖南省青年科技人才知识图谱, 有效支撑了湖南省青年科技人才管理决策。
[目的/意义] 替代搜寻成为信息弱势群体弥补数字鸿沟的重要方式, 从被替代者的视角出发, 研究在线健康信息替代搜寻对老年人健康素养的影响对于进一步理解替代搜寻的行为效果具有重要的参考意义。[方法/ 过程] 基于社会认知理论构建在线健康信息替代搜寻对老年人健康素养的影响模型, 共提出5个假设,采用问卷调查的方式收集了238份有效老年人样本数据,使用SPSS 和SmartPLS软件进行后续的数据分析和假设检验。[结果/ 结论] 社会互动、在线健康信息替代搜寻和健康意识均正向影响老年人的健康素养, 其中老年人自身的健康意识是影响其健康素养最重要的因素。通过调节效应分析发现, 健康意识能够正向调节在线健康信息替代搜寻对老年人健康素养的影响, 社会互动负向调节在线健康信息替代搜寻对老年人健康素养的影响。
[目的/ 意义] 用户依从对于在线健康信息服务有效性和治疗效果具有重要意义, 分析在线健康信息用户依从意愿的关键因素和生成路径, 有助于为用户自我管理和在线健康社区建设提供参考。[方法/ 过程] 基于详尽可能性模型(ELM)与技术接受模型(TAM), 从在线健康信息特征、用户特征维度构建模型, 设计情景实验收集数据, 随后采用偏最小二乘结构方程模型(PLS-SEM)分析各因素对用户依从意愿的影响机制, 并使用模糊集定性比较分析法(fsQCA)探讨用户依从意愿的生成路径。[结果/ 结论] 论据质量、来源可信度显著正向影响信息有用性和信息易用性, 且通过信息有用性和信息易用性的中介作用积极影响用户依从意愿, 需求者参与和提供者竞争发挥调节作用, 信息类型在上述影响过程中存在一定的权变效应。定性比较分析结果显示分别存在3 条和5 条路径用于生成保守治疗方案、新兴治疗方案的依从意愿。融合PLS-SEM 与fsQCA 的混合方法为探讨在线健康信息用户依从意愿的影响机制提供了新的思路, 为提高用户依从意愿提供了针对性的路径和参考。
[目的/ 意义] 为解决在线健康社区文本中方面实体和评论实体难以对齐的问题, 提出了一种基于端到端的生成式方面级情感分析模型BERT-WWM-GPT。[方法/ 过程] 首先, 在模型训练阶段通过编码器抽取文本中包含丰富语义信息的特征向量; 其次, 基于特征向量和标准预测序列在解码器中迭代生成情感三元组, 并通过最大似然估计训练模型参数; 然后, 在模型推理阶段基于文本语义特征向量在解码器生成预测序列; 最后,利用规则得到有效的情感三元组表达。[结果/ 结论] 对自建数据集和5 份公共数据集进行验证, 结果表明BERTWWM-GPT 模型在两个方面级情感分析任务中的F1 值分别比基准模型GTS 和MuG RoBERTa-large 提升了12?? 25%和7?? 22%。BERT-WWM-GPT 模型能够有效抽取在线健康社区评论中的多重情感三元组, 且在其他领域具有优秀的泛化能力。
[目的/ 意义]文学类古籍作为古籍资源的重要门类之一, 具有独特的研究价值。本文探究如何将GPT 技术、用户需求分析与关联数据技术相结合以提升文学类古籍资源关联数据发布效果, 促进其数字化研究与开发利用。[方法/ 过程] 在现有的“本体模型+关联数据实现平台” 发布思路基础上, 结合文学类古籍资源内容结构特征, 提出包含数据层、数据网络层、数据融合层、应用层以及表现层5个层面的文学类古籍资源关联数据发布模型, 选取代表性文学古籍《聊斋志异·司文郎》开展案例实验。[结果/ 结论] 本文构建的文学类古籍资源关联数据发布模型在数据层融合GPT技术完成数据采集工作, 提高了知识组织效率, 在应用层增设用户需求分析提高了模型的实用性和关联数据发布效果。实验结果表明, 本文构建的发布模型能够满足文学类古籍资源的关联化发布需求, 可深度揭示此类古籍的语义内涵, 为文学类古籍从数据采集到发布提供可行的实现方案, 同时可面向用户需求提供文学类古籍资源的相关知识服务。
[目的/ 意义] 口述历史资源具有重要的史料价值和精神价值, 具有跨图书馆、档案馆、博物馆、科技馆等多领域的异构资源特征, 由口述历史资源析出的名人历史事件, 其“ 自下而上” 研究历史的新途径,受到了历史、档案、图情领域的普遍重视。事件的知识组织与应用一直是知识处理的重点和难点问题, 而在数字人文视角下,名人历史事件的知识化是对名人特藏资源进行知识重组、价值挖掘和叙事展演的重要基础。[方法/ 过程] 在前人研究的基础上, 本文对名人历史事件的内涵、特征和应用需求进行了总结与分析, 构建了名人历史事件语义模型, 并以科学家李政道和其创办CUSPEA事件为例进行语义模型的实例化构建。[结果/ 结论] 在名人历史事件语义模型基础上所建设的图数据库, 能够形成更具灵活性、细粒度、可扩展、相关联的实体关系和知识, 实现不同类型的用户对名人特色资源进行语义级查询、主题性聚合、叙事化展示和可视化呈现的知识表示。