关键词:
科学突破
结构熵
社区识别
链路预测
基因工程疫苗
摘要:
创新发展是世界各经济体的战略发展要点。创新意味着范式的改变、劳动力的解放、生产效率的提高,进而实现社会经济、文化和技术的全面进步。从各国家地区的战略部署来看,突破性创新是部署的重点,其蕴含巨大的经济、科研和国家战略价值。突破性创新作为创新这一概念的下位类,具有非线性、创新性和影响力等多种特征。且特征量化难度大,因此识别和预测的难度较大。如果能对突破性创新进行识别和预测,可以先一步进行科研资金的优化配置、科研人员的合理调度和科研资源的重点投入,率先取得重点领域的科学突破和完成技术转型变革,占领技术高地。科学论文作为科学创新的重要载体,是突破性创新研究的重要数据来源。通过对科学论文的内容解读识别突破性创新,有助于深入了解突破性创新的发展规律和特点,对于后续研究的开展和管理决策的制定有重要作用。当前,已有研究对于突破性创新的测度大多从创新性、新颖性或者学科交叉性等较为单一的维度开展,也就是大多以某一个具体特征作为突破口进行测度,这就忽略了知识发展是一个整体动态发展这一基本特征,突破性创新的出现是依据每个知识单元之间的连接共同作用下的结果。本研究以科学论文作为主要的研究对象,没有将技术内容考虑在内,是以科学突破主题为研究对象,针对的是领域级别的科学研究,尝试对这类主题进行识别与预测。主要以主题词共现网络作为知识网络的代项,以科学突破主题会对知识网络整体状态造成“影响”作为突破口进行识别和预测。而其中网络状态的变化就是通过“结构熵”进行测度。因此构建了一套基于熵值的领域科学突破主题识别与预测方法。从而能从知识网络整体发展的视角识别科学突破。该项研究能补充当前突破性创新研究的理论研究,并具备一定的现实应用意义。本研究主要内容主要包括以下三个方面:首先,对创新领域内涵较为接近的几个概念从定性和定量两个维度进行了辨析,梳理了当前已有研究提出的突破性创新所应该具备的特征和识别方法的不足,最后明确了在识别突破性创新时需要重点关注的特征,为后续本研究提出的方法模型体系提供了理论支撑。之后,提出了基于熵值识别和预测科学突破的方法体系。熵值即是知识网络状态测度的指标。首先是就结构熵与知识网络状态之间的关系进行阐述,再梳理已有的结构熵构建方法,归并其优缺点,在既考虑知识网络的组成“节点”和“边”,又考虑知识发展特征“非广延性”的基础上,构建本研究的结构熵指标。之后从网络动态发展(结构熵发生改变的重要时间点)、识别重要主题(对网络结构熵影响较大的社区)和识别重要节点(对网络结构熵影响较大的节点和网络结构熵影响力发生突变的节点)等三方面对科学突破展开识别和预测。最后,在实证阶段是以“基因工程疫苗”领域的科学论文作为研究对象开展。在识别阶段主要是从结构熵的三方面开展,同时在识别阶段还与现有的新兴主题识别和突变主题识别结果进行了比对。预测阶段首先是通过链路预测方法构建预测的新网络,再从重要主题和重要主题词两方面进行科学突破的筛选。最后通过专家评估方法的有效性。实证结果证明,本文所提出的基于熵值的科学突破的识别和预测方法在基因工程疫苗领域有一定的应用价值,在知识体量越发巨大的今天,能在一定程度上对领域科学突破进行识别和预测,减轻人力筛选的负担,更快速高效地实现探测。本文包括图20幅,表格26个。