一、Extracting Local Schema from Semistructured Data Based on Graph-Oriented Semantic Model(论文文献综述)
杨娜[1](2021)在《基于建筑信息模型的电气照明自动设计研究》文中研究说明电气照明设计是指设计人员依据相关电气行业标准和设计规范对建筑工程项目进行的室内外照明设计,用以满足人们生产生活的需要。随着社会的进步,人们生活水平的提高,照明设计的标准和要求也越来越严格。目前设计人员主要依赖CAD(Computer Aided Design)设计及绘图,相对纯手工图纸绘图而言其是一种半自动化的设计方式,仍存在无意义的重复性机械操作,设计效率低。随着建筑行业现代化和信息化的发展,建筑信息模型BIM(Building Information Modeling)技术带来了新的工作模式。BIM中包含建筑规划、设计、施工和运维全生命周期中的数据信息,各专业人员可以在BIM平台协同工作。在一体化设计的趋势下,BIM设计将成为主流,因此本文以实现电气照明自动设计为目标,利用BIM和自然语言处理技术,提出基于BIM的电气照明自动设计方法,以提高电气照明设计的效率。主要研究工作如下:(1)针对使用通用分词工具对电气照明设计领域的规范分词效果不佳的情况,引入互信息和边界熵两个参数对分词算法进行改进,识别出该专业领域内的新词。(2)分析电气照明规范文本结构,利用“七步法”构建领域知识图谱的模式层。(3)通过语义角色标注与依存句法分析结合的方法抽取规范条文的主语、谓语和宾语,解决语义角色标注无法抽取出多个宾语的问题,完成领域知识图谱数据层的构建,实现规范条文的结构化。(4)提出电气照明设计所需建筑模型信息的抽取与存储方法。对于模型中缺少的信息,以与IFC(Industry Foundation Class)标准一致的方式对其定义,为电气照明设计提供数据基础。(5)利用抽取出的房间信息对建筑模型进行三维标注,实现三维视图下的属性可视化。(6)基于Visual Studio 2019平台,采用C#语言对Revit API进行二次开发,结合领域知识图谱和建筑模型信息实现电气照明自动设计,并通过WPF(Windows Presentation Foundation)进行界面设计。最后以某一栋办公楼为例进行实验分析,验证该电气照明自动设计系统功能的完整性与有效性。
翟娇娇[2](2021)在《面向知识图谱构建的知识融合问题研究》文中研究表明随着互联网的迅速普及,如何有效地组织、利用以及挖掘数据背后隐含的知识成为一种新的挑战。知识图谱描述了客观世界所存在的实体及语义关联等,并以图结构直观地呈现,为用户提供了结构化的知识,逐渐获得了学术界和工业界的普遍关注,因此如何构建一个知识图谱成为学者们研究的热点。同时多源异构的知识之间往往会存在重复、语义歧义多样、质量参差不齐等问题,要想构建一个高质量的知识图谱,知识融合是不可或缺的关键环节。实体对齐和实体链接作为知识融合任务的两个重要子任务,现有的方法仍存在明显不足,主要表现在现有的实体对齐方法无法完全利用属性三元组包含的信息,以及现有的实体链接方法忽视了知识图谱的结构信息导致链接准确度不高,因此值得进一步研究与改进。本文将知识图谱应用于影视领域,深入研究多层次影视知识图谱构建过程中所涉及的知识融合关键技术,重点研究了知识融合环节的两个重要子任务实体对齐和实体链接,本文主要研究内容如下:(1)针对现有实体对齐方法的不足,本文提出了一种实体对齐模型—Nov EA模型。首先本模型充分利用了知识图谱中的属性三元组和关系三元组,然后依据知识图谱的领域特征对属性进行优先级排序,最后从结构和属性两个角度,利用二元回归模型对实体之间的相似度进行度量,动态地调节关系和属性之间的权重,进一步提升了实体对齐的效果。实验证明,相较于其他同任务模型,本文提出的Nov EA模型的对齐准确度有显着的提升。(2)针对现有实体链接方法的不足,本文提出了一种基于多维粒度的知识图谱实体链接模型。该模型在传统实体链接方法的基础上,重点关注了知识图谱中候选实体的邻域信息。在本方法的排序模块中,从实体名称、实体描述和图谱实体节点邻域等多个维度将待链接实体与候选实体进行相似性计算,选出最匹配的候选实体。实验证明,本文提出的多维粒度实体链接模型准确度优于其他同任务模型。(3)将本文的知识融合方法应用于影视领域,构建了多层次影视知识图谱。首先基于影片实体、影人实体、机构实体三类不同层面的实体层次分别构建相应的单层次知识图谱。其次,由于不同实体层次之间存在关联性,本文将不同实体层次构建的单层次知识图谱进行了整合,构建了内容全面、结构立体的高质量多层次影视知识图谱。最后实现了碎片化影视知识的收集,同时构成了体系化的知识。
张敏[3](2021)在《面向文物领域的知识图谱构建技术研究》文中研究表明博物馆作为文物保护与传承的载体,承载着人类数千年的文明。在蓬勃发展的物联网和人工智能等技术的驱动下,智慧化建设成为博物馆界关注的热点。然而,由于文物资源种类多数量大,以及互联网相关文物数据的多源异构性,使得博物馆智慧化建设中对文物信息资源管理与利用存在以下两个问题:文物信息资源缺乏有效组织和文物数据之间缺乏有效联系。文物知识图谱挖掘文物事实,利用文物间潜在的联系形成三元组,构建文物知识库,实现文物的有效组织,为文物资源的融合与共享提供基础。同时,文物知识图谱对延展文物知识,丰富文物展陈方式,促进智能问答、语义搜索和智慧导览项目的开发,提升博物馆智慧化服务具有重要意义,其研究吸引了大量研究者关注。文物知识图谱的构建虽已涌现出诸多相关研究,但仍面临以下挑战:(1)文物实体抽取任务中,有监督的方法需要大量标注数据,但构建大规模文物标注数据费时耗力,另外,中文文物实体数据构词具特殊性。(2)文物关系抽取任务中,文物数据存在多重关系,同时文物领域文本关键词具稀疏性。(3)文物实体对齐任务中,百科类网站文物数据具多源异构性,现有的仅从单一的字符或词语层面获取实体相似度的实体对齐方法精确率相对较低。(4)文物知识图谱补全任务中,文物实体间存在隐含关系,以及文物领域具隐含关系的标注三元组相对缺乏。本文针对以上挑战,开展了面向文物领域的知识图谱构建技术研究,主要探讨了文物实体抽取、关系抽取、实体对齐、知识图谱补全等问题,为文物知识图谱构建提供理论和技术支持。本文主要工作和贡献如下:(1)提出一种基于自训练算法的半监督文物实体抽取方法。首先,为解决文物文本构词特殊性问题,使用ELMo语言模型生成词表示,动态提取实体上下文特征;其次,为实现全局最优的标签序列预测,利用Bi LSTM和CRF模型实现特征提取和实体标注;最后,为提高模型的性能,设计一种基于双重标注样本选择策略的自训练算法,通过双重标注选取高置信度的样本。实验结果表明,本文提出的方法利用50%的标注数据在文物实体抽取任务上取得了较好的效果。(2)提出一种基于词注意力机制的胶囊网络文物关系抽取方法。首先,为同时获取语义和语序信息,融合字、词嵌入以及词性和词语位置信息作为模型的输入,以有效捕获语义和语序特征;其次,为解决文物文本关键词稀疏性的问题,设计一种基于词注意力机制的动态路由算法,赋予信息词较高权重,迭代修正连接强度来解决关键词稀疏问题;最后,为解决实体间多重关系问题,利用转换矩阵对胶囊实例化参数预测。实验结果表明,本文提出的方法有效实现了文物领域多重关系的提取。(3)提出一种基于多特征相似度的文物实体对齐方法。首先,针对百科网站文物数据的多源异构性,提取实体属性、实体摘要和实体全文特征,并计算其相似度,分别从字符、词语和句子层面获取实体特征;其次,为了提高实体对齐的精确率,融合实体属性、实体摘要和实体全文特征相似度构建文物实体对齐模型;最后,通过阈值判断两个实体是否对齐。实验结果表明,本文提出的方法在三类文物实体的对齐任务中的精确率分别提高了2.11%,4.98%和4.18%。(4)提出一种融合实体类型的BERT文物知识图谱补全方法。首先,为有效获取实体丰富的语义信息,融合实体类型这一外部知识,使模型消除违反类型约束的反例,实现文本语义增强表示;其次,为有效识别隐含关系,解决关系稀疏性问题,使用多头注意力机制获取文本特征;最后,使用大量无标注数据预训练BERT模型,少量标注文物三元组对模型微调,解决文物领域标注三元组缺乏问题。实验表明,本文提出的方法使用35%标注数据在文物知识图谱补全任务中取得的结果优于对比方法。
剡恺[4](2021)在《面向金融领域的自动问答系统的研究与实现》文中指出近年来,“金融科技”成为金融领域一大热点,让科技为金融赋能成为行业新的发展趋势,自动问答技术便是典型代表之一。而得益于知识图谱技术的进步,基于知识图谱的自动问答方法脱颖而出,成为近年来的研究热点。基于知识图谱的自动问答方法以知识图谱作为数据源,接受用户的自然问句作为输入,理解用户的询问意图,搜索知识图谱内的知识信息,并返回对应结果。自动问答方法更符合用户的行为习惯,用户可以直接通过询问方式获取高精确度答案,提高用户的信息获取效率。但是,当前面向金融领域的自动问答系统的实现仍面临一些问题:(1)缺少可行的自动问答答案选择方法,仅依靠深度模型的方法其计算耗时长和输出不稳定难以满足线上业务需求;(2)缺乏公开的金融领域知识图谱,知识体系难以建立。针对上述问题,本文设计并实现了一种多级决策的自动问答方法,并以公司产业信息为金融领域知识切入点,构建起公司产业信息知识图谱,最终实现了一个面向金融领域的自动问答系统。具体内容包含以下三点:(1)研究并实现一种基于知识图谱的多级决策自动问答方法。本文首先在自动问答IE-SQL模型的基础上进行改进,强化模型结构语义网络特征,增强模型多任务间的联系,提高模型的表性能力;本文将传统自动问答方法与改进的IE-SQL模型相串联,实现多级决策的自动问答方法,有效提高自动问答方法的计算效率;(2)构建公司产业信息知识图谱。本文通过数据爬虫、实体识别、关系抽取等方法,实现公司产业数据采集,并应用传统概率模型方法实现数据间的知识融合,构建出一个公司产业信息知识图谱,对自动问答方法进行实验验证;(3)构建面向金融领域的自动问答系统。本文以建立的知识图谱为数据基础,以自动问答功能为核心,设计并实现面向金融领域的自动问答系统,为用户提供自动问答服务。
程子轩[5](2021)在《面向用户知识需求的微信公众平台知识资源聚合及服务研究》文中提出移动互联网时代,微信公众平台已成为人们交流、休闲、学习、生活的一部分,随着以传播知识为主的微信公众号涌现,微信公众平台也逐渐成为人们获取知识的重要途径。一些综合性或专业领域微信公众号发布各类科普知识和前沿资讯,一些学术类微信公众号专业发布学术领域内相关的学术知识,部分高校学报和高校图书馆微信公众号还专门开设“学术播报”、“学术快讯”等专栏,用于发布学术讲座及学术前沿知识。各类机构或个人通过微信公众平台发布大量科普型知识、专业发展前沿资讯、专业学术知识以及学术专题等,能够满足不同专业和认知层面的用户知识内容的需求。然而,微信公众平台知识内容以用户生成为主,其庞大纷杂的微信公众平台账号主体导致了平台信息和知识质量的参差不齐、出现信息过载和迷航现象,对海量知识资源缺乏科学高效的组织和管理。当前,随着大数据、人工智能等技术的发展,简单提供知识资源内容已经无法满足微信公众平台用户知识服务需求。智能时代,用户对知识质量和知识服务模式提出了更高的要求,促使微信公众平台知识组织和服务转型。如何在海量纷杂的信息中筛选出真正需要和感兴趣的知识资源内容不仅是广大微信用户面临的困扰,更是微信公众平台需要关注并急需解决的问题。鉴于此,本文将知识聚合理论与方法引入到微信公众平台知识资源组织及服务研究中,提出了面向用户知识需求的微信公众平台知识聚合及服务体系框架。首先,构建了微信公众平台用户画像并对用户知识需求进行了分析,从知识单元和句子层面分别提出了基于标签聚类和基于摘要生成的微信知识资源聚合方法,并基于不同知识资源聚合方法设计了微信公众平台知识推荐服务和知识集成服务两种知识服务模式。最后提出了提升微信公众平台知识聚合及服务能力的对策建议。本文主要开展了以下方面的研究:(1)面向用户知识需求的微信公众平台知识聚合及服务体系框架构建。通过辨析知识聚合服务与用户知识需求之间的关系,明确了微信公众平台面向用户需求开展知识聚合的必要性和可行性。阐述了微信公众平台知识聚合概念、目标与原则以及聚合服务要素,认为微信公众平台知识聚合是为了满足用户个性化知识需求,通过计量分析、数理统计、数据挖掘、人工智能等方法分析挖掘知识单元的内在联系,将微信公众平台复杂多样化、数量庞大、无序碎片的领域知识资源重新组织和序化,形成结构完善的知识体系,为后续微信公众平台知识聚合服务提供资源保障。通过分析面向用户需求的微信公众平台知识聚合服务组成要素、动因及过程,提出了面向用户需求的微信公众平台知识聚合服务体系架构,将其划分为数据资源层、用户需求挖掘层、知识资源聚合层、服务提供层4个主要模块。(2)微信公众平台用户画像构建与需求分析。基于VALS2模型从宏观层面对微信公众平台使用者构建群体用户画像,将用户划分为初期引入参与型、成长型和成熟型用户3类,并绘制各类用户特征的标签词云。分析不同类型的用户知识需求形成的过程,并建立微信公众平台用户知识需求层次模型。综合用户画像和用户知识需求层次构建了微信公众平台用户知识服务需求模型,凸显微信公众平台知识服务现状与用户知识需求的巨大差距。(3)基于标签聚类的微信公众平台知识聚合方法。提出融合Word2vec模型和TextRank算法的微信公众平台知识资源标签抽取方法,将关键词作为标签表达文本知识资源内容的主题思想及关键内容。提出基于改进BIRCH聚类算法的微信公众平台文本标签聚类方法,在原算法执行过程中融合K-means算法初选聚类中心,并综合考虑用户需求因素。最后以微信公众平台发布的“认知计算”领域文章为例进行实证研究,研究发现本文提出的基于改进Birch算法的聚类结果主题分布较为合理,各个类之间的区分度较为明显,类簇大小的差距较小,其效果要优于基于K-means算法、基于Spectral Clustering算法和基于Birch算法的聚合效果。(4)基于摘要生成的微信公众平台知识聚合方法。提出基于改进TextRank算法的微信公众平台知识摘要生成方法,分别设计了单文本摘要生成和单领域多文本的知识摘要生成方法。在单文本摘要生成方面,通过综合考虑用户需求、句子位置、标题相似度等因素提高摘要生成效果。在单领域多文本摘要生成方面,采用Doc2vec模型进行文本向量化,对文档集中的句子进行主题细分,并运用MMR算法进行句子冗余处理,提高生成结果的准确性。以微信公众平台发布的“认知计算”领域文章为例进行实证研究,研究发现运用本文方法生成的文本摘要能够较好的匹配用户需求,能够实现面向用户需求的个性化抽取和生成,准确率明显优于其他算法。且本文算法生成的摘要,具有较好的语意连贯性,便于读者的理解和进一步掌握文章主旨大意。(5)基于知识聚合的微信公众平台创新知识服务模式。以微信公众平台知识聚合及服务体系框架为基础,针对不同层面的知识聚合,构建了基于知识标签聚类的微信公众平台知识推荐服务和基于摘要生成的微信公众平台知识集成服务两种服务模式。分别阐述了两种知识服务的概念、知识服务要素和知识服务过程。(6)微信公众平台知识聚合及服务能力提升对策。分别从用户知识需求外化表达及挖掘、新技术应用和融合改进和微信公众平台创新服务理念及加强运营管理三个方面提出提升微信公众平台知识聚合及服务能力的对策建议。本文从理论层面将知识聚合理论和方法引入到微信公众平台,解决其知识组织和服务问题,扩展了知识聚合相关研究的领域和视角。同时,本文对微信公众号发布的知识内容进行知识主题聚类和自动化摘要生成,并建立了相应的知识聚合服务体系,丰富了社交媒体平台创新知识服务理论体系,为新媒体知识服务提供理论和技术支持。在实践层面,本文面向微信公众平台中不同微信公众号发布资源内容的知识聚合,分别进行了知识主题发现和自动生成摘要知识聚合技术实证,为微信公众平台知识资源组织管理提供了技术方法和手段。同时,提出的对策建议和服务模式也为微信公众平台开展创新型知识服务提供参考依据和建议。
吴昊[6](2021)在《面向课程推荐的知识图谱增强推荐模型研究》文中研究指明在线学习平台中课程资源的数据总量的爆炸式增长进而呈现“信息过载”现象,学习者无法精准获取个性化课程资源,使得学习者出现学习兴趣低下、缺乏主动性等一系列问题,因此最有效的技术是使用课程推荐系统。知识图谱的独特图存储结构为提高课程资源领域中推荐的有效性与准确性提供了新思路。本文通过课程资源数据构建课程领域知识图谱,利用提供的矢量化技术提取丰富的语义信息,并将其与推荐算法通过交叉压缩单元集成在一起,以提高推荐性能。在多任务功能推荐场景中,着重课程资源知识图谱的构建技术以及推荐算法与知识图谱相融合的设计方法,主要研究内容如下:(1)对现有基于知识图谱推荐系统和课程资源推荐领域的研究进展进行概述,阐述了常用知识图谱辅助推荐算法的思想、原理、具体流程和各自的优缺点,简单介绍了知识图谱构建方法,旨在提出了一种构建课程资源领域知识图谱的方法。在课程资源领域中引入知识图谱的概念,首先分析课程资源领域中的知识特征,完成实体和关系的划分,并在课程领域中实现本体数据库的建立;然后,根据本体数据库中的实体和关系定义,使用知识提取技术从课程资源中提取特定的实体和知识关系;最后,分析在关系数据库中存储数据的优缺点,选择使用图数据库Neo4j进行知识图谱的存储。(2)构建了一个面向课程资源的基于知识图谱的多任务特征增强推荐模型。该模型分为三个部分:推荐模块、知识图谱嵌入模块和交叉压缩单元。该模型通过深度学习,采用端到端框架实现。将知识图谱嵌入到低阶任务中进行辅助推荐并使用交叉压缩单元互相关联,通过共享潜在特征中的学习项目以及知识图谱中实体之间的连接来自动构建推荐模型。实验结果表明,与其他推荐模型相比,基于知识图谱的推荐算法具有更高的准确性和查全率。(3)改进基于知识图谱辅助的多任务特征推荐算法。首先,在推荐模块中使用Deep FM算法代替协同过滤算法,以弥补协同过滤给算法带来的维度变换、数据压缩等问题。在使用FM来捕获低阶特征的同时,通过增加深度网络来捕获高阶特征;然后,在知识图谱嵌入模块中采用图卷积神经网络(GCN)框架,该方法通过顺序学习的集成方式引入知识图谱,并提出一个带有知识感知图神经网络(KGNN),该神经网络使用标签平滑归一化提供了更好的方案,对知识图谱中的节点进行充分表示学习。最后,在交叉压缩单元中通过深层网络对压缩矩阵进行建模,捕获交叉压缩单元中的高维特征,在Canvas Network和ed X两个在线学习平台获取的课程数据集进行实验,结果表明,基于知识图谱辅助的推荐算法在准确性上表现最佳。
张政平[7](2021)在《面向孔子世家谱的知识问答模型研究与应用》文中指出我国是一个统一的多民族国家,悠久的历史积累下了很多光辉灿烂的优秀文化,家谱就是其中不可替代的一部分。家谱不仅记载了一个家族的兴衰成败,还反应了当时社会的历史文化背景,是一种具有独特功能的人文资料。孔子世家谱记载了以孔子为始祖的孔氏族人的世系繁衍信息,承载了中华儒家文化的精神与灵魂,因此,深入探索孔子世家谱内容的语义表示、语义推理及其应用具有至关重要的研究价值和现实意义。知识问答系统是融合结构化与非结构化的知识提取、表示、存储、检索,实现基于知识的语义分析与认知推理,并以简单对话模式解决用户认知、决策问题的智能平台。针对孔子世家谱问答系统,本文应用知识图谱、深度学习和图数据库等技术与架构,主要在知识图谱构建、知识问答模型设计和问答系统研发三个方面做了以下研究工作:(1)提出世家谱本体构造方法,构建基于本体的孔子世家谱知识图谱。首先,在分析孔子世家谱原始数据的基础上,提出改进的本体构造方法并构建初始的世家谱本体结构。然后,根据本体约束条件,为不同结构的文本数据制定针对性的信息抽取方法。最后,整合抽取的有效信息,并将之存储于Neo4j图数据库,为知识问答模型与系统的构建和应用奠定了知识基础。(2)提出融合深度学习与模板的知识问答模型,设计基于语义解析的世家谱知识问答策略。首先,为了减少用户等待时间,在语义解析模块中增加了问题判断子模块;其次,为了提高语义解析的准确率,提出引入预训练语言模型的ALBERT-Text CNN模型和ALBERT-BLSTM-CRF模型对问句分别进行问题判断和实体抽取。实验表明,与传统模型相比,问题判断和实体识别的准确率分别提高了1.34%和2.01%,知识问答模型的准确率达到了92%。(3)设计与开发了孔子世家谱问答系统。为了能够有效面向孔子世家谱知识图谱开展研究,广泛推广孔氏家谱文化和儒家文化,基于孔子世家谱知识图谱和知识问答模型实现了问答系统。该系统按照软件工程开发流程,在完成需求分析、系统设计的基础上,使用Flask作为开发框架,利用cytoscape.js库进行图谱的Web可视化,实现了面向孔子世家谱初集内容的可视化检索和知识问答功能。总之,孔子世家谱的知识图谱化为儒家文化的研究提供了新方法、新思路,基于知识图谱的问答系统为中华儒家文化的传承与弘扬探索了新形式、新途径。
于海[8](2021)在《基于社交网络热点事件库的流行度预测研究》文中指出社交网络信息流行度是热点事件受关注程度的量化指标。广大网络用户通过在线社交网络发布和转发信息,表达对社会热点事件的立场和态度,推动了信息的传播和流行。流行度能够反映网络舆情发生、发展状态。网络舆情能够影响广大网络用户的思想和行为,并可能引发公共安全事件。在社交网络分析需求快速发展的今天,研究流行度预测方法有助于提高网络舆情预测能力,对于实现良好的社会舆论氛围和保障社会公共安全具有重大的现实意义。然而,现有的流行度预测方法距离能够在舆情治理中得到应用还面临着一些挑战,其中既包括庞杂的社交网络大数据为上层流行度分析应用带来的数据表示与组织难题,又包括现有流行度演化预测研究对社交网络特有的演化规律和影响因素考虑不足带来的局限性。本文围绕“面向流行度演化预测的社交网络大数据表示与组织问题”、“流行度演化高峰期预测问题”和“多因素指标的流行度预测问题”三个关键问题,从面向流行度分析与预测的社交网络热点事件库模型、基于社交网络主题标签的流行度高峰期预测、基于社交网络事件库多因素耦合的流行度预测和流行度分析预测平台实现及应用四个方面开展了研究,主要工作和贡献如下:首先,针对利用海量、庞杂的在线社交网络大数据分析和预测信息的流行度演化态势中的数据表达与组织问题,构建了社交网络热点事件库模型。分析了社交网络大数据的多维性,建立了数据模型,包括定义的实体与属性、数据约束和约束检查及查询等组成部分。在此基础上,设计了基于社交网络热点事件库的时间序列提取方法。实验表明,社交网络热点事件库模型中的数据约束检查方法性能良好,所提出的基于热点事件库的时间序列提取方法与人工提取方法相比在准确率和召回率等方面有更好的表现,并且通过启用约束检查方法能够进一步提高表现。其次,针对基于历史流行度指标的信息流行度演化分析与预测问题,基于真实在线社交网络数据分析了流行度的演化规律,提出了一种流行度演化的高峰期预测方法。通过Twitter数据集的实证研究,发现自演化开始以来,流行度通常在其演化的早期达到顶峰。在此基础上,提出流行度高峰期预测方法,综合利用了三种类型的数据资源,通过采用LSTM和DeepWalk等嵌入算法进行多维矩阵转换,应用平均池层进行特征表示,学习内部注意力和相互注意力,最后输入到神经网络非线性层形成最终输出,预测了流行度演化的高峰时间。实验表明,本文所设计的方法中的绝对误差中值比NAM、SVR、SpikeM、BLR等基线方法要低。这不仅证明了通过多模态深度学习方法来学习高级特征的有效性,也证明了本文所设计的预测方法具有更优的预测效果。再次,针对基于多因素指标的流行度演化分析与预测的问题,利用事件库获取多因素指标,提出了一种基于事件库多因素耦合的流行度预测方法。通过利用事件库对于社交网络数据的统一存储,从多源异构数据中提取各因素指标。在此基础上,提出了一种分组嵌入的方法。基于深度学习的嵌入方法为时间序列数据的降维与融合提供了可能。根据因素的物理意义与特征将因素分组为累积性因素和固有性因素。然后分别采用不同的神经网络进行嵌入得到这些因素指标的地位表示,并在此基础上提出了预测方法。本研究所提出的方法在因素选取、因素抽象化定义、因素分组、因素指标数据获取和指标数据综合利用等方面实现了创新设计。实验表明,与已有的深层神经网络模型、支持向量回归机、SH流行度预测模型等相比,本研究所提出的预测方法相比现有模型在预测准确度上具有明显的优越性。最后,设计并实现了流行度分析预测平台。利用本文提出的模型和方法,实现了事件流行度分析预测功能。案例验证了本文的研究成果,取得了良好的应用效果。
刘昱然[9](2021)在《多模态领域知识图谱构建方法及应用研究》文中研究指明知识图谱(Knowledge Graph)作为知识组织和管理的有效模式,被广泛应用于知识检索、知识更新、问答等领域,其构建方法的研究受到了越来越多的关注。当前的图谱构建大多集中于文本单模态图谱,然而,图像、视频、音频等数据的大量涌现,使得多模态知识管理与表示的需求也更为迫切。因此,本文面向特定领域,整合多模态数据资源,应用实体抽取、关系抽取、数据融合和知识表示等构建方法,开展了多模态知识图谱的构建研究,具体研究成果如下:(1)构造了多模态数据集。面向党建领域,从第三方平台获取了文本、图片、视频数据,使用Python中的Jieba、Pandas、Numpy等工具技术对数据进行了去重、去噪和归一化等处理,进而构造了多模态数据集;(2)提出了标签对齐的多模态数据融合方法(LCSMMF)。基于已构建的多模态数据集,利用引入注意力机制的分段卷积神经网络(PCNN+ATT)抽取了文本语义标签,使用卷积神经网络(CNN)提取了图片语义标签,采用人工标注抽取了视频语义标签,调用最长公共子序列(LCS)算法实现了不同模态数据的标签相似度计算,通过比较选取相似度最高标签对进行链接,实现多模态数据融合;(3)构建了多模态知识图谱。利用标签对齐的方法融合了多模态数据,并采用深度学习和人工干预等方法抽取数据中的实体及实体关系,根据抽取结果构建语义网络,实现了包含文本、图片、视频模态的党建知识图谱;(4)开发了基于多模态知识库的智能导航实验系统。综合应用neo4j、pycharm、Django等技术方法,构建了Windows下运行的智能导航验证平台,为用户提供多模态党建知识图谱的展示、知识导航及语义检索等功能。
林泽斐[10](2020)在《基于在线百科的社会网络抽取及语义化研究》文中指出基于社会网络的研究方法已被广泛应用于人文社会科学的众多领域。社会网络研究的基础是社会网络的构建,随着大数据研究的兴起,面向海量数据的社会网络自动抽取成为社会网络构建的新兴热点。社会网络抽取是指基于明确或隐含的信息,从信息源中自动抽取出社会成员及其联系的技术。在在线百科中,蕴含着海量的社会成员及其社会关系信息。如何从此类信息源中抽取出大规模社会网络,是值得探讨的一大课题。此外,社会网络构建的目的在于对所构建的社会网络进行进一步的分析和利用。近年来,将语义网技术与社会网络相结合的语义社会网络开始得到学术界的关注,借助于本体和推理引擎,语义社会网络可以具备一定的逻辑推理能力,这有助于从社会网络中挖掘大量潜在的语义信息和社会成员联系,进而服务于学术研究。在此背景下,本研究以在线百科作为主要信息源,探索一种基于百科半结构化文本的社会网络抽取机制,在此基础上对大规模社会网络的语义化方法及其在数字人文领域的应用模式展开研究,主要的研究内容包括:(1)针对在线百科中的社会网络抽取问题,提出一种新的基于在线百科的大规模社会网络抽取方法,其主要创新点在于利用排序学习方法综合多种特征计算人物关系权重,通过估计人物生存时空来发现人物间的时空耦合关系。通过此方法,本研究首次从中文在线百科中抽取出完整的带有权重和时空信息的社会网络。(2)在对当前社会网络本体调研的基础上,提出了一种新的社会网络本体MSTSN。与同类社会网络本体相比,MSTSN本体主要面向数字人文领域的社会网络构建,特别对人物所处的时空、人物的不同类型,以及人物间的不同关系类型等信息进行了细粒度的刻画。基于MSTSN本体,对在线百科中所抽取的社会网络进行实例化,形成一个大规模人物知识图谱。(3)针对人物知识图谱中的人物关系预测这一难点问题,提出一种新的知识图谱关系预测方法,该方法将关系路径和反映实体间关系的文本矩阵化,通过卷积神经网络学习与特定关系类型相关的结构和文本模式特征,在此基础上训练模型实现关系预测。对比实验结果表明,本研究提出的方法在评测数据集上的性能表现超过了主流方法的水平。(4)针对非结构化文本中的人物关系三元组抽取问题,提出一种新的中文命名实体链接方法,该方法融合了单实体消歧和多实体消歧特征,并根据不同文本长度选用不同的特征组合;同时,在传统一阶段式消歧的基础上添加了第二阶段消歧以改善消歧结果。对比实验显示该命名实体链接方法的总体性能优于当前主流同类系统的水平。(5)基于本研究所提出的MSTSN本体和所构建的人物知识图谱,阐述了四类面向数字人文研究的社会网络语义查询策略,并通过可视化方法展示各策略的执行效果。相比传统的社会网络构建策略,本研究所提出的方法可从在线百科中有效地抽取社会成员及其关系,且更加关注与社会成员相关的时空和语义信息,在人名消歧和人物关系权重算法等方面也进行了改进,这可为大规模社会网络的自动化构建研究提供理论和方法参考。通过对社会网络进行语义化处理所形成的大规模人物知识图谱,在与人文学科相关的社会网络分析系统、问答系统、知识发现系统中均具有实际应用价值,这可为探索文本挖掘和语义网技术在数字人文研究中的应用模式提供参考借鉴。
二、Extracting Local Schema from Semistructured Data Based on Graph-Oriented Semantic Model(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、Extracting Local Schema from Semistructured Data Based on Graph-Oriented Semantic Model(论文提纲范文)
(1)基于建筑信息模型的电气照明自动设计研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 研究发展现状 |
1.2.1 照明设计研究现状 |
1.2.2 规范解读研究现状 |
1.2.3 模型准备研究现状 |
1.3 本文的研究工作及主要内容概述 |
第二章 相关理论和技术基础 |
2.1 自然语言处理技术 |
2.1.1 中文分词工具 |
2.1.2 词性标注工具 |
2.1.3 语言技术平台(LTP) |
2.2 知识图谱研究 |
2.2.1 知识图谱定义 |
2.2.2 知识图谱架构 |
2.2.3 知识图谱的存储 |
2.3 BIM技术研究 |
2.3.1 BIM技术概念 |
2.3.2 BIM技术优势 |
2.4 本章小结 |
第三章 电气照明规范知识图谱构建 |
3.1 电气照明规范语料获取 |
3.1.1 规范体系分类 |
3.1.2 语料格式处理 |
3.2 基于本体的电气照明知识图谱模式层构建 |
3.2.1 规范文本分析 |
3.2.2 电气照明规范本体的构建 |
3.3 基于信息抽取技术的电气照明知识图谱数据层构建 |
3.3.1 电气照明规范预处理 |
3.3.2 基于语义角色标注的规范条文抽取方法 |
3.3.3 规范条文抽取方法的改进 |
3.3.4 算法总流程 |
3.3.5 算法评价 |
3.4 电气照明规范知识推理 |
3.4.1 规范条文规则总结 |
3.4.2 知识图谱模式层关系的完善 |
3.4.3 照明设计推理技术 |
3.5 电气照明知识图谱的存储与应用 |
3.5.1 知识图谱的存储 |
3.5.2 知识图谱的应用 |
3.6 本章小结 |
第四章 电气照明设计建筑模型信息抽取 |
4.1 Revit二次开发环境配置 |
4.1.1 Revit API |
4.1.2 Revit API开发工具 |
4.1.3 Revit API开发流程 |
4.2 IFC数据标准概述 |
4.3 基于IFC标准的建筑模型信息抽取 |
4.3.1 照明设计需求分析 |
4.3.2 基于高效过滤法的信息抽取 |
4.3.3 房间属性信息抽取 |
4.4 建筑模型数据库存储 |
4.4.1 数据库的选择 |
4.4.2 数据库访问技术 |
4.4.3 BIM模型数据库设计 |
4.5 Revit模型房间自动标注 |
4.5.1 房间坐标转换 |
4.5.2 房间信息三维自动标注 |
4.6 本章小结 |
第五章 电气照明自动设计系统插件开发 |
5.1 照度计算方法 |
5.1.1 点照度计算 |
5.1.2 平均照度计算 |
5.1.3 设计结果校核 |
5.2 系统总体设计 |
5.2.1 系统架构设计 |
5.2.2 系统功能设计 |
5.2.3 插件及界面设计 |
5.3 照明计算实验分析 |
5.3.1 设计对象的选择 |
5.3.2 灯具类型的确定 |
5.3.3 三维布灯图纸生成 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
个人简历 在读期间发表的学术论文 |
致谢 |
(2)面向知识图谱构建的知识融合问题研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 知识图谱的研究现状 |
1.2.2 知识融合的研究现状 |
1.3 本文主要研究内容 |
1.4 论文组织结构 |
第2章 相关理论与技术研究 |
2.1 知识图谱概述 |
2.1.1 知识图谱构建流程 |
2.1.2 知识图谱存储 |
2.1.3 知识图谱质量评估 |
2.2 知识融合方法概述 |
2.2.1 实体对齐方法 |
2.2.2 实体链接方法 |
2.3 本章小结 |
第3章 基于Nov EA模型的知识图谱实体对齐方法 |
3.1 引言 |
3.2 实体对齐技术分析 |
3.2.1 实体对齐任务 |
3.2.2 现有方法不足 |
3.3 基于Nov EA模型的知识图谱实体对齐方法 |
3.3.1 谓词对齐模块 |
3.3.2 属性嵌入模块 |
3.3.3 结构嵌入模块 |
3.3.4 实体对齐模块 |
3.4 实验验证和分析 |
3.4.1 数据集 |
3.4.2 评价指标 |
3.4.3 比较方法和参数设置 |
3.4.4 实验结果与分析 |
3.5 本章小结 |
第4章 基于多维粒度的知识图谱实体链接方法 |
4.1 引言 |
4.2 实体链接技术分析 |
4.2.1 实体链接任务 |
4.2.2 现有方法不足 |
4.3 基于多维粒度的知识图谱实体链接方法 |
4.3.1 实体标记模块 |
4.3.2 候选实体生成模块 |
4.3.3 排序模块 |
4.4 实验验证与分析 |
4.4.1 数据集 |
4.4.2 评价指标 |
4.4.3 比较方法和参数设置 |
4.4.4 实验结果与分析 |
4.5 本章小结 |
第5章 面向影视领域的多层次知识图谱的构建方法 |
5.1 引言 |
5.2 多层次影视知识图谱的定义 |
5.3 影视数据的获取 |
5.4 影视知识抽取 |
5.5 影视知识融合 |
5.5.1 系统框架设计 |
5.5.2 系统功能展示 |
5.6 多层次影视知识图谱的展示 |
5.6.1 数据导入 |
5.6.2 构建多层次影视知识图谱 |
5.7 多层次影视知识图谱质量评估 |
5.8 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
在学期间主要科研成果 |
一、发表学术论文 |
二、其它科研成果 |
(3)面向文物领域的知识图谱构建技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状及存在的问题 |
1.2.1 文物领域知识图谱研究现状 |
1.2.2 知识图谱构建技术研究现状 |
1.2.3 存在的问题 |
1.3 本文的研究内容 |
1.3.1 基于自训练算法的半监督文物实体抽取 |
1.3.2 基于词注意力机制的胶囊网络文物关系抽取 |
1.3.3 基于多特征相似度的文物实体对齐 |
1.3.4 融合实体类型的BERT文物知识图谱补全 |
1.4 本文的创新点 |
1.5 本文的组织结构 |
第二章 基于自训练算法的半监督文物实体抽取 |
2.1 引言 |
2.2 文物实体抽取方法 |
2.2.1 文物实体形式化描述 |
2.2.2 文物实体抽取模型 |
2.3 基于ELMo的词表示 |
2.4 基于Bi LSTM和 CRF的特征提取和实体预测 |
2.4.1 基于Bi LSTM的特征提取 |
2.4.2 基于CRF的实体预测 |
2.5 基于双重标注的高置信度样本选择 |
2.5.1 双重标注样本选择策略 |
2.5.2 基于双重标注样本选择策略的自训练算法 |
2.6 实验与结果分析 |
2.6.1 数据集及预处理 |
2.6.2 实验设置 |
2.6.3 文物实体抽取的实验结果 |
2.6.4 初始标注样本比例对模型性能的影响 |
2.6.5 不同词表示对模型性能的影响 |
2.6.6 样本选择策略对模型性能的影响 |
2.7 本章小结 |
第三章 基于词注意力机制的胶囊网络文物关系抽取 |
3.1 引言 |
3.2 文物关系抽取方法 |
3.2.1 文物关系形式化描述 |
3.2.2 文物关系抽取模型 |
3.3 融合词性和位置信息的文本表示 |
3.3.1 基于字和词的联合词表示 |
3.3.2 融合词性和位置信息的文本表示 |
3.4 基于双向Bi LSTM的低层特征提取 |
3.5 基于词注意力机制胶囊网络的特征聚类 |
3.5.1 基于胶囊网络的丰富特征提取 |
3.5.2 基于词注意力机制的动态路由算法 |
3.6 多重关系预测 |
3.7 实验与结果分析 |
3.7.1 数据集及预处理 |
3.7.2 实验设置 |
3.7.3 文物关系抽取的实验结果 |
3.7.4 词表征对模型性能的影响 |
3.7.5 词注意力机制对模型性能的影响 |
3.8 本章小结 |
第四章 基于多特征相似度的文物实体对齐 |
4.1 引言 |
4.2 文物实体对齐方法 |
4.2.1 文物实体特征形式化描述 |
4.2.2 文物实体对齐流程 |
4.3 基于动态规划的LCS实体属性相似度 |
4.3.1 动态规划最长公共子序列查找算法 |
4.3.2 实体属性相似度计算 |
4.4 基于TF-IDF和余弦相似度的实体摘要相似度 |
4.4.1 基于TF-IDF的特征向量获取 |
4.4.2 实体摘要相似度计算 |
4.5 基于LDA主题模型的实体全文相似度 |
4.5.1 基于LDA模型的主题建模 |
4.5.2 实体全文主题特征生成 |
4.5.3 实体全文相似度计算 |
4.6 文物实体对齐模型及算法 |
4.6.1 文物实体对齐模型 |
4.6.2 文物实体对齐算法 |
4.7 实验与结果分析 |
4.7.1 数据集及预处理 |
4.7.2 实验设置 |
4.7.3 文物实体对齐的实验结果 |
4.7.4 主题个数对文物实体对齐结果的影响 |
4.7.5 阈值对文物实体对齐结果的影响 |
4.7.6 实体特征对文物实体对齐结果的影响 |
4.8 本章小结 |
第五章 融合实体类型的BERT文物知识图谱补全 |
5.1 引言 |
5.2 文物知识图谱补全方法 |
5.2.1 知识图谱补全问题描述 |
5.2.2 文物知识图谱补全模型 |
5.3 融合外部知识的文物文本语义增强表示 |
5.4 基于多头注意力机制的特征提取与序列编码 |
5.4.1 基于多头自注意力机制的特征获取 |
5.4.2 基于Transformer编码器的序列编码 |
5.5 BERT模型的预训练和微调 |
5.5.1 基于无监督的BERT模型预训练 |
5.5.2 基于预训练模型的参数微调 |
5.6 文物知识图谱补全模型的输出 |
5.7 实验与结果分析 |
5.7.1 数据集及预处理 |
5.7.2 实验设置 |
5.7.3 三元组分类的实验结果 |
5.7.4 链接预测的实验结果 |
5.7.5 关系预测的实验结果 |
5.7.6 训练数据比例对模型性能的影响 |
5.8 本章小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 工作展望 |
参考文献 |
攻读博士学位期间取得的科研成果 |
致谢 |
作者简介 |
(4)面向金融领域的自动问答系统的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题的研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 自动问答研究现状 |
1.2.2 知识图谱研究现状 |
1.3 研究内容 |
1.4 论文结构 |
第二章 相关理论与方法 |
2.1 基于知识图谱的自动问答方法 |
2.1.1 基于模板匹配的问答方法 |
2.1.2 基于语义解析的问答方法 |
2.2 知识图谱构建方法 |
2.2.1 实体识别 |
2.2.2 关系抽取 |
2.2.3 知识融合 |
2.3 本章小结 |
第三章 多级决策的自动问答方法 |
3.1 自动问答方法的挑战与方案设计 |
3.1.1 背景与相关挑战 |
3.1.2 改进方案设计 |
3.2 基于IE-SQL改进的自动问答模型 |
3.2.1 IE-SQL自动问答模型 |
3.2.2 模型特征表达改进 |
3.2.3 动态语义桥梁 |
3.2.4 标签设计与查询语句构建 |
3.3 多级决策的自动问答方法 |
3.3.1 整体技术方案 |
3.3.2 问题快速响应模块 |
3.3.3 神经网络决策模块 |
3.4 实验与结果分析 |
3.4.1 数据集与评价指标 |
3.4.2 改进的IE-SQL模型实验与分析 |
3.4.3 多级决策自动问答方法实验与分析 |
3.5 本章小结 |
第四章 公司产业信息知识图谱的构建 |
4.1 结构化数据采集 |
4.1.2 结构化数据特征分析 |
4.1.3 结构化数据采集 |
4.2 非结构化数据采集 |
4.2.1 非结构化数据特征分析 |
4.2.2 非结构化数据采集 |
4.3 知识图谱数据融合 |
4.3.1 实体对齐 |
4.3.2 属性规范化 |
4.4 知识图谱数据库建立 |
4.4.1 模式层设计 |
4.4.2 数据层设计 |
4.4.3 数据导入 |
4.5 知识图谱规模分析 |
4.6 本章小结 |
第五章 自动问答系统的设计与实现 |
5.1 需求分析 |
5.1.1 系统业务需求 |
5.1.2 系统功能需求 |
5.1.3 系统性能需求 |
5.2 系统设计 |
5.2.1 总体架构设计 |
5.2.2 系统技术架构设计 |
5.2.3 系统流程设计 |
5.3 系统实现 |
5.3.1 核心能力层实现 |
5.3.2 业务逻辑层实现 |
5.3.3 用户交互层实现 |
5.4 本章小结 |
第六章 系统测试与分析 |
6.1 系统性能测试与评估 |
6.1.1 自动问答功能测试 |
6.1.2 系统并发性能测试与分析 |
6.2 系统可拓展性分析 |
6.3 系统可用性分析 |
6.4 本章总结 |
第七章 总结与展望 |
7.1 论文工作总结 |
7.1.1 论文主要工作 |
7.1.2 论文创新点 |
7.2 未来工作展望 |
参考文献 |
附录1 知识图谱数据层设计 |
致谢 |
(5)面向用户知识需求的微信公众平台知识资源聚合及服务研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 选题背景 |
1.1.1 微信公众平台成为用户获取知识的重要途径 |
1.1.2 微信公众平台知识资源海量庞杂且质量参差不齐 |
1.1.3 用户日趋追求精准和智能化的知识服务 |
1.2 研究意义 |
1.2.1 理论意义 |
1.2.2 实践意义 |
1.3 国内外研究现状 |
1.3.1 网络知识资源聚合的国内外研究现状 |
1.3.1.1 网络知识资源聚合的国内研究现状 |
1.3.1.2 网络知识资源聚合的国外研究现状 |
1.3.2 微信公众平台知识组织与服务的国内外研究现状 |
1.3.2.1 微信公众平台知识组织与服务的国内研究现状 |
1.3.2.2 微信公众平台知识组织与服务的国外研究现状 |
1.3.3 研究评述 |
1.4 研究方法及技术路线 |
1.4.1 主要研究方法 |
1.4.2 研究技术路线及思路 |
1.5 研究主要内容 |
1.6 研究的创新点 |
第2章 相关概念及理论基础 |
2.1 微信公众平台 |
2.1.1 微信公众平台概念 |
2.1.2 微信公众号的类型 |
2.1.3 微信公众平台知识资源 |
2.2 知识聚合理论与方法 |
2.2.1 知识聚合概念 |
2.2.2 常用的知识聚合方法 |
2.3 文本挖掘与分析 |
2.3.1 文本挖掘概述 |
2.3.2 文本挖掘流程 |
2.4 知识服务 |
2.4.1 知识服务概述 |
2.4.2 常见的知识服务模式 |
2.4.2.1 知识检索服务 |
2.4.2.2 知识导航服务 |
2.4.2.3 知识推荐服务 |
2.4.2.4 知识集成服务 |
2.5 本章小结 |
第3章 面向用户知识需求的微信公众平台知识聚合服务体系框架 |
3.1 微信公众平台知识聚合服务面向用户知识需求的必要性 |
3.2 微信公众平台知识聚合及服务概述 |
3.2.1 微信公众平台知识聚合概念 |
3.2.2 微信公众平台知识聚合服务要素分析 |
3.2.3 微信公众平台知识聚合服务目标与原则 |
3.2.3.1 微信公众平台知识聚合服务目标 |
3.2.3.2 微信公众平台知识聚合服务原则 |
3.3 基于知识聚合的微信公众平台知识服务动因分析 |
3.4 面向用户知识需求的微信公众平台知识聚合服务体系框架 |
3.4.1 面向用户知识需求的微信公众平台知识聚合服务过程 |
3.4.2 面向用户知识需求的微信公众平台知识聚合服务体系框架构建 |
3.5 本章小结 |
第4章 微信公众平台用户画像构建及需求分析 |
4.1 微信公众平台用户画像概述 |
4.1.1 微信公众平台用户画像内涵 |
4.1.2 微信公众平台用户画像构建原则 |
4.2 微信公众平台用户画像构建 |
4.2.1 VALS2模型概述 |
4.2.2 基于VALS2的用户标签体系设计 |
4.2.3 用户画像标签权重设计 |
4.2.4 实证研究—以“学术类微信公众号用户”为例 |
4.2.4.1 样本特征统计分析 |
4.2.4.2 因子分析及分类标签抽取 |
4.2.4.3 用户画像聚类分析及可视化 |
4.3 基于用户画像的微信公众平台用户分类与知识需求分析 |
4.3.1 初期引入参与型用户 |
4.3.2 成长型用户 |
4.3.3 成熟型用户 |
4.4 微信公众平台用户知识需求层次分析 |
4.4.1 微信公众平台用户知识需求形成 |
4.4.2 微信公众平台用户知识需求层次划分 |
4.5 微信公众平台用户知识需求模型 |
4.6 本章小结 |
第5章 基于标签聚类的微信公众平台知识聚合及推荐服务 |
5.1 微信公众平台文本标签聚类的内涵及作用 |
5.1.1 微信公众平台文本标签聚类内涵 |
5.1.2 微信公众平台文本标签聚类作用 |
5.2 基于标签聚类的微信公众平台知识聚合方法 |
5.2.1 微信公众平台文本标签抽取方法 |
5.2.1.1 基于TextRank算法的文本标签抽取方法 |
5.2.1.2 Word2vec词向量模型 |
5.2.1.3 融合Word2vec和TextRank的文本标签抽取方法 |
5.2.2 BIRCH聚类算法及优化 |
5.2.3 基于改进BIRCH算法的微信公众平台知识资源聚合过程 |
5.3 实证研究—以“认知计算”领域为例 |
5.3.1 文本知识资源标签抽取 |
5.3.2 基于标签聚类的微信公众号知识资源聚合 |
5.4 基于标签聚类的微信公众平台知识推荐服务模式 |
5.4.1 微信公众平台知识推荐服务概述 |
5.4.2 基于标签聚类的微信公众平台知识推荐服务要素分析 |
5.4.3 基于标签聚类的微信公众平台知识推荐服务模式构建 |
5.5 本章小结 |
第6章 基于摘要生成的微信公众平台知识聚合及集成服务 |
6.1 微信公众平台文本知识摘要生成的内涵及作用 |
6.1.1 微信公众平台文本知识摘要内涵 |
6.1.2 微信公众平台文本知识摘要作用 |
6.2 基于TextRank算法的文本摘要生成过程及改进思路 |
6.2.1 基于TextRank算法的文本摘要生成方法及过程 |
6.2.2 基于TextRank算法的文本摘要生成方法改进思路 |
6.3 基于改进TextRank算法的微信公众平台知识摘要生成方法 |
6.3.1 基于TextTank算法的文本摘要生成方法改进 |
6.3.1.1 句子语义相似度计算 |
6.3.1.2 句子位置特征及标题相似度特征计算 |
6.3.1.3 基于MMR算法的句子冗余处理 |
6.3.2 融合用户需求与图模型的单文本知识摘要生成方法 |
6.3.3 融合主题与图模型的单领域多文本知识摘要生成方法 |
6.3.3.1 Doc2vec段落向量模型 |
6.3.3.2 微信公众平台单领域多文本知识摘要生成流程 |
6.4 实证研究—以“认知计算”领域为例 |
6.4.1 基于单文本知识摘要生成的微信公众平台知识聚合 |
6.4.2 基于单领域多文本摘要生成的微信公众平台知识聚合 |
6.5 基于摘要生成的微信公众平台知识集成服务模式 |
6.5.1 微信公众平台知识集成服务概述 |
6.5.2 基于摘要生成的微信公众平台知识集成服务要素分析 |
6.5.3 基于摘要生成的微信公众平台知识集成服务模式构建 |
6.6 本章小结 |
第7章 微信公众平台知识资源聚合及服务能力提升策略 |
7.1 用户知识需求外化表达及挖掘 |
7.1.1 提升用户知识需求外化表达能力 |
7.1.2 深入挖掘用户多层次知识需求 |
7.1.3 培养用户知识服务评价和反馈意识 |
7.2 加大新技术应用和融合改进 |
7.2.1 引入新技术,优化和改进知识聚合方法 |
7.2.2 知识聚合服务系统搭建和开发设计 |
7.2.3 应用可视化技术加强用户服务体验 |
7.3 微信公众平台创新服务理念及加强运营管理 |
7.3.1 加强主动知识服务意识,创新知识服务理念 |
7.3.2 构建和开展多元化平台知识服务模式 |
7.3.3 加强专业知识服务人才队伍建设 |
7.4 本章小结 |
第8章 研究结论与展望 |
8.1 研究结论 |
8.2 研究局限与展望 |
参考文献 |
附录 |
附录1 微信公众平台用户知识服务需求调查问卷 |
附录2 单领域多文本知识摘要生成示例 |
作者简介及在学期间所取得的科研成果 |
致谢 |
(6)面向课程推荐的知识图谱增强推荐模型研究(论文提纲范文)
中文摘要 |
ABSTRACT |
第1章 引言 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 知识图谱研究现状 |
1.2.2 学习者模型研究现状 |
1.2.3 个性化课程推荐研究现状 |
1.3 研究意义 |
1.4 研究内容 |
1.5 创新点 |
1.6 论文章节安排 |
第2章 相关理论概述 |
2.1 知识图谱概述 |
2.1.1 课程领域知识图谱概述 |
2.1.2 课程知识图谱的构建技术 |
2.1.3 课程领域知识图谱存储技术 |
2.2 学习者模型相关理论概述 |
2.3 个性化推荐模型相关理论 |
2.3.1 多任务特征学习推荐算法概述 |
2.3.2 知识图谱嵌入增强推荐模型概述 |
2.4 本章小结 |
第3章 面向课程领域知识图谱的构建 |
3.1 领域知识图谱构建 |
3.2 课程资源大纲本体构建 |
3.2.1 课程资源数据分析 |
3.2.2 本体构建的过程 |
3.2.3 课程资源的本体实现 |
3.3 数据获取与处理 |
3.4 基于Neo4j的知识图谱存储 |
3.4.1 课程领域知识图谱的构建 |
3.4.2 基于Neo4j的图数据库存储 |
3.4.3 基于Neo4j的知识图谱可视化 |
3.5 本章小结 |
第4章 基于知识图谱的多任务特征课程推荐算法 |
4.1 算法整体设计 |
4.2 多任务特征推荐算法模块 |
4.3 知识图谱嵌入模块 |
4.4 交叉压缩单元 |
4.5 面向课程推荐的知识图谱增强推荐模型 |
4.5.1 模型整体架构 |
4.5.2 模型预训练 |
4.5.3 特征提取 |
4.5.4 评分预测 |
4.5.5 模型训练与参数学习 |
4.6 本章小结 |
第5章 实验结果与分析 |
5.0 实验环境 |
5.1 实验数据集 |
5.2 基准模型 |
5.3 实验参数准备 |
5.4 实验结果 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 论文主要工作总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读学位期间发表的论文 |
(7)面向孔子世家谱的知识问答模型研究与应用(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.3 主要研究内容 |
1.4 论文的组织结构 |
第2章 相关概念及理论基础 |
2.1 本体 |
2.1.1 本体的概念 |
2.1.2 本体构建方法 |
2.2 知识图谱 |
2.2.1 知识图谱的概念 |
2.2.2 知识图谱构建流程 |
2.3 知识抽取 |
2.3.1 知识抽取概述 |
2.3.2 非结构化数据的信息抽取 |
2.4 基于语义解析的知识问答 |
2.5 相关模型架构及工作原理 |
2.5.1 CRF |
2.5.2 CNN |
2.5.3 LSTM |
2.5.4 ALBERT |
2.6 本章小结 |
第3章 基于本体的孔子世家谱知识图谱 |
3.1 孔子世家谱知识图谱构建流程 |
3.2 世家谱本体 |
3.2.1 世家谱本体的构造方法 |
3.2.2 世家谱本体的构建过程 |
3.3 孔子世家谱知识抽取 |
3.3.1 原始数据分析 |
3.3.2 结构化数据抽取 |
3.3.3 基于规则的非结构化数据抽取 |
3.4 知识存储 |
3.4.1 Neo4j数据导入方式 |
3.4.2 孔子世家谱知识图谱的知识存储 |
3.5 本章小结 |
第4章 基于语义解析的世家谱知识问答模型 |
4.1 世家谱知识问答模型架构 |
4.2 融合深度学习与模板的问句语义解析模块 |
4.2.1 问题判断 |
4.2.2 实体识别 |
4.2.3 属性理解 |
4.3 实验结果与分析 |
4.3.1 实验环境配置 |
4.3.2 实验参数设置 |
4.3.3 实验数据集 |
4.3.4 实验结果评价指标 |
4.3.5 实验结果分析 |
4.4 本章小结 |
第5章 孔子世家谱问答系统的设计与实现 |
5.1 系统需求分析 |
5.1.1 功能需求 |
5.1.2 性能需求 |
5.2 系统架构设计 |
5.3 系统开发环境 |
5.4 系统主要功能实现 |
5.4.1 孔子世家谱可视化检索 |
5.4.2 孔子世家谱知识问答 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
在读期间发表的学术论文及研究成果 |
致谢 |
(8)基于社交网络热点事件库的流行度预测研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
1 引言 |
1.1 研究背景及意义 |
1.2 研究挑战 |
1.3 本文的工作 |
1.3.1 研究目标与内容 |
1.3.2 研究成果 |
1.3.3 论文的组织结构 |
2 相关研究综述 |
2.1 大数据处理与应用 |
2.1.1 大数据的特征 |
2.1.2 大数据生命周期 |
2.2 社交网络数据分析应用 |
2.2.1 数据模型 |
2.2.2 数据应用系统 |
2.3 社交网络信息传播 |
2.3.1 网络信息传播影响因素 |
2.3.2 网络用户行为 |
2.4 流行度分析 |
2.4.1 流行度演化 |
2.4.2 流行度预测 |
2.5 本章小结 |
3 面向流行度分析与预测的社交网络热点事件库模型 |
3.1 问题描述 |
3.2 数学符号 |
3.3 社交网络大数据的多维特征分析 |
3.3.1 数据类型特征 |
3.3.2 内容特征 |
3.3.3 事件要素特征 |
3.4 社交网络数据模型 |
3.4.1 主要实体与属性 |
3.4.2 热点事件库数据约束 |
3.4.3 约束检查与数据查询基础操作 |
3.5 基于社交网络热点事件库的时间序列提取方法 |
3.6 实验与讨论 |
3.6.1 数据集与实验设置 |
3.6.2 约束检查实验 |
3.6.3 基于热点事件库的时间序列提取实验 |
3.7 本章小结 |
4 基于社交网络主题标签的流行度高峰期预测 |
4.1 问题描述 |
4.2 相关定义 |
4.2.1 流行度相关定义 |
4.2.2 数学符号 |
4.3 流行度演化研究 |
4.3.1 主题标签流行度特征 |
4.3.2 流行度演化规律 |
4.4 流行度高峰期预测 |
4.4.1 嵌入表示 |
4.4.2 内部注意力和相互注意力机制 |
4.4.3 高峰期预测 |
4.5 实验与讨论 |
4.5.1 预测评估 |
4.5.2 典型预测方法 |
4.5.3 比较说明 |
4.6 本章小结 |
5 基于社交网络事件库多因素耦合的流行度预测 |
5.1 问题描述 |
5.2 相关定义 |
5.2.1 事件 |
5.2.2 事件库实例的构建 |
5.2.3 数学符号 |
5.3 事件流行度预测 |
5.3.1 事件流行度因素分析 |
5.3.2 基于事件库的多因素指标获取 |
5.3.3 多因素分组嵌入 |
5.3.4 多因素耦合的流行度预测 |
5.4 实验与讨论 |
5.4.1 实验数据集选取 |
5.4.2 实验方案设计 |
5.4.3 实验结果分析 |
5.5 本章小结 |
6 流行度分析预测平台实现及应用 |
6.1 平台架构 |
6.2 平台实现 |
6.2.1 采集层 |
6.2.2 存储层 |
6.2.3 应用层 |
6.3 本章小结 |
7 总结与展望 |
7.1 总结 |
7.2 研究展望 |
参考文献 |
作者简历及在学研究成果 |
学位论文数据集 |
(9)多模态领域知识图谱构建方法及应用研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究的背景与意义 |
1.2 国内外研究现状 |
1.3 研究工作 |
1.4 论文组织结构 |
第2章 相关理论与技术方法 |
2.1 相关理论 |
2.2 技术方法 |
第3章 多模态数据的获取与处理 |
3.1 多模态数据的获取 |
3.2 文本数据的处理 |
3.3 图片数据的处理 |
3.4 视频数据的处理 |
3.5 PMD多模态数据集 |
3.6 本章小结 |
第4章 多模态党建知识图谱构建 |
4.1 构建流程 |
4.2 Schema 构建 |
4.3 多模态知识抽取 |
4.4 多模态知识融合 |
4.5 标签对齐方法验证 |
4.6 图谱验证及存储 |
4.7 本章小结 |
第5章 知识导航验证系统设计与实现 |
5.0 系统架构 |
5.1 系统开发工具及配置 |
5.2 功能模块设计 |
5.3 系统实现 |
5.4 系统功能测试 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
个人简介 |
(10)基于在线百科的社会网络抽取及语义化研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究目的与意义 |
1.2.1 研究目的 |
1.2.2 研究意义 |
1.3 研究框架与研究内容 |
1.3.1 研究框架 |
1.3.2 研究内容 |
1.4 技术路线 |
1.5 研究方法与工具 |
1.5.1 研究方法 |
1.5.2 使用的工具与技术 |
1.6 贡献与创新 |
1.7 论文组织结构 |
第2章 相关概念与理论 |
2.1 复杂社会网络理论 |
2.1.1 复杂网络的概念 |
2.1.2 社会网络的概念 |
2.1.3 典型的复杂社会网络模型 |
2.2 知识表示理论 |
2.2.1 知识表示的概念 |
2.2.2 语义网 |
2.2.3 知识图谱 |
2.3 本章小结 |
第3章 相关研究综述 |
3.1 社会网络抽取研究 |
3.1.1 传统社会网络抽取研究 |
3.1.2 基于在线百科的社会网络抽取研究 |
3.2 社会网络语义化研究 |
3.2.1 社会网络语义化的相关工作 |
3.2.2 典型的社会网络本体 |
3.3 知识图谱补全研究 |
3.3.1 知识图谱补全的任务 |
3.3.2 知识图谱关系预测的相关研究 |
3.3.3 知识图谱实体类型预测的相关研究 |
3.4 命名实体链接研究 |
3.4.1 命名实体链接的任务 |
3.4.2 命名实体链接的相关研究工作 |
3.5 本章小结 |
第4章 在线百科中的社会网络抽取 |
4.1 社会网络抽取的整体框架 |
4.2 初始社会网络生成 |
4.3 关系权重计算 |
4.3.1 人物相关性特征 |
4.3.2 人物相关度学习 |
4.4 人物时空分析 |
4.4.1 人物生存时空估计 |
4.4.2 时空耦合网络的构建 |
4.5 百科社会网络的结构特征分析 |
4.6 百科人物网络的可视化分析 |
4.7 本章小结 |
第5章 社会网络语义建模与语义表示 |
5.1 社会网络语义建模 |
5.1.1 MSTSN本体的整体架构 |
5.1.2 人物时空信息的语义建模 |
5.1.3 关系类型和人物类型的语义建模 |
5.2 社会网络的语义表示 |
5.2.1 人物基本信息的语义表示 |
5.2.2 人物时空信息的语义表示 |
5.2.3 人物关系信息的语义表示 |
5.3 本章小结 |
第6章 基于百科内部信息的人物知识图谱补全 |
6.1 人物关系类型的预测 |
6.1.1 关系预测模型设计 |
6.1.2 模型评测 |
6.1.3 基于Conv F模型的人物关系类型补全 |
6.2 人物类型的预测 |
6.3 本章小结 |
第7章 基于百科外部文本的人物知识图谱补全 |
7.1 命名实体链接的整体框架 |
7.2 指称识别 |
7.3 候选实体集合生成 |
7.4 候选实体消岐 |
7.4.1 消歧特征 |
7.4.2 排序学习 |
7.4.3 消歧结果优化 |
7.5 命名实体链接方法评测 |
7.5.1 评测语料 |
7.5.2 文本相似度特征筛选实验 |
7.5.3 多特征消歧实验 |
7.5.4 对比实验 |
7.6 基于命名实体链接的人物关系补全 |
7.6.1 设计思路 |
7.6.2 方法评测 |
7.7 本章小结 |
第8章 人物知识图谱的语义查询与可视化 |
8.1 基于关系的社会网络语义查询 |
8.1.1 查询中心人物的相关人物 |
8.1.2 查询限定类型的相关人物 |
8.2 基于作品的社会网络语义查询 |
8.2.1 生成与特定作品相关的社会网络 |
8.2.2 生成与特定作者相关的社会网络 |
8.3 基于时间的社会网络语义查询 |
8.3.1 生活于特定历史时期的人物查询 |
8.3.2 生成特定历史时期的人物关系网络 |
8.3.3 生成特定朝代的人物关系网络 |
8.4 基于空间的社会网络语义查询 |
8.4.1 与地理特征点相关的人物查询 |
8.4.2 同乡关系网络的生成 |
8.4.3 查询特定历史时期的热点地理区域 |
8.5 本章小结 |
第9章 总结与展望 |
9.1 本文总结 |
9.2 研究局限与展望 |
参考文献 |
中文参考文献 |
英文参考文献 |
附录 人物知识图谱的RDF表示(示例) |
攻读博士学位期间科研成果 |
致谢 |
四、Extracting Local Schema from Semistructured Data Based on Graph-Oriented Semantic Model(论文参考文献)
- [1]基于建筑信息模型的电气照明自动设计研究[D]. 杨娜. 华东交通大学, 2021(01)
- [2]面向知识图谱构建的知识融合问题研究[D]. 翟娇娇. 齐鲁工业大学, 2021(10)
- [3]面向文物领域的知识图谱构建技术研究[D]. 张敏. 西北大学, 2021(10)
- [4]面向金融领域的自动问答系统的研究与实现[D]. 剡恺. 北京邮电大学, 2021(01)
- [5]面向用户知识需求的微信公众平台知识资源聚合及服务研究[D]. 程子轩. 吉林大学, 2021(01)
- [6]面向课程推荐的知识图谱增强推荐模型研究[D]. 吴昊. 内蒙古师范大学, 2021(08)
- [7]面向孔子世家谱的知识问答模型研究与应用[D]. 张政平. 曲阜师范大学, 2021(02)
- [8]基于社交网络热点事件库的流行度预测研究[D]. 于海. 北京科技大学, 2021
- [9]多模态领域知识图谱构建方法及应用研究[D]. 刘昱然. 北方民族大学, 2021(08)
- [10]基于在线百科的社会网络抽取及语义化研究[D]. 林泽斐. 南京大学, 2020(09)