分类筛选
分类筛选:

关于深度论文范文资料 与基于深度学习和图数据库构建中文商业知识图谱有关论文参考文献

版权:原创标记原创 主题:深度范文 科目:本科论文 2024-01-23

《基于深度学习和图数据库构建中文商业知识图谱》:这篇深度论文范文为免费优秀学术论文范文,可用于相关写作参考。

摘 要: 将知识图谱应用到商业领域是大数据时代企业的迫切需求.文章通过引入深度学习算法中的深度置信网络,自动提取领域信息中蕴含的知识单元及单元之间的关系,以此解决知识单元提取这一难点.同时,采用Neo4j图形数据库来存储知识图谱中包含的知识单元及其关系.当需要对知识图谱中包含的知识单元进行查询时,可以采用该图形数据库的Cypher查询语言进行查询.文章的研究方法可为商业领域快速构建知识图谱提供借鉴.

关键词:知识图谱;深度学习;图数据库;深度置信网络

中图分类号: G203 文献标识码: A DOI:10.11968/tsyqb.1003-6938.2016017

Study on the Construction of Chinese Knowledge Graph Based on Deep Learning and Graph Database

Abstract Application of Knowledge graph to business areas is the urgent need of the enterprises in big data era. In order to solve the knowledge element extraction difficulties, the author tries to automatically extract the knowledge units and its relationships contained in the given field by introducing the deep belief network learning algorithm. At the same time, the knowledge unit and its relationship in the knowledge graph are stored by using the Neo4j graphics database. When you need to query the knowledge unit in the knowledge graph, the Cypher query language of the graph database can be used. The research method of this paper can provide reference for the rapid construction of knowledge graph in the commercial field.

Key words knowledge graph; deep learning; graph database; deep belief networks

1 引言

近些年,随着大数据时代的到来,传统的用于学科研究的科学知识图谱[1]也开始在其他领域有所应用.Google早在2012年就发布了其知识图谱产品—Google Knowledge Graph[2].2013年2月,百度也推出了自己的知识图谱.“打开手机百度,用户搜索‘王菲’的时候不仅可以查到她的歌曲,还能知道她的前夫是李亚鹏,李亚鹏的前女友是周迅,周迅和汤唯恰好是同乡”,这就是基于大数据技术的知识图谱,百度为用户编织了三维知识网络,满足其对日益增长的知识获取需求.近年来,还涌现了一些较有影响的知识图谱,包括YAGO[3] 、DBpedia[4] 、NELL[5] 、Freebase[6] 等,这些知识图谱包含数以百万计的节点和数十亿的边.另外,在社交网络领域,Facebook和Twitter则推出了社交图谱和兴趣图谱.知识图谱在商业领域的应用,扩展了原先科学知识图谱的内涵,也使得它的应用场景得到了延伸.

商业领域中的信息不同于学科领域的信息,以往对学科领域的知识图谱研究多基于文献来进行研究,关键词、摘 要等信息可以作为绘制知识图谱的重要信息来源.而商业领域中的信息相比学科领域要更加杂乱无序,因此,对这些信息进行语义分析,提取出能用于绘制知识图谱的知识单元并找出知识单元之间的联系就显得极为重要.

提取用于绘制知识图谱的知识单元可以映射为对大量信息的命名实体进行识别,而寻找知识单元之间的关系也可以映射为对命名实体关系的抽取,两者都可以通过机器学习的方法进行.以往在对命名实体的识别和实体关系抽取的时候,人们通常会选择SVM(支持向量机)或CRF(条件随机场)之类的浅层学习方法,系统还需要融入大量适用于特定学习任务的人工特征,从而会导致部分特征的丢失.

深度学习作为一种模拟人类认知行为的算法,它会像人类的大脑一样按照层次来对概念进行组织.它会学习最简单的概念,然后根据这些简单的概念组成更加抽象的概念,逐层深入,通过对低层特征的组合,形成越来越抽象的深层表示,从而能达到更准确的认知.将深度学习用到对知识单元和单元之间的关系的提取中,可以为知识图谱的绘制提供良好的基础;同时,图数据库是使用节点、边、属性等图数据结构来表示和存储信息,比较适合知识图谱的存储.

2 知识图谱构建的相关研究概述

2.1 商业知识图谱的构建方法

目前商业领域知识图谱构建方法根据知识图谱数据来源划分,可以分为以下几种:

(1)基于网络百科资源的知识图谱构建方法.以维基百科为例,可以通过它的文章页面的关系来采集各类实体、实体的同义词、同音异义词以及实体的概念及其上下文关系和实体对应的类别.P 知识抽取(Attribute-value Pairs Mining)是一种知识图谱信息提取的重要方法,采用这种方法可以提取出百科类资源中包含的属性-值对信息[7].

(2)基于结构化数据的知识图谱构建方法.RDF是一种资源描述框架,可以形式化地表示结构信息,它一般用来描述网络资源,例如某个Web页面的内容、作者等.采用RDF可以对知识进行结构化组织,进而采用图形化的方式展示出来[8].

深度论文参考资料:

结论:基于深度学习和图数据库构建中文商业知识图谱为关于对不知道怎么写深度论文范文课题研究的大学硕士、相关本科毕业论文深度论文开题报告范文和文献综述及职称论文的作为参考文献资料下载。

和你相关的