知识图谱.构建.杂论

it2026-03-17  6

目标

1.什么是知识图谱

2.如何构建知识图谱

3.特定领域的知识图谱

01

什么是知识图谱

          

简介:

知识图谱(Mapping Knowledge Domain)也被称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

具体来说,知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结

合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。迄今为止,其实际应用在发达国家已经逐步拓展并取得了较好的效果,但它在我国仍属研究的起步阶段。

 

          

               特点×提升

1.用户搜索次数越多,范围越广,Google 就能获取越多信息和内容。

2.为用户找出更加准确的信息,作出更全面的总结并提供更有深度相关的信息。

3.把与关键词相关的知识体系系统化地展示给用户。

搜索效果:

1.找到最想要的信息。

2.提供最全面的摘要。

3.让搜索更有深度和广度。

以上内容来源百科

          

知识图谱的概念是由谷歌公司在2012年提出,通过智能化搜索引擎,知识图谱技术创造出一种全新的信息检索模式,可以更好的查询复杂的关联信息,从多方面理解个人意图,提高搜索的质量。

简单来说:

针对某个问题,通过它们相互之间的联系,通过搜索引擎得到相应的答案与更多的信息。

02

如何构建知识图谱

          

构建图谱的三个步骤:

信息抽取

知识融合

应用

          

            1.信息抽取

           2.知识融合

         3.三组元

在构建的第一阶段,我们从海量纯文本中识别文本中的实体以及实体间的关系,过滤出对我们有用的事实知识。识别过程涉及到很多自然语言处理技术的应用,例如分词、命名实体识别、词形还原等等。在这一步中,例如对于句子。

EX.

世界四大博物馆之一卢浮宫原是法国的王宫,位于巴黎市中心

通过信息提取就被简化为类似以下的简单陈述句的形式:

“卢浮宫 位于 巴黎“

知识融合×三组元

在构建的第二阶段,大多数知识图谱将这些简单陈述句以三元组的形式保存到知识库中。三元组这个术语来自于语义网的知识表示框架中的RDF概念(资源描述框架),是知识图谱中知识表示的基本单位,简称SPO,用来表示实体与实体之间的关系,或者实体的某个属性的属性值是什么。

上面那个陈述句会被转化拆解成下面三元组的形式,

主题:卢浮宫

谓词:位于

对象:巴黎

本体

这里我们再简单说一下知识图谱中本体的概念。本体有点类似于我们学生物时的界门纲目科属种的分类概念,是知识图谱中的概念层,或者说模式层。

  本体可以用来规定我们的知识图谱中包含哪些领域的知识,知识的类别体系:一共有哪些类别,每种类别下面可以有哪些属性。另外,还能规定例如类别的上下 位关系(父类和子类),属性的约束(例如一个人的出生日期的属性只能有1个)等等。本体是关于数据的描述和定义(元数据)。

在语义网知识体系中,使用了RDFs和OWL语言来描述本体知识。

本体知识界定了每个实体应该存在于哪种类别,我们获取到的三元组会被本体匹配算法分类在不同的本体类型下。例如,如果本体是“机场”,那么,一些属于这一类的实体像“大连周子水机场 ”,“ 戴高乐机场 ”,“广州白云机场 ”就会被包括进来。该过程也会涉及到自然语言处理技术的应用

回到刚才那个例子,在知识库中,我们将以‘卢浮宫——位于——巴黎’的形式保存上述关系。这是知识库中的单个三元组。在实践中,知识库包括数百万这样的三元组,我们也称之为事实。这些事实都会被归入知识库中对应的本体

这个过程我们还需要解决一些实体消歧以及共指消解问题。

实体消歧

给定一段文本

“在旧金山的2019春季发布会上,苹果推出新耳机产品Airpods2”

文本中的提及“苹果”可能指向的目标实体包括 {苹果(水果),苹果公司,苹果(电影),苹果(银行), …},系统需要根据“苹果”的上下文词语识别出该段文本中“苹果”指的是苹果公司,而不是苹果(水果)或者苹果(电影)。

共指消解

例如,在一遍文章的开头可能提及到“哈尔滨工业大学”,后面则称为“哈工大”、“工大”等,可能还会提到“这所大学”、“她”这些指代词等,这里所有的词语指向的都是哈工大这同一个实体,我们在提取知识时必须可以辨别出来。

三元组转换为知识图谱

现在,让我们看看在构建的最后阶段,知识库中的三元组如何转换为知识图谱。知识图谱是一个实体互联的大型网络。实体间的连接正是基于知识库中的三元组创建的。

知识图谱的一个主要功能就是识别实体之间缺失的链接,它属于推理任务里知识补全或事实补全的一部分。为了进一步阐明这一点,让我们考虑下边我们从知识库中收集的这些样本关系。

  

03

特定领域的知识图谱

         

每个不同的领域都可以构建不同的知识图谱从而帮助我们更好的查找我们想要的信息。

人工智能知识图谱

         

人工智能的历史

内和外延

未来学

对社会经济的影响

技术体系

应用领域

<END......> 本文长度为2181,建议阅读 6 分钟.....

编辑:szy

点我查看原文

知识图谱概论.Data Fabric

知识图谱概论(二):概念具象化描述

扫描二维码                                     

点击关注我们吖                  

                 

文章|资源|杂论|科普                 

最新回复(0)