小言_互联网的博客

【知识图谱】(task1)知识图谱概论

884人阅读  评论(0)

note

  • 知识图谱技术要素

一、语言与知识

  • AI主要分为连接主义和符号主义两大学派,知识图谱可以归为后者。
  • 语言是知识的最主要表示载体,即语言与知识是实现认知只能最重要的两个方面。而知识图谱是一种结构化的知识表示方法,相比于文本更易于被机器查询和处理,在搜索引擎、智能问答、大数据分析中被广泛应用。
  • 语言和知识的embedding化表示,是当前NN的发展趋势。

二、知识图谱的起源

  • 知识图谱起源于world wide web万维网,万维网是以链接为中心的信息系统,万维网的创始人Sir Tim Berners-Lee也在16年获得图灵奖。
  • 溯源:各种语义网项目
    • 谷歌知识图谱:Things, Not Strings (2012)
    • Freebase项目
    • WikiData项目
    • Schema.org项目
    • DBPEDIA项目
    • 中文领域开放知识图谱:OpenKG.CN
  • 知识图谱的两个核心基因:AI+互联网

三、知识图谱的价值

  • 语义搜索:web的理想是链接万物,搜索的理想是万物搜索
  • 知识问答
  • 辅助推荐系统:丰富user和item的embedding表示,挖掘更深层次的用户兴趣;增强推荐的可解释性。

  • 辅助大数据分析:
    • 语义集成:Dynamic Ontology
    • 语义搜索:围绕Ontology来搜索发现结果和关系;
    • 知识管理:所有的知识是有权限控制的 ;
    • 协作:知识可以在不同的用户之间共享,协同工作;
    • 算法引擎:对于通用领域问题,提供了通用算法来发现趋势
  • 辅助语言理解、视觉理解、设备互联等。
  • 领域应用栗子:华为自动驾驶知识图谱:


从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。

早在 2010 年微软就开始构建知识图谱,包括 Satori 和 Probase;2012 年,Google 正式发布了 Google Knowledge Graph,现在规模已超 700 亿。目前微软和 Google 拥有全世界最大的通用知识图谱,Facebook 拥有全世界最大的社交知识图谱,而阿里巴巴和亚马逊则分别构建了商品知识图谱。

图 1 业内布局

图 2 业内应用

知识图谱是人工智能很重要的一个分支, 人工智能的目标为了让机器具备像人一样理性思考及做事的能力 ->
在符号主义的引领下,知识工程(核心内容即建设专家系统)取得了突破性的进展 ->
在整个知识工程的分支下,知识表示是一个非常重要的任务 ->
而知识图谱又恰恰是知识表示的重要一环

四、知识图谱的技术内涵

4.1 知识图谱是交叉领域

(1)知识图谱是交叉领域

(2)知识图谱技术要素

4.2 技术内涵

(1)基于图的表示学习

(2)图数据存储和查询

图数据库充分利用图的结构建立微索引,这种微索引比起关系数据库的全局索引在处理图遍历查询时更加廉价,其查询复杂度与数据集整体大小无关,仅正比于相邻子图的大小。因此在很多涉及复杂关联和多跳的场景中得到广泛应用。

(3)知识图谱推理

  • 基于符号逻辑的推理方法: OWL Reasoners、Datalog、Rete等
  • 基于图结构或表示学习的推理方法: PRA、AMIE、TransE、Analogy、DeepPath、NeuralLP等

(4)知识图谱问答—KBQA

4.3 建立知识图谱的系统工程观:

时间安排

任务 任务信息 截止时间
- 12月12日正式开始
Task01: CP1知识图谱概论(2天) 12月12-13日 周二
Task02: CP2知识图谱表示 + CP3知识图谱的存储和查询(上)(6天) 12月14-19日 周六
Task03: CP3知识图谱的存储和查询(下)(3天) 12月20-22日 周二
Task04: CP4知识图谱的抽取和构建(3天) 12月23-25日 周五
Task05: CP5知识图谱推理(4天) 12月26-29日 周二

Reference

[1] 推荐系统前沿与实践. 李东胜等
[2] 自然语言处理cs224n-2021–Lecture15: 知识图谱
[3] 东南大学《知识图谱》研究生课程课件
[4] 2022年中国知识图谱行业研究报告
[5] 浙江大学慕课:知识图谱导论.陈华钧老师
[6] https://conceptnet.io/
[7] KG paper:https://github.com/km1994/nlp_paper_study_kg
[8] 北大gStore - a graph based RDF triple store
[9] Natural Language Processing Demystified
[10] 玩转Neo4j知识图谱和图数据挖掘


转载:https://blog.csdn.net/qq_35812205/article/details/128212704
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场