老师有电路基础这么一门课,要我基于电路基础第六版这本书构建知识图谱。第一步获取数据就遇到了困难,把整本书手打一遍不太现实,从维基百科爬下来的内容又比较乱还要花费大量人工来处理,而且也没有关于这个领域的词典可以拿来用。所以只能用大量人工代替机器了吗?


利益相关: 支持知识图谱抽取的开源项目!

观点: WHY NOT

不完全赞成 @邵浩博士 的答案; 我们认为极小量的人工+大规模的机器学习, 有机会完成构建领域知识图谱这项任务.

针对题主的问题, 给一个利用我们SmoothNLP项目可以做到的效果, 以下是基于百度百科-("百度")该词条抽取出来的内容:

(由于内容太多, 用2000X2000像素的图, 欢迎放大); 当然, 现有几乎不存在一款工具可以完美的抽取出来, 但是用机器初筛+领域专家调整的思路上, 就是NLP可以大大降低知识图谱构建的成本

这里在贴两张关于百度与李彦宏直接相关的1度空间的展示:

talk is cheap, show me your code; 这里直接贴一段使用SmoothNLP项目, 构建知识图谱的demo代码.

from smoothnlp import kg
rels = kg.extract(text = ["SmoothNLP在V0.3版本中正式推出知识抽取功能",
"SmoothNLP专注于可解释的NLP技术",
"SmoothNLP支持Python与Java",
"SmoothNLP将帮助工业界与学术界更加高效的构建知识图谱",
"SmoothNLP是上海文磨网路科技公司的开源项目"]) ## 调用SmoothNLP解析
g = kg.rel2graph(rels) ## 依据文本解析结果, 生成networkx有向图
fig = kg.graph2fig(g,x=1000,y=1000) ## 生成 matplotlib.figure.Figure 图片

如果你对我们的项目感兴趣, 想自己构建领域知识图谱, 欢迎关注:

https://github.com/smoothnlp/SmoothNLP?

github.com

对于知识图谱的商业化, 我们的观点是: 目前来看, 机器还没有独立的能力构建知识图谱, 但依靠NLP结构化的技术, 大规模减低初步建模的成本, 结合领域专家经验, 会是一条可能且有效的途径.

如果你对知识图谱感兴趣想自己尝试构建, 或者您从事的业务有构建知识图谱的需求, 欢迎联系contact@http://smoothnlp.com

再跟一个之前的回答:

知识图谱是否是NLP的未来??

www.zhihu.com图标发布于 2020-03-20继续浏览内容知乎发现更大的世界打开Chrome继续邵浩博士邵浩博士?

vivo 高级技术总监

所以只能用大量人工代替机器了吗?

是的,只能用大量人工代替机器。


所以只能用大量人工代替机器了吗?

是的,只能用大量人工代替机器。


知识图谱构建一看有没有工具,二看有没有方法。

知识获取和梳理方面,纸质书电子化处理一下很方便的了,这两天刚好了解了一下书籍电子化的市场,哈哈哈。然后书籍作为知识来源,就很好处理啦,图谱前几层可以参考书籍目录、标题。

以极天信息为例,打造了「软体+方法+模型」三位一体知识图谱服务体系。因为同学这个疑问场景主要是目的就是为了学习或者说实操知识图谱构建,暂未涉及知识图谱解析应用。

而在实战中,知识图谱构建的目的就是为了应用,所以一是知识图谱构建高效吗?二是构建之后便于应用吗?不然对于实际中那么多复杂场景,花了好多时间精力去构建,做出来应用效果却不咋地,这就不行。

极天信息「三位一体」知识图谱服务体系主张的就是「开箱即用」,让客户不需要关心模型和演算法细节,直接使用智能服务。其准确性也是可验证和体验。真正实现AI赋能行业发展。

发布于 2020-03-05继续浏览内容知乎发现更大的世界打开Chrome继续禾雀花开禾雀花开本体 知识图谱

首先,需要清楚,建知识图谱的目标是什么?面向什么应用场景,典型的场景包括:

1、查找类,例如问答、搜索、推荐等,也包括对信息抽取的支持;

2、分析类,例如:自动分类、分析视图(类结构分析视图、类多维分析视图、实体/实例关系分析视图)等

3、知识自动化类, 用于推理决策等

4、知识管理类,自动标签、知识目录等

不同的应用场景,对图谱节点范围、关系定义深度是不一样的。节点和关系部分存在数据源中(你提到那本书,百科词条,领域词典),当然,也有一些存在人的脑中!

其次,你这种针对一本书的知识图谱,可能需要2个工具,一个帮助你提取辞汇的工具;一个是知识图谱的编辑工具。


首先,需要清楚,建知识图谱的目标是什么?面向什么应用场景,典型的场景包括:

1、查找类,例如问答、搜索、推荐等,也包括对信息抽取的支持;

2、分析类,例如:自动分类、分析视图(类结构分析视图、类多维分析视图、实体/实例关系分析视图)等

3、知识自动化类, 用于推理决策等

4、知识管理类,自动标签、知识目录等

不同的应用场景,对图谱节点范围、关系定义深度是不一样的。节点和关系部分存在数据源中(你提到那本书,百科词条,领域词典),当然,也有一些存在人的脑中!

其次,你这种针对一本书的知识图谱,可能需要2个工具,一个帮助你提取辞汇的工具;一个是知识图谱的编辑工具。


将一本书做成「知识图谱」?本身命题就不太现实。如果真的能够将一本书做成知识图谱,那可真的值钱了,用起来会非常方便。不过,如果非要将一本书做成知识图谱,最简单的办法是:将章节标题作为知识的概念,其中的内容作为知识描述文本,根据章节关系,构架知识图谱。但如何将一本书变成文本却是个难题,即便是OCR,工作量也很大。


推荐阅读:
相关文章