如题!感谢!


来一图流。用百度的信息抽取数据集做个例子。


贴个图吧,图象,文本,视频,语音,以及社交类网路数据。。。这类属于典型的非结构化数据


比如一段话就是非结构化的数据,kaggle或天池的比赛里面,提供的各种csv文件数据,有对应的各个栏位,这些就属于结构化数据。

这些问题其实谷歌或百度一下,很容易就能得到答案。建议以后多自己尝试去寻找答案~


自然语言包含的文字、语音、图像和视频,都可称为非结构化数据,这些数据要让机器读懂理解,并形成一个结构化的知识库体系,具有商业化价值,才是完整的智能系统。


结构化数据一般是存储在资料库或其他地方中的结构完好的数据,数值型数据,标签啊等等都是结构化数据,可以直接拿来各种用,非结构化数据一般是指文本数据等,这类数据一般需要从中做信息抽取啊,或者是用端到端的深度学习来用它。


非结构化数据:

NLP或机器学习中什么是结构化数据和非结构化数据?

~~~~~

半结构化数据:

领域:NLP或机器学习

问题:什么是结构化数据和非结构化数据?

~~~~

结构化数据:

领域:[nlp,机器学习]

问题类型:什么型

子领域:数据类型

问题关注:[结构化,非结构化]


推荐阅读:
相关文章