全国政府机关及事业单位门户网站、政府集采网站、行业招投标平台及其他媒体,每天都要发布数万条招投标信息和中标信息。这些信息涉及到方方面面,里面也隐藏著无数商机。对于企业而言,及时获取这些数以万计的信息,并找到与自己相关的部分,做相应的处理,是极其有价值的工作,难度也比较大。一般而言,这些信息中包括了招标公司、招标类型、招标产品、联系电话、采购数量、投标结果、项目名称、截止时间、资质要求等要素点。这些信息都以非结构化文本的形式分散在各个网站,对它们进行采集然后抽取里面那些要素点,再进行分析挖掘,是重要的市场工作。

一、招投标信息蕴含哪些商机

对很多企业而言,从公开的招投标信息和中标信息中挖掘潜在的商业机会,能起到事半功倍的效果。它对企业一般有著下述几个方面的重要价值:

(1) 商机发现:对寻找投标机会的乙方企业,及时获取哪些甲方客户正发布的需求信息,有著重大的价值。对于那些标准化产品的采购,例如计算机和服装等,甲方客户都会更多的关注品牌和价格,因此有著较大价格优势的乙方如果能快速捕获这些需求信息,然后开展投标,有著直接效益;对于那些非标准化的服务,例如软体项目或是建筑施工,尽管招标信息的发布通常意味著甲方中意的供应商已经有了初步的候选,但这些信息通常意味著甲方会有一系列后续的预算和需求,例如建筑施工完毕要装修,软体实施完毕可能会有第二期,等等。因此,可以及时挖掘汇总各地的商机,并与业务队伍制定的目标相比对,指导工作。

(2) 渠道挖掘:对寻找渠道代理商的乙方企业,及时知晓各个甲方客户在相关产品服务上的供应商,有著重要意义。这是因为在非标准的定制服务上,企业客户一般较少更换自己的供应商,因此很多乙方企业为了将产品和服务提供给这些甲方客户,需要通过他们现有的供应商作为渠道。统计挖掘一个大的甲方客户在过去数年内的中标信息,可以知晓他的供应商范围,并在无法直接触达甲方的情况下,与现有供应商合作,一起去服务客户。

(3) 供应商挖掘:对于寻找供应商的甲方客户而言,出于选择更物美价廉服务的考虑,往往会寻找一些新的供应商,邀请参与投标。因此,对其它甲方客户的中标信息进行统计分析,知晓他们选择最多的供应商,和相关的中标产品服务价格,对甲方控制预算和选择最优供应商,有著重要的参考价值。

因此,及时的从互联网上获取这些公开发布的信息,存档并进行分析挖掘,能给企业客户带来直接的商业机会,有著重要意义。

二、如何挖掘商机

如上所述,招投标公告和中标公告都分散在各个网站中,而且相当一部分是公布数天之后就撤下。如何通过计算机系统自动的挖掘商机,一般可以分为如下几步:

(1) 信息采集:使用爬虫系统,从数万个网站中抓取里面存在的招投标信息网页,然后从网页内容中提取出相关的招投标文件内容。出于获取信息的及时性要求,需要通过多台伺服器以分钟为单位来采集这些信息,并将它们分散式的存储到本地。这里的一个难点是,采集招投标信息的目标网站列表需要持续自动更新。

(2) 知识抽取:对于下载得到的招投标文件内容,它们都是长篇幅的文本。需要从这些文本中抽取大量的知识点,例如项目名称、招标产品、招标数量、招标地点、截止时间等数十项,将每一篇招投标文档完成针对业务的语义结构化,支持后续的统计挖掘。

(3) 统计挖掘:基于抽取的知识点,我们能够对海量的招投标信息进行深层的分析统计,例如统计每一个甲方单位中标最多的供应商,统计某一个招标产品在某个地方的最新需求,统计某一类招标服务在过去12个月内的价格区间和供应商名录,等等。

在完成这三个步骤的工作之后,计算机可以帮助人们及时的洞察商机,并为下一步的业务决策提供数据支撑,做到各种关键信息清晰明了,一目了然。

三、TML KnowledgeCloud如何帮助商机挖掘

TML KnowledgeCloud是网感至察推出的认知计算云服务,旨在帮助各行各业的客户建立知识图谱,对文本内容进行深层的分析与挖掘。由于爬虫系统已经是一项比较成熟的技术,且有著大量的开源软体作为候选,因此TML KnowledgeCloud将重点集中两个方面来帮助开展商机挖掘:知识抽取和统计挖掘。

对招投标信息进行知识抽取,既要保证精度在95%以上,也要保证足够的召回率。TML KnowledgeCloud可以通过下面的几个环节,来抽取出相应的知识点:

(1)使用我们自主研发的TML语言编程,制定招投标信息领域中需要抽取的知识要素,例如项目名称,招标类型,招标公司,招标产品,品牌列表,采购数量,招标预算,招标编号等;

(2)将写好的TML程序进行编译,并与大量的招投标信息进行匹配,输出每一篇招投标信息所包含的知识点;同时为每一个目标知识要素获得足够的基础语料;

(3)使用深度学习方法,基于上述训练语料和TML代码,训练出自动抽取的模型,并自动扩充现有的TML代码以解决定义不全不准的地方,然后处理新的招投标文件。

对知识抽取结果进行统计挖掘,则需要建立招投标信息领域的各类主数据,并灵活的生成各种数据报表,环节如下:

(1) 将抽取了上述要素的招投标信息导入SmartData子系统,每一条相关的要素都被补充到相应的主资料库中。例如同一个供应商在不同地方去参与投标的子公司,被主数据中的主供应商关联起来,统一进行分析。

(2) 从主数据的各种不同维度出发来自定义报表生成的规则,例如选择相关的地点、招标产品和截至时间,来列出相应的所有信息。用户可以自定义多个这样的报表。

(3) 基于得到的信息列表和客户的报表要求,进行相应的可视化展现和信息推送。

四、关于我们

南京网感至察信息科技有限公司,基于近20年的技术和演算法积累,研发推出了具备自主知识产权的TML认知计算平台,并以此为基础推出了TML KnowledgeCloud产品,旨在为各行各业的客户和合作伙伴提供机器大脑和认知计算能力。TML KnowledgeCloud的核心是TML文本挖掘编程语言,它提供了一种通用的形式化方法,在各个行业和领域建立知识图谱,并与深度学习相融合,来帮助理解各种业务文本。

TML认知计算平台在过去三年成功输出的技术能力包括 :

(1) 从文本中抽取成千上万个知识点建立知识图谱,完成对招投标、离婚判决、公共安全等业务文档的深度语义理解;

(2) 基于所积累的数十个行业场景的业务知识图谱,帮助建立对海量非结构化和半结构化业务数据的深度洞察;

(3) 在各垂直领域内基于知识图谱和历史案例库建立智能预诊、智能预判等逻辑推理能力,帮助打造行业人工智慧应用;

基于这些技术能力输出,我们和司法公安、医药医疗、金融保险、智能制造和零售快销等多个行业的客户和合作伙伴一起,共同打造落地实用的企业级人工智慧。


推荐阅读:
相关文章