全國政府機關及事業單位門戶網站、政府集採網站、行業招投標平臺及其他媒體,每天都要發布數萬條招投標信息和中標信息。這些信息涉及到方方面面,裡面也隱藏著無數商機。對於企業而言,及時獲取這些數以萬計的信息,並找到與自己相關的部分,做相應的處理,是極其有價值的工作,難度也比較大。一般而言,這些信息中包括了招標公司、招標類型、招標產品、聯繫電話、採購數量、投標結果、項目名稱、截止時間、資質要求等要素點。這些信息都以非結構化文本的形式分散在各個網站,對它們進行採集然後抽取裡面那些要素點,再進行分析挖掘,是重要的市場工作。

一、招投標信息蘊含哪些商機

對很多企業而言,從公開的招投標信息和中標信息中挖掘潛在的商業機會,能起到事半功倍的效果。它對企業一般有著下述幾個方面的重要價值:

(1) 商機發現:對尋找投標機會的乙方企業,及時獲取哪些甲方客戶正發布的需求信息,有著重大的價值。對於那些標準化產品的採購,例如計算機和服裝等,甲方客戶都會更多的關注品牌和價格,因此有著較大價格優勢的乙方如果能快速捕獲這些需求信息,然後開展投標,有著直接效益;對於那些非標準化的服務,例如軟體項目或是建築施工,儘管招標信息的發布通常意味著甲方中意的供應商已經有了初步的候選,但這些信息通常意味著甲方會有一系列後續的預算和需求,例如建築施工完畢要裝修,軟體實施完畢可能會有第二期,等等。因此,可以及時挖掘匯總各地的商機,並與業務隊伍制定的目標相比對,指導工作。

(2) 渠道挖掘:對尋找渠道代理商的乙方企業,及時知曉各個甲方客戶在相關產品服務上的供應商,有著重要意義。這是因為在非標準的定製服務上,企業客戶一般較少更換自己的供應商,因此很多乙方企業為了將產品和服務提供給這些甲方客戶,需要通過他們現有的供應商作為渠道。統計挖掘一個大的甲方客戶在過去數年內的中標信息,可以知曉他的供應商範圍,並在無法直接觸達甲方的情況下,與現有供應商合作,一起去服務客戶。

(3) 供應商挖掘:對於尋找供應商的甲方客戶而言,出於選擇更物美價廉服務的考慮,往往會尋找一些新的供應商,邀請參與投標。因此,對其它甲方客戶的中標信息進行統計分析,知曉他們選擇最多的供應商,和相關的中標產品服務價格,對甲方控制預算和選擇最優供應商,有著重要的參考價值。

因此,及時的從互聯網上獲取這些公開發布的信息,存檔並進行分析挖掘,能給企業客戶帶來直接的商業機會,有著重要意義。

二、如何挖掘商機

如上所述,招投標公告和中標公告都分散在各個網站中,而且相當一部分是公佈數天之後就撤下。如何通過計算機系統自動的挖掘商機,一般可以分為如下幾步:

(1) 信息採集:使用爬蟲系統,從數萬個網站中抓取裡面存在的招投標信息網頁,然後從網頁內容中提取出相關的招投標文件內容。出於獲取信息的及時性要求,需要通過多臺伺服器以分鐘為單位來採集這些信息,並將它們分散式的存儲到本地。這裡的一個難點是,採集招投標信息的目標網站列表需要持續自動更新。

(2) 知識抽取:對於下載得到的招投標文件內容,它們都是長篇幅的文本。需要從這些文本中抽取大量的知識點,例如項目名稱、招標產品、招標數量、招標地點、截止時間等數十項,將每一篇招投標文檔完成針對業務的語義結構化,支持後續的統計挖掘。

(3) 統計挖掘:基於抽取的知識點,我們能夠對海量的招投標信息進行深層的分析統計,例如統計每一個甲方單位中標最多的供應商,統計某一個招標產品在某個地方的最新需求,統計某一類招標服務在過去12個月內的價格區間和供應商名錄,等等。

在完成這三個步驟的工作之後,計算機可以幫助人們及時的洞察商機,並為下一步的業務決策提供數據支撐,做到各種關鍵信息清晰明瞭,一目瞭然。

三、TML KnowledgeCloud如何幫助商機挖掘

TML KnowledgeCloud是網感至察推出的認知計算雲服務,旨在幫助各行各業的客戶建立知識圖譜,對文本內容進行深層的分析與挖掘。由於爬蟲系統已經是一項比較成熟的技術,且有著大量的開源軟體作為候選,因此TML KnowledgeCloud將重點集中兩個方面來幫助開展商機挖掘:知識抽取和統計挖掘。

對招投標信息進行知識抽取,既要保證精度在95%以上,也要保證足夠的召回率。TML KnowledgeCloud可以通過下面的幾個環節,來抽取出相應的知識點:

(1)使用我們自主研發的TML語言編程,制定招投標信息領域中需要抽取的知識要素,例如項目名稱,招標類型,招標公司,招標產品,品牌列表,採購數量,招標預算,招標編號等;

(2)將寫好的TML程序進行編譯,並與大量的招投標信息進行匹配,輸出每一篇招投標信息所包含的知識點;同時為每一個目標知識要素獲得足夠的基礎語料;

(3)使用深度學習方法,基於上述訓練語料和TML代碼,訓練出自動抽取的模型,並自動擴充現有的TML代碼以解決定義不全不準的地方,然後處理新的招投標文件。

對知識抽取結果進行統計挖掘,則需要建立招投標信息領域的各類主數據,並靈活的生成各種數據報表,環節如下:

(1) 將抽取了上述要素的招投標信息導入SmartData子系統,每一條相關的要素都被補充到相應的主資料庫中。例如同一個供應商在不同地方去參與投標的子公司,被主數據中的主供應商關聯起來,統一進行分析。

(2) 從主數據的各種不同維度出發來自定義報表生成的規則,例如選擇相關的地點、招標產品和截至時間,來列出相應的所有信息。用戶可以自定義多個這樣的報表。

(3) 基於得到的信息列表和客戶的報表要求,進行相應的可視化展現和信息推送。

四、關於我們

南京網感至察信息科技有限公司,基於近20年的技術和演算法積累,研發推出了具備自主知識產權的TML認知計算平臺,並以此為基礎推出了TML KnowledgeCloud產品,旨在為各行各業的客戶和合作夥伴提供機器大腦和認知計算能力。TML KnowledgeCloud的核心是TML文本挖掘編程語言,它提供了一種通用的形式化方法,在各個行業和領域建立知識圖譜,並與深度學習相融合,來幫助理解各種業務文本。

TML認知計算平臺在過去三年成功輸出的技術能力包括 :

(1) 從文本中抽取成千上萬個知識點建立知識圖譜,完成對招投標、離婚判決、公共安全等業務文檔的深度語義理解;

(2) 基於所積累的數十個行業場景的業務知識圖譜,幫助建立對海量非結構化和半結構化業務數據的深度洞察;

(3) 在各垂直領域內基於知識圖譜和歷史案例庫建立智能預診、智能預判等邏輯推理能力,幫助打造行業人工智慧應用;

基於這些技術能力輸出,我們和司法公安、醫藥醫療、金融保險、智能製造和零售快銷等多個行業的客戶和合作夥伴一起,共同打造落地實用的企業級人工智慧。


推薦閱讀:
相關文章