編者按:隨著技術的突飛猛進,越來越多的美好暢想都已漸漸可落地、可執行,並且變得越來越簡單。面向企業的機器學習應用就是其一。隨著SAP的外聯性逐漸加強,機器學習或許可以喚醒企業海量沉睡數據,支撐核心業務場景,自動化的提升競爭力,工具和方法已經在這裡,就看你拿不拿的起,會不會用了。

人工智慧和機器學習是當前IT市場中最熱門的趨勢。每個人都在談論它,客戶如果需要在日常流程中採用這些技術。則需要具有能夠使流程擴展,管理並符合當前業務需求的系統。

作為數字化轉型的一部分,目前運行SAP ERP的客戶正在實施創新解決方案,以增強運營這些創新的解決方案:包括RPA機器人過程自動化,機器學習和增強分析,可實現智能ERP aka iERP。

本文假設大家既熟悉SAP HANA技術,又了解資料庫和應用程序平台,以及可用於執行各種任務的引擎。本文將可以幫助企業了解如何在SAP HANA基礎上,擴展機器學習,用作引導概覽之用。

我們將介紹以下HANA組件的業務應用程序和技術方面:

1)PAL - HANA預測分析庫

2)HANA-R - HANA-R之間的集成平台

3)HANA EML - 擴展機器庫

4)AFM - 應用功能建模器

除上述組件外,HANA還允許通過XS引擎使用外部API。有關HANA XS引擎的更多詳細信息,請訪問下面鏈接。

archive.sap.com/documen

下圖涵蓋了HANA平台中可用於機器學習的組件。

?

1

SAP HANA預測分析庫(PAL)

在我們看到它的應用之前,讓我們先了解PAL的一些技術方面。

PAL是HANA中應用程序功能庫(AFL)的組件之一。它可以定義可以在HANA中的SQL腳本過程中調用的函數,以執行高級分析演算法。SAP提供了一系列經典和通用的PAL演算法。

當PAL與HANA承載執行引擎並在內存中並行執行本地計算的能力配對時,它提供了加速機器學習模型的獨特功能。

PAL可用於每個HANA許可證(從HANA 1.0 SPS06開始)和AFL中的雲平台。

SAP PAL演算法分為10類,其中一些包括聚類,分類,關聯和時間序列函數。所有的PAL程序都可以在下面看到。

PAL還包括幾種演算法,這些演算法可以學習並不斷更新以實現動態預測,使公司能夠使用當前數據並立即適應客戶不斷變化的條件和行為。

HANA PAL的目標是實現大多數最常見的預測用例。與HANA的內存和快速性能相結合,許多人選擇它作為他們的預測工具。但是,即使提供了所有演算法,您也可能需要一個外部R伺服器來實現更高級的演算法。(HANA-R集成將在以下幾點中介紹)。

用例

對於客戶來說,理想的情況是從開箱即用的PAL演算法開始,然後在絕對需要的情況下探索外部演算法。

單獨的PAL最適合需要執行上述演算法的人,已經使用SAP HANA並安裝了SAP HANA Studio。對於那些需要靈活性和定製的人,如數據科學家和數學家,將PAL和R一起部署。但是,PAL需要SQL Script和/或使用的預測方法的經驗。

2

HANA-R集成

R是一種用於統計計算的開源編程語言,廣泛用於高級數據分析。通過使HANA能夠使用和執行R中可用的所有開源演算法,提供R集成打開了大門。HANA資料庫解釋R語言並相應地將腳本提交給R Server。

將SAP HANA與R集成的目標是最終自定義演算法,甚至超過標準庫中通過PAL提供的演算法。SAP HANA使用外部R環境來執行R代碼。然後,應用程序開發人員可以在HANA SQLScript中嵌入R函數定義和調用,並將整個代碼作為資料庫查詢提交。

這開闢了所有新的可能性,因為R的功能範圍可以用於HANA中的數據。

用例

當基於SAP HANA的建模和應用程序,或開發人員希望將R環境用於特定統計功能時,R代碼的集成是合適的。它允許開發人員利用他們的創造力,從數千個R包中進行選擇,並編寫一些非常靈活的數據分析和預測。

SAP不包含具有SAP HANA許可證的R環境,因為R是開源的,並且在通用公共許可證下可用。同樣,SAP不提供對R的支持。為了使用SAP HANA與R集成,您需要從開源社區下載R並進行配置。您還需要一個TCP/IP伺服器Rserve,它允許其他程序使用R的工具,而無需初始化R或與R庫鏈接。請注意,此集成需要具有R代碼的先驗知識和專業知識。

3

HANA擴展機器學習庫(EML)

SAP從HANA 2.0 SP02開始引入了HANA EML。它能夠在預先構建的機器學習模型上使用HANA數據進行評分(將預測模型應用於一組數據的過程稱為評分)。更多相關信息可以查看下面連接。

blogs.sap.com/2017/08/2

這是什麼意思?在這種情況下,HANA不會用於培訓和構建機器學習模型。模型將使用python環境構建 - Tensorflow,這是由Google提供的用於構建複雜的深度學習模型的python包。Tensorflow不僅限於深度學習,還可用於預先形成常見的機器學習模型。下面兩個鏈接可了解Tensorflow的更多信息。

《一文了解最火開源ML框架TensorFlow》老文推薦

TF官網: tensorflow.org

這是如何運作的?在Tensorflow中構建模型(訓練,測試和驗證),然後使模型由Tensorflow服務(用於啟用HANA EML和Tensoflow集成所需的單獨伺服器)使用。然後構建HANA SQL腳本以調用Tensorflow中提供的模型,並為評分(預測)啟用數據。

用例

EML已作為SAP HANA的一部分包含在AFL中,用戶可以輕鬆地將TensorFlow服務連接到HANA。藉助HANA EML,TensorFlow模型現在可以輕鬆集成到客戶的企業應用程序和業務流程中。

4

HANA應用程序功能建模器(AFM)

HANA AFM是SAP HANA Studio的擴展,用於創建流程圖模型(表,視圖,過程,R腳本,PAL函數)而無需編寫SQL腳本代碼。可以將其視為拖放界面,允許經驗不足的開發人員快速構建複雜的過程。

AFM的一個主要優點是它不需要編碼PAL和BFL(業務函數庫)演算法。企業的另一個好處是可以檢查和退出開發模型對象,以便多個用戶可以同時訪問和開發。

用例

AFM適用於SQL代碼經驗較少但仍希望使用HANA資料庫執行預測分析的用戶。優點是演算法可以開箱即用,無需將數據發送出系統,並且可以更輕鬆地與SAP中的進程內應用程序和事務集成。

關鍵要點

下表比較了四種產品的使用案例,技能組合和先決條件。(可點擊圖片並雙擊放大)

* PAL和AFM可以與HANA企業一起使用,無需任何其他許可證,伺服器或組件。這可以啟動客戶端以開始在SAP中構建機器學慣用例。對於非常複雜的用例,您可以啟用R集成和EML。

總之,數據科學家和業務分析師應儘可能使用SAP HANA自動預測功能開始分析。自動化機器學習可以應用于越來越多的場景,同時在幾秒或幾分鐘內產生有效的結果。因此,那些不是數據科學家的人現在能夠回答他們自己的問題並快速描述結果,同時為數據科學家和數學家提供快速分析問題的自動化方法。

原文地址:blogs.sap.com/2019/02/0

原文作者: Morgan Lindsey、Sainath Kumar

往期精選 | Editors Choice

SAP創立的前18年,商業傳奇的底座建設

ToB產品經理的「邊界能力」

人力資源「一哥」Workday的前世今生

被忽略的設計原則(SAP vs Salesforce vs 阿里)

SAP將裁員4400人,以優化能力結構


推薦閱讀:
相关文章