R語言是用於統計分析,圖形表示和報告的編程語言。它正在成為數學科學的「通用語言」,想要進行高級複雜的數據挖掘分析,少不了 R 語言的身影。R語言的拓展性極強,擁有大量一線人員不斷開發新的分析腳本。目前,諮詢業、金融業、醫藥業都在大量的使用 R 語言。

DataViz 數據可視化分析平台為滿足用戶對高級複雜數據的挖掘分析需求,在已有的標準版基礎上,新增企業版功能,支持 R 高級分析語言。

在標準版中,支持常見的數值、字元、時間等計算方法,這些演算法分析主要是統計分析,而對於趨勢預測、聚類等挖掘分析演算法則不具備。

在企業版中,通過支持調用 R Server 可以有效引入第三方的演算法能力,讓產品具有全新的挖掘分析能力。當前支持時序預測、聚類分析、回歸分析等演算法,還可以通過自定義R腳本做演算法擴展。

小編帶大家看一下 DataViz 內置的 R 語言常見演算法和使用示例

01數值計算

R 語言數值計算

數值計算後的折線圖

示例中使用數值計算功能,對訂單金額乘以 2,然後線性回歸擬合。

02字元串計算

R語言字元串計算

字元串計算後的柱圖

示例中使用字元串計算功能,將維度欄位的地區和省份進行字元串拼接。

03時序預測

時序預測在時間相關的分析計算中應用廣泛,比如,在財務領域,根據往年的成本支出情況,使用時序預測演算法可以預測未來幾年(一段時間)的成本支出情況。 在銷售領域,已知各年銷售額,使用時序預測演算法可以預測未來幾年(一段時間)的銷售額情況。

R 語言 ARIMA 模型時序預測分析

銷售額的年時序預測結果

R 語言平滑時序預測分析

財務成本月時序預測結果

04聚類分析

聚類分析也是最為常用的一種高級分析演算法,在商業領域,聚類分析可以被用來發現不同的客戶群,並分組聚類出相似客戶,分析刻畫不同的客戶群的特徵,來更好的了解客戶。

在人力資源方面,可根據簡歷中包含的欄位,如學歷、公司規模、薪水、職位名稱等,通過聚類分組,挖掘出簡歷與職位的規律,從而快速有效的找到匹配的員工。

R 語言聚類分析演算法

鳶尾花類別聚類分析結果

05回歸分析

在大數據量中,使用回歸分析可以快速獲取數據規律,比如,在商業領域,以買家和賣家的數據為依據,用回歸方法描述商品需求的變動規律,可以獲取某商品銷售需求量的趨勢情況,進一步對未來的銷售需求量進行趨勢分析。

R 語言回歸分析演算法

散點圖回歸分析結果

R 語言的演算法數量眾多,本文簡單列舉了 DataViz 中內置的常見演算法和使用用例。DataViz 企業版用戶可以將更多的演算法包引入到數據分析平台中,充分滿足各種演算法需求。

DataViz 企業版還支持移動端 APP,幫助企業領導者隨時隨地查看分析報告,及時做出決策。同時,支持高性能大數據分析引擎,幫助中大型企業TB級數據秒級分析處理,提升數據分析能力。

推薦閱讀:

相关文章