特徵平臺

A.

特徵是什麼?

What

特徵平台是自動進行深度特徵合成的平台,提供了豐富的特徵加工算子,以及直觀便捷的數據探索從類別型到數值型,從變換算子到匯總算子,特徵平台覆蓋了數據訪問特徵工程、數據探索和數據管理四大功能,支撐高性能自動化的特徵工程

B.

問題產生的背景?

Backdrop

大數據優於好算法,但好數據則優於大數據。 (Peter Norvig)特徵決定了模型能達到的上限,但如何識別和發掘出有用的特徵則常常依賴於建模人員的經驗,由此造成了模型質量參差不齊缺乏有效的特徵加工工具和方法,也嚴重製約了數據分析的效率


C.

有哪些特色和創新點?

Innovation

全面的數據類型支持,包括從無序到有序的類別型變量,從新近度、頻次到規模的數值型變量

全面的特徵工程算子,包括各種Encoding編碼、邏輯運算、字符串函數、日期和地理位置變換等變換算子也包括反映數據位置表徵、離散程度和分佈形狀的匯總算子

數據集市分區,基礎區、集市區和沙箱區分層隔離;


D.

能否帶來真正業務價值?

Value

降低硬件和維護成本,存儲成本降低為以前的1/4,支持的用戶數是以前的兩倍,維護工時縮短60工作日規範化模型管理和提高建模效率,支撐模型數量提高6倍,寬表數據準備工作量降低為以前的1/4加快分析建模的速度,從手工式特徵工程所需的數週,縮短為短短幾小時甚至數分鐘

功能架構

Functional Architecture

立即體驗,開啟數位化轉型之旅!