為什麼要用 Data lake?淺談企業自建資料湖泊的關鍵因素

企業因應數位化紛紛加速轉型動作。iThome 在 2019 臺灣企業雲端大調查中發現,台灣已有 6 成的企業在推動數位轉型,各產業皆然,另外也有 25% 企業認為有必要推動但尚未執行。這一波數位轉型浪潮來自網路的全面化;無時無刻連網的情境帶動了行動、O2O 等各種全新商業模式;而數據量暴增,也迫使傳統企業思考如何藉由數據與科技提高用戶忠誠度、改善消費體驗、提升內部效率。

大數據分析、AI 技術藉此快速竄起;例如近幾年行銷領域很紅的 Martech(行銷科技),就是透過科技與改善人為判斷的偏誤,改以數據導向、機器學習驅來優化廣告行銷成效。但是,暴增的數據要如何有效整合運用?企業又要有多深的口袋才能做到?

以前企業各單位的資料儲存在不同地方、以不同形式儲存,未能整合發揮綜效,而有了雲端資料湖泊或 DMP 後,開始實踐一部分的整合與數位化。像是 Google 推出的 Google Analytics(以下簡稱 GA)與 Firebase Analytics 就已具有某種程度的資料整合能力,不僅能將會員資料與線上流量做串接,也能達成跨裝置、跨平台的身分比對。(延伸閱讀:資料倉儲、資料湖泊與 DMP 介紹與比較

但是,大多數企業使用的免費版 GA 仍有侷限性;比如對行銷人員來說,最理想的狀況當然是所有廣告平台、線上線下的數據都能全面打通,但畢竟 GA 上的各種再行銷名單只能用於自家的廣告生態系,難以將這些流量打包至 FB 廣告投放或其他像:eDM、簡訊等自媒體管道使用。

另外,免費版 GA 只能使用現成的報表介面查看流量,無法做到更深入的分析,對於熟悉使用 SQL 語法查詢資料、自製視覺化報表的分析師而言功能就有限制。就業務面而言,免費版的 GA 也較少自訂欄位設定,預設的欄位有時較難準確表達業務邏輯。而企業版的 GA360 雖然主打原始資料 (raw data) 能夠匯出至 BigQuery 做分析、更多客製化自訂欄位,又因為定價的因素讓台灣大多數企業卻步。

如何讓企業真正擁有數據所有權?iKala 為了解決上述的痛點,讓企業更能掌握自家資料、導入 AI 分析,獨家研發 iKala Big Data Lake 作為蒐集數位行為軌跡的平台。iKala Big Data Lake 不僅保有行銷部門習慣使用的報表介面、多種事件蒐集、跨裝置、跨平台用戶比對的功能以外,也擁有像 GA360 將原始資料匯出至 BigQuery 的特性。

iKala Big Data Lake 與 AI 分析模組系統架構圖

不同於市面上眾多 DMP 或 GA 以廣告投放為最終目的,iKala Big Data Lake 則以 AI 分析、機器學習建模為目標。透過 BigQuery 強大的資料查找功能,PB 等級的資料也能幾分鐘內快速執行,成為 AI 分析、機器學習建模的基礎。

企業也能將自己的第一方資料,如:CRM 名單、銷售資料、商品型錄等上傳至 BigQuery,透過統一 ID 即可進行第一方資料與 Big Data Lake 行為資料做比對,更精準地勾勒會員輪廓,以改善行銷業務面決策。

而這些資料或建立好的機器學習模型會部署於客戶的GCP專案下,讓資料所有權回歸企業本身,也讓坊間各種AI大數據技術更加普及,不再只是個黑盒子:錢投進去、成效出來卻不知道其中的數據或模型如何運作優化。

一家數位轉型沒有做好的企業,資料分散未能整合,就會使數位行銷策略偏頗、成效大打折扣;反之亦然,若沒有完善規劃數位行銷策略,即便向數位化發展,蒐集到的資料也會非常雜亂而難以整合、使用。數位化口號下,企業還須讓「數位轉型」與「數據驅動行銷」兩者相輔相成、齊頭並進才能發揮最大效益。

相關文章

資料倉儲、資料湖泊與 DMP 介紹與比較

Google Analytics 免費版和 Google Analytics 360 的六大差異

2019 Google Summit 精彩回顧!Keynote 簡報完整帶著走!


連絡「GCP 專門家」