人在網絡世界中的行爲集合代表了他在網絡世界中的「性格」,這個集合就描述了他的網絡個性和用戶特徵(User
Profile)。從數據擁有者,也就是企業角度來看,他們掌握了所有用戶在網絡世界中「某方面」的行爲習慣,如用戶瀏覽了哪些網頁、搜索了哪些關鍵詞、購買了哪些商品、留下了哪些評價等,企業都會收集彙總。如何將如此龐雜的數據轉換爲商業價值,成爲現在企業越來越關注的問題。面對高質量、多維度的海量數據,如何建立精準的用戶模型就顯得尤爲重要,用戶畫像的概念也就應運而生。
1.1用戶畫像和精準營銷
1.2用戶畫像的價值
1.3用戶畫像構建流程
1.4用戶標籤體系
2.1推薦系統
2.2廣告點擊率及其評估
2.3基於位置的服務和廣告推薦
3.1概述
3.2大數據在互聯網金融的應用方向
3.3機器學習在大數據金融中的作用
1、實戰目的
本次實驗通過提取貸款用戶相關特徵(年齡、工作、收入等),使用Spark
MLlib構建風險評估模型,使用相關分類算法將用戶分爲不同的風險等級,此分類結果可作爲銀行放貸的參考依據。本次實驗爲方便演示,選用邏輯迴歸算法將用戶風險等級分類兩類:高風險、低風險。有能力的同學可以嘗試使用其他分類算法實現。
2、實驗環境和實驗數據
操作系統:CentOS6.5。
編程語言:Scala 2.10.4。
相關軟件:Hadoop2.6.0、Spark1.6.0。實驗數據來源:https://www.kaggle.com/
3、實驗過程
4、實驗步驟
5、實驗結果
以上是大數據商業化的常見應用。