大數據技術_ 基礎理論 之 大數據商業應用

1 用戶畫像和精準營銷

人在網絡世界中的行爲集合代表了他在網絡世界中的「性格」,這個集合就描述了他的網絡個性和用戶特徵(User
Profile)。從數據擁有者,也就是企業角度來看,他們掌握了所有用戶在網絡世界中「某方面」的行爲習慣,如用戶瀏覽了哪些網頁、搜索了哪些關鍵詞、購買了哪些商品、留下了哪些評價等,企業都會收集彙總。如何將如此龐雜的數據轉換爲商業價值,成爲現在企業越來越關注的問題。面對高質量、多維度的海量數據,如何建立精準的用戶模型就顯得尤爲重要,用戶畫像的概念也就應運而生。
在這裏插入圖片描述
1.1用戶畫像和精準營銷
在這裏插入圖片描述
1.2用戶畫像的價值
在這裏插入圖片描述

1.3用戶畫像構建流程
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

在這裏插入圖片描述
1.4用戶標籤體系

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

2 廣告推薦

2.1推薦系統
在這裏插入圖片描述
在這裏插入圖片描述
2.2廣告點擊率及其評估
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
2.3基於位置的服務和廣告推薦
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

3 互聯網金融

3.1概述
在這裏插入圖片描述
3.2大數據在互聯網金融的應用方向
在這裏插入圖片描述
3.3機器學習在大數據金融中的作用
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

4 實戰:個人貸款風險評估

1、實戰目的

本次實驗通過提取貸款用戶相關特徵(年齡、工作、收入等),使用Spark
MLlib構建風險評估模型,使用相關分類算法將用戶分爲不同的風險等級,此分類結果可作爲銀行放貸的參考依據。本次實驗爲方便演示,選用邏輯迴歸算法將用戶風險等級分類兩類:高風險、低風險。有能力的同學可以嘗試使用其他分類算法實現。
2、實驗環境和實驗數據

操作系統:CentOS6.5。
編程語言:Scala 2.10.4。
相關軟件:Hadoop2.6.0、Spark1.6.0。

實驗數據來源:https://www.kaggle.com/

3、實驗過程
在這裏插入圖片描述
4、實驗步驟
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
5、實驗結果
在這裏插入圖片描述
以上是大數據商業化的常見應用。