商業數據分析第二記

數據分析

收集的數據要進行清洗,把無用的數據捨棄,對有效數據進行分析。

數據的質量:重複?完整?一致?時效?

數據的形式:結構化數據;半結構化數據;非結構化數據

結構化數據:SQL數據(完全限制格式)

半結構化數據:JSON(整體有着一定的格式,具體是非結構化的數據)——既有結構化數據,又有非結構化數據

非結構化數據:圖像,文本

數據分析的好處(通俗化):

搞清事實,接近真相,預測未知,幫助決策

逐步挖掘商業價值的分析(學術):

描述分析,診斷分析,預測分析,指導分析(Excel,Python)

分析所用的一些模型:

分析方法與工具:

另外,學會使用GitHub!

數據可視化:

爲了更好的閱讀,爲了更好的解析結果,我們把結果可視化,但是,可視化的方式不對,可能會得到完全沒用的結論。舉例如下:

這是9月份同比銷售額的可視化:

不同的可視化方式,得到完全不一樣的視覺效果,由此得到不一樣的結果。更甚者,有惡意可視化,完全與真實相反,誤導人們的眼球。

可視化的時候,注意選取正確的可視化方法。

典型數據驅動開發團隊人員:

 

大型的項目需要一個團隊共同協作才能做得更好!