數據分析
收集的數據要進行清洗,把無用的數據捨棄,對有效數據進行分析。
數據的質量:重複?完整?一致?時效?
數據的形式:結構化數據;半結構化數據;非結構化數據
結構化數據:SQL數據(完全限制格式)
半結構化數據:JSON(整體有着一定的格式,具體是非結構化的數據)——既有結構化數據,又有非結構化數據
非結構化數據:圖像,文本
數據分析的好處(通俗化):
搞清事實,接近真相,預測未知,幫助決策
逐步挖掘商業價值的分析(學術):
描述分析,診斷分析,預測分析,指導分析(Excel,Python)
分析所用的一些模型:
分析方法與工具:
另外,學會使用GitHub!
數據可視化:
爲了更好的閱讀,爲了更好的解析結果,我們把結果可視化,但是,可視化的方式不對,可能會得到完全沒用的結論。舉例如下:
這是9月份同比銷售額的可視化:
不同的可視化方式,得到完全不一樣的視覺效果,由此得到不一樣的結果。更甚者,有惡意可視化,完全與真實相反,誤導人們的眼球。
可視化的時候,注意選取正確的可視化方法。
典型數據驅動開發團隊人員:
大型的項目需要一個團隊共同協作才能做得更好!