數據挖掘與機器學習的區別是什么?
數據挖掘側發現知識,機器學習側重認識事物,兩者相輔相成。
數據挖據和機器學習是處理數據的兩個步驟。
數據挖據提供數據管理技術,機器學習提供數據分析處理技術。
舉個簡單的例子,馬云想知道在淘寶里什么用戶喜歡買些什么。
首先分析這個問題,要分用戶、類別產品類別進行信息采集。并不是所有的淘寶購買信息都要,只要用戶的年齡、性別和購買物品的類別以及收藏欄和購物車這些信息。那么這時,用戶購買的時間、用戶購買時付的費用這些都是無關數據。
這時候就要用到數據挖掘技術了,常用的數據挖據方法是爬蟲(這里提醒廣大用戶,爬蟲需要兼顧道德和法律責任,酌情使用)。淘寶自己則不用爬蟲,直接運用數據挖掘技術在海量的數據里提取上文說的所需要的信息,這是一個復雜并且漫長的過程。
當所需要的年齡、性別、以及購物類別數據采集完成并分類完成。這時候就需要神經網絡來工作了,根據數據分類選擇神經網絡的種類,并優選網絡節點、函數,設定閾值,最后開始訓練。最后就得到馬云想知道的東西了。
綜上所述,數據挖掘側發現知識,機器學習側重認識事物,兩者相輔相成。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
