現在有二手汽車的一些相關資料,已經有了訓練集,想給汽車做一個定價模型來自動判定新上架的二手車的價格,用什麼演算法來做比較合適呢?
回覆列表
-
1 # 愛資料的小司機
-
2 # 西行客5
先不要考慮什麼演算法,先去了解一下汽車估價的基本流程,需要考慮哪些方面,比如品牌,年限,型號,產地等等。在這些資料基礎上,進行人工評估,然後再進一步分類,最後才是演算法。
如題!做的是定價模型,首先考慮這不是一個分類問題,而是一個迴歸模型。
鑑於此,推薦考慮兩種演算法來做模型:迴歸演算法和KNN迴歸演算法。
迴歸演算法迴歸演算法算是機器學習模型中最簡單,最直觀,最常用,也是最好解釋的演算法了。
首先,你已經有相關資料,有訓練集,二手車的資料,我覺得應該是連續型資料比較多,離散型資料比較少,這樣直接透過資料擬合得出模型方程,可以直觀的預測新上架的二手車價格。
另外迴歸分析做起來也非常簡單,Excel就可以擬合迴歸方程。
KNN迴歸演算法什麼是KNN?就是K近鄰演算法,KNN演算法不是一直用來分類的嗎?不要疑惑,K近鄰也可以用來做迴歸演算法。原理也好理解,就是透過找出一個新樣本的k個最近鄰居,將這些鄰居的價格的平均值賦給該樣本,就可以得到該樣本的價格。
如果你覺得直接回歸分析擬合方程太簡單,又或者訓練集無法擬合成線性方程無法滿足需求,你可以再嘗試一下這個演算法。
二手車資料應該還是有不少離散資料,比如,是否出現事故,品牌等等,這個時候很可能無法擬合成線性的方程。
KNN演算法可以非常好的解決非線性迴歸問題。
這個時候Excel無法做,可以使用python的scikit-learn庫,其提供了各種演算法的介面,包括KNN分類演算法和迴歸演算法