MF 是矩陣補全的一種方法,它分解成兩個低秩矩陣 ;為甚麼要低秩? 因為實際資料分佈會存在很多簇或塊,這些塊就是資料的相似性,偏好。 這也說明 k-means 等聚類演算法本質上都是矩陣分解。從數值計算角度說: 在求解過程中,我們希望獲得一個閉解,然而需要求解 ,他們的逆矩陣不一定存在;從MF的結構上說,引數V\U矩陣是病態矩陣(病態矩陣不可求逆),微小的資料擾動,導致解有很大的差異,模型極其不穩定;解決辦法: 吉洪諾夫矩陣(Tikhonov matrix)正則法;如果使用L2正則,就是我們常常看到的帶範數MF模型;求解就變成了; ,從形式上看,就相當與把對角線的值增大,形如 脊、嶺迴歸;PMF方法是假定 U,V 等服從高斯先驗;透過透過最大後驗機率,獲得與帶L2範數的MF模型一致形式;說明了 PMF從機率角度很好的解釋了MF模型;BPMF 模型 是在PMF模型上加上 貝葉斯框架,U|V 等的引數的又服從一個分佈(類似於LDA模型); PMF模型我們直接是設定超引數;BPMF 認為這樣是不合理的,調參也是困難的,將這些超引數的先驗置為高斯-威沙特分佈。BPR模型,重點在於分析資料,充分利用偏序關係,構造正反例,然而這也限制了他的正負取樣率1:1,即一個正例對應一個反例。其本質還是最大後驗機率;
MF 是矩陣補全的一種方法,它分解成兩個低秩矩陣 ;為甚麼要低秩? 因為實際資料分佈會存在很多簇或塊,這些塊就是資料的相似性,偏好。 這也說明 k-means 等聚類演算法本質上都是矩陣分解。從數值計算角度說: 在求解過程中,我們希望獲得一個閉解,然而需要求解 ,他們的逆矩陣不一定存在;從MF的結構上說,引數V\U矩陣是病態矩陣(病態矩陣不可求逆),微小的資料擾動,導致解有很大的差異,模型極其不穩定;解決辦法: 吉洪諾夫矩陣(Tikhonov matrix)正則法;如果使用L2正則,就是我們常常看到的帶範數MF模型;求解就變成了; ,從形式上看,就相當與把對角線的值增大,形如 脊、嶺迴歸;PMF方法是假定 U,V 等服從高斯先驗;透過透過最大後驗機率,獲得與帶L2範數的MF模型一致形式;說明了 PMF從機率角度很好的解釋了MF模型;BPMF 模型 是在PMF模型上加上 貝葉斯框架,U|V 等的引數的又服從一個分佈(類似於LDA模型); PMF模型我們直接是設定超引數;BPMF 認為這樣是不合理的,調參也是困難的,將這些超引數的先驗置為高斯-威沙特分佈。BPR模型,重點在於分析資料,充分利用偏序關係,構造正反例,然而這也限制了他的正負取樣率1:1,即一個正例對應一個反例。其本質還是最大後驗機率;