協同過濾中的可擴充套件性問題是什麼？

首頁>Club>2021-02-15 09:32

協同過濾中的可擴充套件性問題是什麼？

回覆列表

1 # 使用者52510796211

協同過濾演算法能夠容易地為幾千名使用者提供較好的推薦，但是對於電子商務網站，往往需要給成百上千萬的使用者提供推薦，這就一方面需要提高響應時間的要求，能夠為使用者實時地進行推薦;另一方面還應考慮到儲存空間的要求，儘量減少推薦系統執行的負擔。1．3可擴充套件性問題在協同過濾推薦演算法中，全域性數值演算法能及時利用最新的資訊為使用者產生相對準確的使用者興趣度預測或進行推薦，但是面對日益增多的使用者，資料量的急劇增加，演算法的擴充套件性問題(即適應系統規模不斷擴大的問題)成為制約推薦系統實施的重要因素。雖然與基於模型的演算法相比，全域性數值演算法節約了為建立模型而花費的訓練時間，但是用於識別“最近鄰居”演算法的計算量隨著使用者和項的增加而大大增加，對於上百萬的數目，通常的演算法會遇到嚴重的擴充套件性瓶頸問題。該問題解決不好，直接影響著基於協同過濾技術的推薦系統實時向用戶提供推薦問題的解決，而推薦系統的實時性越好，精確度越高，該系統才會被使用者所接受。基於模型的演算法雖然可以在一定程度上解決演算法的可擴充套件性問題，但是該類演算法往往比較適於使用者的興趣愛好比較穩定的情況，因為它要考慮使用者模型的學習過程以及模型的更新過程，對於最新資訊的利用比全域性數值演算法要差些。分析以上協同過濾在推薦系統實現中面臨的兩個問題，它們的共同點是均考慮到了最近鄰居的形成問題(包括使用者資訊獲得的充分性、計算耗費等)。但是應該看到協同過濾在推薦系統的實現中，要獲得最近鄰居使用者，必須透過一定的計算獲得使用者之間的相似度，然後確定最佳的鄰居個數，形成鄰居使用者集。而在這一過程中，如果對全部資料集進行相似性計算，雖然直接，但是運算量和時間花費都極大，無法適應真實的商務系統。如果透過對訓練集資料(整個資料集的某一子集)進行實驗獲得，雖然不必對整個資料集進行計算，但是必須透過將多次實驗結果統計出來才可能得到，這無疑也增加了推薦結果獲得的代價和誤差。並且如果考慮到資料集的動態變化，這一形成最近鄰居使用者集技術的實際應用價值越來越小。因此，考慮使用更為有效的最近鄰居使用者形成辦法，對於協同過濾的應用非常必要。

劇多

協同過濾中的可擴充套件性問題是什麼？

相關內容