回覆列表
  • 1 # 矽釋出

    一個路子是用自然語言處理分析使用者體驗調查結果(使用者反饋)。

    透過分析使用者反饋,可以:

    透過進行情緒或基於主題的時間序列分析來發現隱藏的趨勢和模式透過執行異常檢測查詢可能在QA中漏掉的錯誤和設計問題根據使用者反饋獲得執行A / B測試的新機會了解使用者的功能請求/需求將客戶區分為有針對性的訊息 - 例如,可以識別所有不滿意的客戶或要求提供某些功能的人員,並且如果有非匿名數有具體的目標 - 如實時查詢使用者情緒瞭解你的資料 - 是大還是小?資料是來自多個數據源還是有中斷的時間序列資料?明智地選擇環境/庫/ API根據你的目標選擇分析決定分析結果是誰,以及他們將如何處理 - 這是A / B測試嗎?是否要進入產品線?生成報告還是建立實時儀表板?

    瞭解清理資料可能需要的預處理技術型別非常重要。使用者反饋資料非常骯髒,包含HTML標籤,語法錯誤,表情文字(希望轉換成情感分類器可以獲取的標記),併發誓在分析使用者情感時還想保留的詞。

    需要建立自定義停用詞列表並忽略包含小於某些令牌閾值的簡短註釋。“我喜歡這個”並不是有見地的資料,但是如果你正在進行情緒分析,它會歪曲你的總體情緒分數,而不會讓你知道他們指的是什麼,或者他們覺得自己的方式如何。但是,如果在大型設計釋出後檢視使用者情緒,則可能希望保持這種情緒,如果對使用者指的是什麼有好的想法。

    當然,應該使用stemmer或lemmatizer,並希望透過Scikit-Learn的CountVectorizer或R的 RemoveSparseWords來增加稀疏性,以幫助開發有意義的群集,並減少建立適合資料的模型的機會。

  • 中秋節和大豐收的關聯?
  • 請教下鑄鐵暖氣片漏水怎麼辦?