回覆列表
  • 1 # RyanUniform

    確實是平時做nlp最頭大的事情。幾點建議:

    1. 資料增強

    先說影象,影象有個優點,就是比較容易做資料增強,可以旋轉、裁剪、縮放、加噪聲、或者組合上述方法等等,然後迅速得到很多樣本,雖說這種擴充套件有限,但對模型學到魯棒的特徵應該是有幫助。回到nlp,如果參照上述做法,似乎也可以,不過畢竟文字降到一維了,所以也沒啥旋轉,不過可以加噪聲、縮放等等,只能做到讓模型更魯棒,但沒辦法學到更好的新的特徵。

    2. 遷移

    網路上肯定能找到與對應場景相關的語料,沒有就爬蟲。現在基於nlp的遷移學習文章挺多的,可以參考。這個展開可以單獨寫很多篇文章

    3. 半監督

    如果語料不缺,缺的是標註,可以這麼玩

    4. 人造……人類的智慧是無窮的

  • 2 # 良婷

    用類似BERT的模型,只需少量資料就可達到很好的效果,因為它是基於預訓練模型(谷歌等用無監督方式訓練好的)+微調(用自己的少量標註資料)的模式,屬於遷移學習

  • 中秋節和大豐收的關聯?
  • 足球各項技術訓練方法?