其實我個人是這麼認為的,首先學術流派,大家是百花齊放、百家爭鳴的,你也很難說,語言學知道就不頂用了,必須用資料驅動了深度學習。30年河東30年河西,有可能過一段時間,大家持之以恆發展基於人類知識的分析,也有可能他有很多的地方,反過來超越了你現在基於深度學習的方法。
所以,我是覺得,作為一個很好的研究人員,應該不待偏見,要包容合乎是鼓勵不同……各自發展,甚至是競爭,最後走向合作的趨勢。
舉個例子,其實比如說機器翻譯,原來都是基於規則的,後來有一派就基於統計和資料驅動,另一派的人就說我就不用,什麼語言知識最好不用,越用越倒黴,越用越水平不高。但是,又發現過了一陣子加上樹的結構,真的管事,所以又發現了一些基於數的模型。這個時候他就不說語言學知識沒用了,他說語言學知識有用,只不過我們原來不知道怎麼用。
所以,我個人認為,就是說這兩個流派的人應該都是包容的,還有的時候,在有一些資料很小的時候,比如說有一些語言就沒有什麼資料。用語言知識可以做一個冷啟動的措施就到位了之後,因為你執行起來有使用者用了,資料就來了。資料來了之後你仍然可以在重新用NMT或者是SMT,重新去一套你的系統,連原來的語言知識建立的系統,既幫你做冷啟動,也可以把他的知識再柔和到你的資料驅動中。
其實我個人是這麼認為的,首先學術流派,大家是百花齊放、百家爭鳴的,你也很難說,語言學知道就不頂用了,必須用資料驅動了深度學習。30年河東30年河西,有可能過一段時間,大家持之以恆發展基於人類知識的分析,也有可能他有很多的地方,反過來超越了你現在基於深度學習的方法。
所以,我是覺得,作為一個很好的研究人員,應該不待偏見,要包容合乎是鼓勵不同……各自發展,甚至是競爭,最後走向合作的趨勢。
舉個例子,其實比如說機器翻譯,原來都是基於規則的,後來有一派就基於統計和資料驅動,另一派的人就說我就不用,什麼語言知識最好不用,越用越倒黴,越用越水平不高。但是,又發現過了一陣子加上樹的結構,真的管事,所以又發現了一些基於數的模型。這個時候他就不說語言學知識沒用了,他說語言學知識有用,只不過我們原來不知道怎麼用。
所以,我個人認為,就是說這兩個流派的人應該都是包容的,還有的時候,在有一些資料很小的時候,比如說有一些語言就沒有什麼資料。用語言知識可以做一個冷啟動的措施就到位了之後,因為你執行起來有使用者用了,資料就來了。資料來了之後你仍然可以在重新用NMT或者是SMT,重新去一套你的系統,連原來的語言知識建立的系統,既幫你做冷啟動,也可以把他的知識再柔和到你的資料驅動中。