自然語言處理(Natural Language Processing,簡稱NLP)就是用計算機來處理、理解以及運用人類語言(如中文、英文等),它屬於人工智慧的一個分支,是計算機科學與語言學的交叉學科。它涉及與語言處理相關的資料探勘、機器學習、知識獲取、知識工程、人工智慧研究和與語言計算相關的語言學研究等。
在我的理解裡,自然語言處理的一個主要特徵,就是用現代計算機的科學方法,來解決一些語言學相關的問題,最終為現實生活服務。語言學知識在這裡起到的是一個大方向的作用,同時,自然語言處理的誕生一定程度上是因為語言問題而產生的(美國企圖用密碼方法實現翻譯俄文檔案的目的),語言學在自然語言處理學科內佔據基礎性的地位;它不是主要的學習內容,不是主要的研究方法,但它是這個學科的最根本的底色。
自然語言處理大部分學習內容是計算機科學相關的,因為說到底它是一門偏技術的,應用導向的學科,很難講,它的哪一部分特別需要語言學的知識。但是,語言學的知識在自然語言處理中無處不在。
這和語言同我們的關係一樣。我們生活在語言的世界中,用語言思維,用語言交流,用語言概念化這個世界,用語言搭建起自身同他人乃至同整個外在世界的橋樑。但是,我們絕大多數人意識不到這個和我們密切相關的事物。它就在我們身邊,如同空氣和水,沒有語言,我們失去的有可能是我們之所以為人的那個最核心的東西。我們感覺不到它,正說明了它對我們是多麼的重要。
我們身邊最常用的一些技術,都是需要自然語言處理的。最常見的,搜尋引擎,其智慧程度取決於它的演算法。比如,中文的智慧輸入法,比如機器翻譯,比如語音輸入,人工智慧領域,等等。自然語言處理誕生於對自然語言進行處理的需要,而這一需要在現階段資訊爆炸的大資料時代尤為重要。如何對這些資料進行篩選和處理,我認為計算機技術和語言學知識,在其中扮演的角色同樣重要。
自然語言處理(Natural Language Processing,簡稱NLP)就是用計算機來處理、理解以及運用人類語言(如中文、英文等),它屬於人工智慧的一個分支,是計算機科學與語言學的交叉學科。它涉及與語言處理相關的資料探勘、機器學習、知識獲取、知識工程、人工智慧研究和與語言計算相關的語言學研究等。
在我的理解裡,自然語言處理的一個主要特徵,就是用現代計算機的科學方法,來解決一些語言學相關的問題,最終為現實生活服務。語言學知識在這裡起到的是一個大方向的作用,同時,自然語言處理的誕生一定程度上是因為語言問題而產生的(美國企圖用密碼方法實現翻譯俄文檔案的目的),語言學在自然語言處理學科內佔據基礎性的地位;它不是主要的學習內容,不是主要的研究方法,但它是這個學科的最根本的底色。
自然語言處理大部分學習內容是計算機科學相關的,因為說到底它是一門偏技術的,應用導向的學科,很難講,它的哪一部分特別需要語言學的知識。但是,語言學的知識在自然語言處理中無處不在。
這和語言同我們的關係一樣。我們生活在語言的世界中,用語言思維,用語言交流,用語言概念化這個世界,用語言搭建起自身同他人乃至同整個外在世界的橋樑。但是,我們絕大多數人意識不到這個和我們密切相關的事物。它就在我們身邊,如同空氣和水,沒有語言,我們失去的有可能是我們之所以為人的那個最核心的東西。我們感覺不到它,正說明了它對我們是多麼的重要。
我們身邊最常用的一些技術,都是需要自然語言處理的。最常見的,搜尋引擎,其智慧程度取決於它的演算法。比如,中文的智慧輸入法,比如機器翻譯,比如語音輸入,人工智慧領域,等等。自然語言處理誕生於對自然語言進行處理的需要,而這一需要在現階段資訊爆炸的大資料時代尤為重要。如何對這些資料進行篩選和處理,我認為計算機技術和語言學知識,在其中扮演的角色同樣重要。