回覆列表
  • 1 # 東方林語

    自然語言處理(NLP)是人工智慧領域從感知智慧邁向認知智慧領域最關鍵的技術之一。

    自然語言處理融合了語言學、計算機科學、人工智慧等多種科學,最主要的目的是解決“讓機器可以理解自然語言”的問題。

    要知道,認知智慧到目前為止,都還只是我們人類獨有的“特權”與技能,因此,被譽為人工智慧CROWN上的明珠。

    必須掌握的一些理論知識

    1.必須要掌握的一些數學基礎知識

    具體來說主要包括:微積分、線性代數、機率論和統計學四大基礎課程。

    尤其是需要掌握機率論、資訊理論、貝葉斯法則等這些最基本知識。

    2.必須的機器學習知識

    最最佳化模型是人工智慧機器學習的“核心與靈魂”,幾乎每個價值巨大的技術學習模型背後,本質上都是一個最最佳化模型。

    科技抽象於生活,科技也是為了更好的服務生活。每個機器學習模型背後都是一個最最佳化問題。為了尋找這個世界裡的最優解,我們需要掌握最大似然估計/最大後驗估計、梯度下降法等基礎知識。

    為了讓機器可以像人一樣思考,對機器學習、深度學習等框架,要有一個系統的瞭解。

    另外需要重點掌握邏輯迴歸/因子分解機,最大熵模型/條件隨機變換場,主題模型、各種預訓練模型等機器學習模型的相關概念、原理、優劣勢、具體應用場景等相關內容。

    必須掌握的一些實戰知識

    1.大資料相關的一些基礎知識

    具體包括Linux作業系統、分散式系統、Hadoop等計算機基礎知識。

    2.圍繞NLP相關知識,需要掌握的一些術語。

    具體包括如下術語與知識點:

    tf/df/idf

    IG/CHI/MI

    PageRank

    相似度計算

    3.系統瞭解搜尋引擎是如何搭建的

    包括搜尋引擎原理、搜尋引擎架構、搜尋引擎的核心模組等,並瞭解搜尋引擎的最主要盈利模式,廣告系統是如何搭建的。

    4.瞭解如何讓機器猜的更準

    為了讓機器猜的更準,需要掌握幾種關鍵的演算法。比如:

    基於協同過濾的推薦演算法

    基於內容的推薦演算法

    混合推薦演算法

    讓機器理解人類的語言,是一件非常困難的事情。比如詞法分析、句法分析、語義分析、知識庫等,每個環節都很關鍵,任何一個環節機器“理解”不到位的話,就會“失之毫釐差之千里”。

    藉助自然語言處理與知識圖譜等這些人工智慧領域的細分技術,實現從感知智慧向認知智慧的邁進。

    總結來說,想要系統的學習並掌握自然語言處理這個技能,需要我們多學習、多思考、多實戰……

  • 中秋節和大豐收的關聯?
  • 做生意實在了是不是就要吃虧呢?