-
1 # 科技明航
-
2 # 魏智勇
在吳恩達最新的人工智慧課程中,對人工智慧和資料科學的劃分比較有典型性。因為人工智慧和資料科學你中有我、我中有你的特點,這種區分往往連從業者也很難說清楚。從語言和工具上講,兩者都是利用機器學習的方法對資料進行分析,這一點是相同的。但人工智慧專業方向更多的是需要打造實時系統,根據模型對實時資料進行分析和作出判斷,比如無人駕駛系統,或者反垃圾郵件系統等等都是如此。相比之下,資料科學更側重對歷史資料的分析,並據此作出預測或判斷,比如銷售市場關鍵因素分析等等。從成果上看,人工智慧的專案成果更可能是一套軟硬體系統而資料科學則可能是一份分析報告或者PPT。
機器學習,深度學習都是人工智慧與資料科學專業的子集,可以理解為實現這兩種目的的手段。
-
3 # EmacserVimer
作為一個對資料科學、人工智慧等非常感興趣的行業從業者,這個問題我來回答一下。
什麼是資料科學?資料科學是一個比較廣義的學科門類,分為資料分析、資料建模等多個不同的方向,前面一種稱為A型資料科學、後面一種稱為B型資料科學。
感興趣的同學可以自己去Google搜尋一下,這裡不再贅述。
什麼是統計學?統計學是應用數學的一個重要分支,主要透過機率論來建立數學模型。
統計學主要透過收集觀察系統的資料,最終來進行量化分析、總結,最終得到結果推斷、或者預測,為決策提供資料依據或者說參考。主要在分析資料的基礎上,測算、收集、整理、歸納,並且最終分析資料。
什麼是人工智慧、機器學習以及深度學習?這是三個專業詞彙是相關性非常大的三個名詞,機器學習是人工智慧的一個子集、深度學習又是機器學習一個非常重要的研究子集。
人工智慧,顧名思義就是研究以及開發用於模擬人的智慧的理論、方法、技術以及應用的一門科學,是計算機科學的一個重要分支。人工智慧研究的專案包括自然語言處理、機器人、無人駕駛、影象識別、音訊識別、個性化推薦等眾多研究方向。
機器學習是人工智慧科學的核心,透過機率論、統計學、逼近論、凸分析、演算法複雜度等眾多學科門類,來專門研究如何透過計算機來模擬人的學習行為,從而讓機器也獲得學習知識、技能、甚至重組知識結構的能力,本質上是歸納和綜合。
深度學習是機器學習的重要研究領域,是一種以神經網路為骨架,對資金進行表徵學習的演算法。旨在建立、模擬人腦進行分析學習的神經網路,模仿人腦的執行機制來解釋資料,尤其是影象、聲音、文字等。深度學習是機器學習中基於對資料進行表徵學習的方法,目前有卷積神經網路、深度神經網路、深度置信網路、一鍵滴灌神經網路,在計算機語音識別、計算機視覺識別、自然語言處理、生物資訊學等眾多領域都得到了使用。
-
4 # 讀芯術
1、資料科學(DS)
簡單定義為:資料科學是從資料中提取有用知識的一系列技能和技術。
這些技能通常用德魯·康威(Drew Conway)創造的維恩圖(或它的變體)來表示:
三個圓圈分別代表三個不同的領域:程式設計領域(語言知識、語言庫、設計模式、體系結構等);數學(代數、微積分等)和統計學領域;資料領域(特定領域的知識:醫療、金融、工業等)。
這些領域共同構成了定義中的技能和技術。它們包括獲取資料、資料清理、資料分析、建立假設、演算法、機器學習、最佳化、結果視覺化等等。
資料科學彙集了這些領域和技能,支援和改進了從原始資料中提取見解和知識的過程。
什麼是“有用的知識”?就是可以具有某種價值、可以回答或解決現實世界中問題的知識。
資料科學也可以定義為:研究應用資料處理和分析方面的進展,為我們提供解決方法和答案的領域。
2、人工智慧機器能思考嗎?1950年,艾倫·圖靈(Alan Turing)提出了這個問題,他甚至發明了一個著名的測試,來評估機器給出的答案是否與人類的答案相似。從那以後,對人工智慧的幻想就開始了,重點在於模仿人類行為。
你做過那個測試嗎?
人工智慧不是《銀翼殺手》中的複製人,也不是《太空堡壘卡拉狄加》中的賽昂人。我們可以把人工智慧定義為任何具有某種智慧行為的機器或軟體。
什麼是智慧行為?
問得好!這就是有分歧的地方。隨著機器不斷被開發出新功能,以前被認為是智慧的任務也從人工智慧環境中剝離了出來。
我們可將人工智慧定義為能夠從其環境中正確解釋資料、從中學習,並在不斷變化的環境中使用所獲得的知識來執行特定任務的機器或軟體。
例如:一輛會自行停車的汽車不是智慧汽車;它只是按照常規測量距離和移動。我們認為能夠自動駕駛的汽車就是智慧的,因為它能夠根據周邊發生的事件(在完全不確定的環境中)做出決定。
人工智慧領域包括幾個分支,它們目前正處於鼎盛時期。將其視覺化後就能準確地知道我們在說什麼:
3、機器學習機器學習是人工智慧最重要的分支。它的任務是:研究和開發技術,使機器能夠在沒有人類明確指令的情況下自學,從而執行特定的任務。
機器將從輸入資料集(稱為樣本或訓練資料)中學習,根據演算法檢測到的模式建立數學模型。該模型的最終目標是對之後來自相同資料來源的資料進行(準確的)預測或決策。
傳統的機器學習主要有兩種型別:
· 監督學習:當訓練資料被“標記”時。這意味著,對於每個樣本,我們都有與觀察到的變數(輸入)和我們想要學習預測或分類的變數(輸出、目標或因變數)相對應的值。在這種型別中,我們找到了迴歸演算法(預測數值的演算法)和分類演算法(輸出僅限於某些分類值時)。
· 無監督學習:當訓練資料沒有標記時(我們沒有目標變數)。這裡的目標是找到某種結構或模式,例如對訓練樣本進行分組,這樣我們就可以對未來的樣本進行分類。
傳統的機器學習已經讓位於更復雜或更現代的學習型別:
· 整合方法:基本上是幾種演算法聯合使用,將它們的結果結合起來以獲取更好的結果。儘管XGBoost憑藉在Kaggle的勝利而得名,但最常見的例子還是隨機森林。
· 強化學習:機器透過反覆試誤來學習,這得益於它對周圍環境的迭代做出的反饋。你可能聽說過AlphaGo或AlphaStar(在《星際爭霸2》中實力碾壓人類)。
· 深度學習:CROWN上的寶石……
4、深度學習深度學習是機器學習中的一個子領域。
它基於人工神經網路的應用。人工神經網路是一個計算模型,具有分層結構,由相互連線的節點共同工作而形成。這個名字的靈感來自(或試圖模仿)大腦的生物神經網路。
雖然神經網路已經被研究和使用多年,但該領域的進展一直很緩慢;主要是限於計算能力不足。儘管深度學習近些年來取得蓬勃發展,這多少要歸功於神經網路訓練採用了CPU,但其開始不過才十年。
人們普遍認為:任何機器學習問題,無論多麼複雜,都可以透過神經網路解決,只要把它做得足夠大就行了。如今,深度學習的發展帶動了人工智慧其他領域的發展;無論是更傳統的領域(改善獲得的結果),還是最流行的領域:自然語言處理、人工視覺、語音識別、逼真多媒體內容的生成等。
我們一起分享AI學習與發展的乾貨
-
5 # 柏蓉
這個困惑很正常。
我先來講一個人工智慧簡單的歷史,真的很簡單那種。
AI發展了半個多世紀,吸收各個領域的精髓(統計學,生物進化學,神經科學),經歷兩次低谷和轉折,這個過程讓其不斷壯大成長。
在很長一段時間裡,AI被“符號主義(起源於邏輯學和哲學,是一種基於邏輯推理的智慧模擬方法)”統治,但在20世紀80年代,“新AI ”出現,大眾稱之為“機器學習”。而後來即2010年左右,出現“Simple Learning”和“深度學習Deep Learning”。
人工智慧>機器學習>深度學習,是集合和子集的關係。
人工智慧如大家所理解,機器具備智慧。它屬於一個概念。
機器學習的本質是:使用演算法解析資料,讓其學習並作出預測,這是人工智慧的一個部分。它屬於一個學科。
而深度學習則是實現機器學習的一種方法(還有機率圖模型等等)。它屬於一種技術。
最近幾年,深度學習都很火,原因是硬體的計算能力以及研究的突破,比如2010年,ImageNet大規模視覺識別挑戰賽(ILSVCR)開始舉辦,比賽一年一度。2012年10月:多倫多大學設計的卷積神經網路參加該,錯誤率只有16%,比往年25%的錯誤率大幅改進。
深度學習究竟深度在哪裡呢?在於神經網路的層數。很早之前,研究人就借鑑人腦的神經元傳遞資訊的方式打造人工神經網路。舉個例子,首先把照片分成顏色,圖形等很多資訊點,然後輸入第一層神經網路,第一層神經網路執行完自己的任務之後,賦予每一個資訊點一定的權重,又把照片的資訊輸入第二層,以此類推。最後得到一個不同資訊權重相加:人物照片15%,貓貓照片80%,樹木5%。最後會輸出這張照片有貓貓。
PS:從廣泛意義上,人們認為AI的誕生是1956年。但AI概念的提出時間則是1955年8月31日,在一個持續2個月、只有10個人參加的達特茅斯夏季研討會上。在這次研討會上,人們對AI給出的定義是:
“嘗試找到如何讓機器使用語言、形成抽象和概念、解決現在人類還不能解決的問題、提升自己等等。對於當下的人工智慧來說首要問題是讓機器像人類一樣能夠表現出智慧。
到這裡,就剩下統計學和資料科學。
統計學就是統計學,沒什麼好弄不清楚?就是一門很普通的學科,我大學就是學這個。而資料科學,我的理解更多是一個職業。
人工智慧裡面涉及這些一點都不要感到驚訝。因為,人工智慧有一個門派叫貝葉斯學派,使用機率規則及其依賴關係進行推理的一派。上面出現的機率圖模型就是吸取統計學的精華。
人工智慧涉及的學科真的很廣泛。
回覆列表
二百多年前,英國的狄更斯曾說道:“這是一個最好的時代,這也是一個最壞的時代。”隨著計算機及移動網際網路的普及,我們已經步入大資料時代。如今湧出了一系列高大上的詞彙,如人工智慧(Artificial Intelligence,簡稱AI)、機器學習(Machine Learning,簡稱ML)以及深度學習(Deep Learning,簡稱DL等等。
自認為學習資料科學已經有些時日了,常常聽到統計學、人工智慧、機器學習、資料探勘、機器學習、資料分析….自己也曾迷茫,自己究竟算哪個方向的呢?下面簡單說下我的看法。
如果對機器學習、資料科學、人工智慧之間的區別作個間短的定義:機器學習重在預測
資料科學重在見解
人工智慧重在行為
古語說,凡事預則立不預則廢。這就是機器學習,根據已有的資料,對未來可能發生的事情進行預測,這就是機器學習最重要的特點。
而資料科學側重點不一樣,可能與分佈資料商店合作,分析數以萬億計的資料,開發前沿的統計技術,建立互動式視覺化。不管使用什麼,目的是為了更好地理解資料。
人工智慧,簡稱AI,目前媒體炒的很火。上文提到的機器學習就是人工智慧領域的一個分支,也就說,人工智慧是一個大概念。人工智慧負責自主代理人執行或推薦操作。
另外深度學習也是屬於人工智慧的範疇,但也有區別,目前對深度學習的解釋:我們已經擁有了可以商用的機器,只要給它們足夠多的資料和足夠長的時間,它們就能夠自己學習。雖然有點誇張,深度學習能夠自主學習不斷進步。
統計學相對於其它發展歷史還是很悠久的,如今是資料科學(Data Science)的重要主軸之一,納入到資料科學龐大的體系之中。
舉個例子,幫助理解人工智慧、機器學習、資料科學之間的區別。如果有一輛無人駕駛汽車正在路上行駛,前方出現了一個停車標識,接下來怎麼運用到這些技術?前面說過,機器學習重在預測、資料科學重在見解、人工智慧重在行為。
機器學習透過攝像頭,採集路邊的物體照片,來預測哪些路邊有停車標識。
人工智慧在識別停車標識之後,決定在何時踩剎車。
資料科學則是透過街頭測試結果,來判斷這輛無人駕駛車的效能。