回覆列表
  • 1 # 智東西

    最近幾年人工智慧概念的火熱很大程度上是因為隨著計算能力的發展(此處可cue英偉達)深度學習演算法在應用落地方面大放異彩(主要是影象和語音的識別和分類上)。

    在2012年的ImageNet影象大賽上,多倫多大學的Geoffrey Hinton教授(現在的深度學習三巨頭之一)就帶領著團隊使用深度學習進行機器訓練與影象識別,錯誤率只有15.3%,成為影象識別學科歷史上的一個重要節點。

    2015年的ImageNet影象大賽上,微軟亞洲研究院團隊的系統錯誤率低至3.57%,第一次超越了人類。

    2016年,人工智迎來了自學科建立60年以來最大規模的市場應用爆發潮。承藉著深度學習在計算機視覺領域的首先爆發,雲計算平臺、顯示卡、晶片等的研發成為行業熱點,而數字醫療、智慧家居、自動駕駛、語音助手等應用也獲得了極大的突破。

    扯遠了,在回答這個問題前,首先要把幾個概念搞清楚,“人工智慧(AI)”、“機器學習”、“深度學習”、“卷積神經網路”。

    以下概念範圍從大到小:

    人工智慧(Artificial Intelligence)是一個非常大的範疇,包括感知智慧、認知智慧、運動智慧等等,又可以分成強人工智慧和弱人工智慧,攻殼、機器姬之類的屬於前者。機器學習(Machine Learning)是人工智慧的一種方法,也是現在比較受歡迎的一種主流思想,可以顧名思義地理解成讓機器學會學習。

    深度學習(Deep Learning)是機器學習的一種,也是現在非常火熱的一個研究方向。深度學習中的“深度”,最簡單理解就是“有很多層”。

    “深度學習的深度,指的是超過一層的非線性特徵轉換。(It’s deep if it has more than one stage of non-linear feature transformation)”——Yann LeCun(“卷積神經網路之父”、現任Facebook人工智慧研究院的院長、美國紐約大學教授、深度學習三巨頭之一)卷積神經網路(Convolutional Neural Network,CNN)則是深度學習的一種方法,安排深度學習的深層架構可以透過直接堆疊,也可以透過卷積神經網路。

    所以我們回到問題上,“想做一個人工智慧的東西”這個表達比較含糊,如果你說想造一個素子小姐那短期內還是不太可能的……如果你說想利用深度學習、機器學習來打造一款AI應用,比如影象分類、影片處理、人臉識別之類的,還是可行的。

    上文提到的Yann LeCun大神就曾經回答過這個問題:

    首先,你需要盡一切可能把所有具有連續性的數學和物理課程都上一遍。微積分(I)、 微積分(II), 微積分(III)、線性代數、機率論、統計學這幾項是必不可少的,另外你還需要儘可能多的去聽物理學的課程,貝葉斯推理、反向傳播演算法、傅立葉變換等等未來都會用到。

    如果必須要在“iOS程式設計”和“量子力學”之間選一門,一定要選量子力學。不過與此同時,你還是要確保學習程式設計……

    看到這裡還沒有點小叉叉的同學,給你一朵小紅花。

    一旦你形成了自己的想法,就開始讀書、讀論文。網上也有很多關於機器學習、深度學習的材料、教程和影片課程,但是建議你先思考-再讀書-最後看教程。

    小智插話:對於中國學生而言,你還需要確保自己的英語水平常年保持在6級以上。畢竟所有大牛的論文都是英文的……

    讀完之後你將會發現,(1)你之前的想法有點幼稚,但是(2)你對這個問題的看法開始有點不一樣了。

    接著,如果你是個本科生,你就可以去勾搭教授了,清華、中科院、北航等都是業內不錯的院校,英語好的可以去勾搭國外教授。但是鑑於你現在也沒有發表什麼作品,教授勾搭不到的話,轉而勾搭博士/博士後也是可以的。

    對於已經工作了的人來說,有幾個線上文獻/課程可以參考。

    2015年5月《自然》雜誌上刊登的一篇概述性論文《深度學習》(Deep learning),由深度學習三巨頭(Yann LeCun、Yoshua Bengio 、Geoff Hinton)共同撰寫。

    地址戳:http://www.nature.com/nature/journal/v521/n7553/abs/nature14539.html

    系統性的課本方面,Yann LeCun推薦由Goodfellow、Bengio 和 Courville共同撰寫的《深度學習》(Deep learning)

    地址戳:http://www.deeplearningbook.org

    此外,Facebook、英偉達等也都設立了AI相關的線上/線下課程教程、還有Caffe、Torch、TensorFlow、Theano等這幾大開源平臺的使用手冊、最近國內外各類的AI大會也都層出不窮……想學東西的方法很多,這只是其中一條路而已。

  • 2 # _Pinnacle

    如果只想調兩個包,得先把計算機軟體搞定吧?當然也不夠,還得熟悉基本演算法,要深入先把大學應用數學與計算機軟體的課程過了,再說人工智慧吧,不怕嚇著初學者。以下為列舉基礎課程:基本微積分,機率論,統計推斷,圖論,博弈論,線性代數與矩陣論,近世代數,數理邏輯,實變函式,泛函分析,凸最佳化... 計算機軟體也有很多課程,至少會一門語言吧,C,C++,Java,Python,Scala,MATLAB...隨便選,設計模式,計算機原理要知道吧,編譯原理了解,演算法導論不說了,其他還有很多。然後談AI,AI也很廣,什麼機器學習與模式識別,計算機視覺,自然語言處理,資料探勘,機器人等各個方向,但是都會有機器學習作基礎,每個方向又有不同的東西。機器學習也不單純,機器學習裡面又包含很多大的子類課程,貝葉斯統計與機率圖模型又可以開一門課了,然後神經網路與深度學習等等。還要熟悉基本的package不同語言不太一樣,機器學習庫,不同分支不一樣。隨便英語怎麼也得六級以上水平吧,很多文獻沒得中文。到這裡差不多看你有啥感想。

  • 3 # 毀人不倦中

    沒有那麼複雜,普通程式設計師具備一定的資料處理能力就可以做到訓練一些比較簡單的模型。但是要做到對模型的理解需要一些數學知識。另外對於不同模型的使用和最佳化需要一個比較長時間的積累。懂英文的話有大量的影片教學錄影。起步很容易。簡單模型應用可從python scikit-learn開始。開源的各種高大尚模型五花八門,可以慢慢來了解使用。

  • 4 # 北航秦曾昌

    其實這個問題有不同但是類似的回答。 比如我曾寫過一個帖子,是關於機器學習演算法入門的。

    https://www.wukong.com/question/6471766024940159245/

    1) 但是機器學習也只是人工智慧的一部分。 人工智慧還包括了機器視覺、語音識別、自然語言處理、博弈系統、進化計算、專家系統、匹配推薦等等。 也可以外延到智慧機器人、自動駕駛、智慧搜尋、競價排名、自動醫療診斷、醫療影象、遊戲、密碼等等。

    2)在應用領域就更廣泛了,最近提出的無人機倉儲、送貨,智慧物流、甚至Amazon提出了Fashion Technology,自動問答、自動客服、人機對話、智慧助手等等。 根據《烏鎮指數:全球人工智慧發展報告(2016)》,應用領域可以大概分如下領域:(1)個人助理(智慧手機上的語音助理、語音輸入、家庭管家和陪護機器人)(2)安防(智慧監控、安保機器人) (3)自駕領域(智慧汽車、公共交通、快遞用車、工業應用) (4)醫療健康(醫療健康的監測診斷、智慧醫療裝置)(5)電商零售(倉儲物流、智慧導購和客服) (6)金融(智慧投顧、智慧客服、安防監控、金融監管)(7)教育(智慧評測、個性化輔導、兒童陪伴)

    3)推薦科普書籍,我在上面給定的連結中有了一些教科書,推薦一下科普書籍,下面的兩本書我從大學的時候就開始讀,雖然技術更新很快,前兩本也是大概20年前的,但是裡面深刻的思想和大科學家淵博的知識和廣泛的思路值得推廣。 第三部是最近的關於機器學習的科普書,有趣的是,我在讀碩士的時候還讀過作者的學術論文。

    A.《哥德爾、艾舍爾、巴赫:集異璧之大成》

    B.《皇帝新腦》

    作者: 羅傑·彭羅斯 出版社: 湖南科學技術出版社副標題: 有關電腦、人腦及物理定律原作名: The Emperor"s New Mind: concerning computers, minds, and the laws of physics譯者: 許明賢 / 吳忠超

    C.《終極演算法:機器學習和人工智慧如何重塑世界》[The Master Algorithm]

  • 5 # 由科技

    人工智慧,幾經波折,起起落落。2016年3月,AlphaGo在圍棋領域擊敗了南韓頂尖棋手李世石之後,它的熱度又一次被點燃,瞬間成為了家喻戶曉的科技明星。

    那麼類似這種棋譜策略遊戲方面的人工智慧,它是什麼樣的技術呢?

    人工智慧(Artificial Intelligence),即AI,它是計算機科學的一個分支,它是研究、研發用於模擬、延伸和擴充套件人的智慧的理論、方法、技術及應用系統的一門新的技術科學。

    它企圖瞭解智慧的本質,並且能以人類的智慧方式做出反應的智慧機器,該領域的研究包括語音識別、影象識別、自然語言處理等。

    人工智慧的概念比較寬泛,它包括機器學習和深度學習,並且每次技術的變革都是在解決相關智慧技術遇到的瓶頸問題。

    比如:深度學習在機器學習的基礎上引入了神經網路,它可以自動學習特徵和任務之間的關聯,還能從簡單特徵中提取複雜的特徵,這樣就解決了傳統機器學習特徵提取問題難的弊端。

    演算法一:邏輯迴歸(Logistic Regression, LR)

    它為邏輯迴歸分析,是分類和預測演算法中的一種。採用的是監督學習的方式,透過分析歷史資料特徵來對未來事件發生的機率進行預測。

    代表函式是sigmoid函式,它具有我們需要的一切優美特性,其定義域在全體實數,值域在[0, 1]之間,並且在0點值為0.5。公式如下:

    那麼,如何將f(x)轉變為sigmoid函式呢?

    設p(x)=1即為表示具有特徵x的樣本被分到類別1的機率,那麼p(x)/[1-p(x)]則被定義為讓步比(odds ratio)。

    為了解除p(x),則引入對數:

    那麼可得:

    此時的p(x)這就是需要的sigmoid函式。如果要機器學習,那麼根據已知資料,擬合出該式中n個引數c即可。

    演算法二:決策樹

    它的思想是:尋找一種演算法,計算機可以根據該演算法完成像if-else結構一樣從根開始不斷判斷選擇到葉子節點的樹,這樣的樹就稱為決策樹。

    該方法的重點就在於如何從這麼多的特徵中選擇出有價值的,並且按照最好的順序由根到葉。

    資訊增益則是最常見的演算法之一。它劃分資料集的規則是將無序的資料變得更加有序。它涉及到資訊的有序無序問題,那麼就要考慮資訊熵(另一種方法是基尼不純度)了。

    熵在資訊理論中代表隨機變數不確定度的度量。一個離散型隨機變數 X的熵 H(X)定義為:

    P(x),i=1,2,…,X為信源取第i個符號的機率

    資訊熵用來衡量資訊量的大小:

    若不確定性越大,則資訊量越大,熵越大;

    若不確定性越小,則資訊量越小,熵越小。

    比如我們要計算“夏天下雪”這個事件的資訊熵,這個資訊量很大,那麼熵也很大。

    該演算法計算複雜度不高,輸出結果易於理解,對中間值缺失不敏感,可以處理不相關的特徵資料,它是一種非引數的監督式學習的方法,常常用於分類和迴歸。

    情況三:樸素貝葉斯

    在機器學習分類演算法中,樸素貝葉斯和絕大多數的分類演算法不同。

    例如:邏輯迴歸(LR),svm,決策樹,KNN等等,這些都是判別方法。

    他們是直接學習出特徵輸出Y和特徵X之間的關係:決策函式Y = F(X)或條件分佈P(Y|X),然而樸素貝葉斯是生成方法,它直接找出特徵輸出Y和特徵X的聯合分佈P(X,Y),則可知:P(Y|X) = P(X,Y)/P(X)

    首先回顧一下樸素貝葉斯相關的統計學知識:

    貝葉斯的思想可以等效為:先驗機率+資料=後驗機率。

    一般來說先驗機率就是我們對於資料所在領域的歷史經驗,但是這個經驗常常難以量化或者模型化,那麼我們可以假設先驗分佈的模型,比如正態分佈,高斯分佈等。

    假如X和Y相互獨立,則有:

    假如X和Y不相互獨立,則公式:

    Or:

    那麼,則有全機率公式:

    從上面的公式很容易得出貝葉斯公式:

    該演算法在scikit-learn中,一共有3個樸素貝葉斯的分類演算法類。

    它們分別是GaussianNB,BernoulliNB和MultinomialNB。

    其中:

    1)GaussianNB表示先驗為高斯分佈的樸素貝葉斯;

    2)BernoulliNB表示先驗為伯努利分佈的樸素貝葉斯;

    3)MultinomialNB表示先驗為多項式分佈的樸素貝葉斯。

    這三個類適用的分類場景各不相同,一般來說:

    1)假如樣本特徵的分佈絕大部分是連續值,使用GaussianNB;

    2)假如樣本特徵是二元離散值或者很稀疏的多元離散值,則BernoulliNB;

    3)假如樣本特徵的大部分是多元離散值,使用MultinomialNB。

    總之在很多實際應用中,貝葉斯理論很好用,比如垃圾郵件分類,文字分類。

    總之機器學習演算法是構架深度學習神經網路的基礎,只有我們打好了基礎,我們才能更好的學習,深度學習的精髓。

  • 6 # 合肥新華電腦

    優秀的資料分析師需要具備這樣一些素質:有紮實的 SQL 基礎,熟練使用 Excel,有統計學基礎,至少掌握一門資料探勘語言(R、SAS、Python、SPSS),有良好的溝通和表達能力,做好不斷學習的準備,有較強的資料敏感度和邏輯思維能力,深入瞭解業務,有管理者思維,能站在管理者的角度考慮問題。

  • 中秋節和大豐收的關聯?
  • 端午節不應該是紀念伍子胥的嗎,怎麼都變成屈原了?