一、起源
提到人工智慧的歷史,所有書都會提到1956年度的達特茅斯會議,在這次會上人工智慧的鼻祖John mcarthy是發起人,minsky也 積極參與其中,包括我們課本上非常著名的提出資訊理論的夏農本人。
曾經麥卡錫和明斯基都曾經在貝爾實驗室為夏農打工,當時他們研究的核心就是圖靈機,並將此作為智慧活動的理論基礎。
後來麥卡錫到IBM打工,遇到了研究神經網路的羅切斯特並得到了洛克菲勒基金會的資助,決定在第二年達特茅斯召開人工智慧夏季研討會,這便是人工智慧名字的由來。
從1955年到1965年,人工智慧進入快速發展時期,在機器學習領域,出現了“跳棋程式”並在1959年實現了人工智慧戰勝人類的事件打敗了當時設計他的設計師Samuel,並在1962年,打敗了州跳棋冠軍。
在模式識別領域,1956年Oliver selfridge研發了第一個字元識別程式,並在1963年發明了符號積分程式SAINT,在1967年SAINT的升級版SIN就達到了專家級的水準。
同時美國政府也投入了2000萬美元資金作為機器翻譯的科研經費。當年參加達特茅斯的專家們紛紛發表言論,不出十年,計算機將成為世界象棋冠軍、可以證明數學定理、譜寫優美的音樂,並且在2000年就可以超過人類。
二、第一次寒冬
但在1965年人工智慧迎來一個小高潮之後,質疑的聲音也隨之到來,Samuel設計的跳棋程式停留在了戰勝周冠軍,機器翻譯領域因為一直無法突破自然語言理解(NLP),1966年的美國公佈了一份名為“語言與機器”的報告全盤否定了機器翻譯的可行性。
1969年,發起人之一的minsky發表言論,第一代神經網路(感知機perceptron)並不能學習任何問題,美國政府和美國自然基金會大幅削減了人工智慧領域的研究經費。在20世紀70年代人工智慧經歷了將近10年左右的寒冬時期。
三、第二次高潮與寒冬
直到80年代,人工智慧進入第二次發展高潮,卡耐基梅隆大學為日本DEC公司設計的XCON專家規則系統(專注於解決某一限定領域的問題,具備2500條規則,專門用於選配計算機配件,因此避免了常識問題)可以為該公司一年節省數千萬美金。
同期日本政府撥款8.5億美元支援人工智慧領域科研工作,主要目標包括能夠與人交流、翻譯語言、理解影象、像人一樣進行推理演繹的機器。
但是隨後人們發現,專家系統通用性較差,未與機率論、神經網路進行整合,不具備自學能力,且維護專家系統的規則越來越複雜,且日本政府設定的目標也並未實現,人工智慧研究領域再次遭遇了財政苦難,隨之人工智慧發展進入第二次寒冬。
四、第一次算力與演算法爆發
上世紀90年代,計算機在摩爾定律下的計算機算力效能不斷突破,英特爾的處理器每18-24個月電晶體體積可以縮小一倍,同樣體積上的積體電路密集度增長一倍、同樣計算機的處理運算能力可以翻一倍。
1989年,還在貝爾實驗室的楊立坤透過CNN實現了人工智慧識別手寫文字編碼數字影象。
1992年,還在蘋果任職的李開復利用統計學方法,設計了可支援連續語音識別的Casper語音助理(Siri的前身),在1997年IBM的國際象棋機器人深藍戰勝國際象棋冠軍卡斯帕羅夫(不再止步於州冠軍,第一次真正意義上的戰勝人類),同年兩位德國科學家提出了LSTM網路可用於語音識別和手寫文字識別的遞迴神經網路。
五、算力+演算法+資料三駕馬車聚齊:發展進入快車道
直到2006年,也就是我們身處的這不到20年的時間是當代人工智慧快速發展的階段,同年傑弗裡辛頓發表了《learning of multiple layers of representation》奠定了當代的神經網路的全新架構。
2007年還在Stanford任教的華裔女科學家李飛飛教授,發起了ImageNet專案,開源了世界上最大的影象識別資料集(超過1400萬、2萬多標註類別的影象資料集)。
在2006年亞馬遜的AWS的雲計算平臺釋出,進一步大幅提升了人工智慧網路模型計算所需要的算力。
同時,隨著2014年4G時代的到來與智慧手機大規模普及,移動網際網路的極速發展,催生了覆蓋人起居生活工作的方方面面的各色應用,帶來了神經網路訓練迭代所需的養料“海量的資料”,同時隨著IoT物聯網的興起、支援分散式計算(邊緣計算)的感測器時序(temporal)資料指數級生成。
六、技術發展離不開政府支援,中國將人工智慧列入國家戰略
2017年中國政府也引發了《新一代人工智慧發展規劃》明確了中國新一代人工智慧發展的戰略目標:到2020年,人工智慧總體技術和應用與世界先進水平同步,人工智慧產業成為新的重要經濟增長點,人工智慧技術應用成為改善民生的新途徑。
到2025年,人工智慧基礎理論實現重大突破,部分技術與應用達到世界領先水平,人工智慧成為中國產業升級和經濟轉型的主要動力,智慧社會建設取得積極進展;到2030年,人工智慧理論、技術與應用總體達到世界領先水平,成為世界主要人工智慧創新中心。
人工智慧發展簡史–符合事物發展本質-螺旋式上升
回顧人工智慧歷史發展的60多年間,有上升期、有瓶頸期、有寒冬期,但卻一直不斷的演進進步,正如恩格斯在《自然辯證法》所說,一切事物都是由螺旋形上升運動是由事物內部矛盾引起的,矛盾雙方經過反覆鬥爭,引起對立面的兩次否定,兩次轉化,事物的發展從肯定到否定再到否定之否定,形成一個週期性,每一週期的終點同時又是下一週期的開端。
一個週期接著一個週期,每一週期完成時出現彷彿向出發點的復歸,形成由無數“圓圈”銜接起來的無限鏈條,呈現出螺旋形的上升運動。
而如今的我們,正處在一個人工智慧高速發展時代,且已經滲透到人們日常生產、生活、工作的方方面面,大家可能會問,為什麼不是10年前、20年前而是現在?
這就不得不提人工智慧三要素,分別是:演算法、算力和資料,三者缺一不可。而人工智慧早期發展的瓶頸,很多都是因為你三要素的一種或者多種要素的缺乏,導致人工智慧產業陷入短暫的困境,如下圖所示。
而如今,隨著4G、5G基礎網路通訊設施的快速發展,使萬物互聯成為可能,全球有天文數字級別的人、裝置、感測器被連線,產生海量的資料,而這些資料正是人工智慧演算法模型迭代的充足養料。
而為什麼中國有建設成為人工智慧創新中心的底氣?因為我們國家在網路基礎設施建設方面在全球最為領先,移動互動聯網滲透人們生產生活最為徹底 ,“配送下鄉”的電商平臺淘寶、拼多多、京東,美團等網際網路“買菜”服務下沉到社群,村子裡在直播玩短影片的大爺大媽,每個人都不知不覺的在享受著“人工智慧”科技發展所帶來的紅利,同時也被“演算法”支配著時間。
困在演算法裡的外賣小哥、內容平臺利用推薦演算法向你定向投餵的“豬食內容”、“人臉”資訊被濫用,“演算法”的偏見與歧視,正如一切事物的兩面性一樣、技術的發展同時一定會帶來負面的影響,引發社會輿論的挑戰。
如何更好的保護人們的隱私的同時,讓演算法更好的為人們服務?如何讓人工智慧將來不會“覺醒”,失去控制甚至傷害人類?如何讓深度學習這個相對黑盒更具可解釋性,更安全、更魯棒?
相信諸位也跟我剛接觸這個領域一樣帶著許多困惑。這些學界和工業界都已經有一些嘗試與探討,我希望在這本書的有限章節中向你儘可能簡要但清晰的分享。
七、人工智慧的未來在哪?
未來人工智慧又將去向何從,會像是科幻電影里人工智慧終將覺醒、他們因為不具備”人性”可以更加理智的不會錯的進化統治甚至“奴役”人類?
還是由於人類生存活動使地球的生態環境不斷惡化,“病毒”不斷肆虐,人類無法外出,只能沉陷於由人工智慧創造的虛擬環境中,像是”頭號玩家”所描述的世界,在虛幻世界中實現”自我”價值?
雖然無法先知,但是可以預見的是,人工智慧未來一定會具備以下趨勢:
從專家系統轉向通用型的認知智慧,像是我們上文提到的早期只能針對問題解決問題的某個細分領域的人工智慧,未來的人工智慧是更加通用型的、在感知能力的基礎上具備像人一樣具備認知智慧,除了分類、歸納、檢測、識別具備推演、預測的能力;
深度學習模型從過去的黑盒不可解釋,變得更加具備“可解釋性”,從而透過演算法模型更公平、更安全、更魯棒;
深度學習向多模態發展,正如人類文明進行學習不僅僅是透過眼睛觀看,還有“口眼耳鼻舌身意、色相聲香味觸法”,因此深度學習需要多感測器的資訊融合進行模型學習訓練與判斷;
由於高階任務的帶標籤訓練資料十分匱乏,這會促使人們進一步研究稀疏資料環境中的學習技術,比如,小樣本學習和自我監督學習以及如何提升學習的效率以及如何讓學習的進度追趕上資料產生的進度,增量學習也是一個解決當前現狀的實用方向。
資料隱私和資料安全引起社會廣泛關注,如何保護隱私的前提下同時進行模型訓練迭代,聯邦學習已經被大多公司和組織廣泛使用。
八、總結
這本書適用於所有剛剛從其他行業轉型的AI產品經理,或作為一名剛畢業即將或者已經踏入職場的“新鮮人”,又或者是對於人工智慧這個行業感興趣想要了解的朋友們,希望透過我的一些經驗和案例總結濃縮了七節課,希望可以幫助大家瞭解人工智慧行業的同時,理解人工智慧產品經理這個崗位,甚至可以快速實操上手。
第一章,我們介紹人工智慧發展的介紹,從歷史到現狀再進一步嘗試預見其未來。
第二章,我們介紹進入人工智慧領域必知必會的基礎知識,包括人工智慧最為重要的三駕馬車,人工智慧、機器學習、深度學習之間的關係?對於AI產品經理需要理解的演算法模型,如何衡量演算法模型的好壞,如何建立評價體系?
第三章,我們介紹產品經理技能“方法論”,包括需求管理能力、向上管理能力、橫向管理能力、專案管理能力、產品管理能力包括如何完成一個產品從0到1的構建,包括常用的管理工具/商業工具等,需要具備的資料分析能力、透過資料進行商業分析的能力等
第四章,我們介紹主要與軟體演算法類相關的人工智慧專案,包括人臉演算法技術的場景應用:智慧相簿、AI人像影片美妝、人體演算法、手勢演算法、人像風格化演算法等場景應,人臉AI小遊戲等直接面向C端消費者場景的專案;
第五章,我們介紹軟硬結合的AI演算法類專案,包括智慧音箱、智慧電視、兒童手錶、機器狗、智慧座艙專案;
第六章,我們介紹B端垂直行業的AI應用類專案,包括智慧工廠、智慧辦公、智慧門店專案;
第七章,我們介紹AI產品的商業模式設計。
最後,我們會推薦幾本書籍和影視劇作品作為拓展性閱讀,希望有餘力的同學可以參考閱讀
一、起源
提到人工智慧的歷史,所有書都會提到1956年度的達特茅斯會議,在這次會上人工智慧的鼻祖John mcarthy是發起人,minsky也 積極參與其中,包括我們課本上非常著名的提出資訊理論的夏農本人。
曾經麥卡錫和明斯基都曾經在貝爾實驗室為夏農打工,當時他們研究的核心就是圖靈機,並將此作為智慧活動的理論基礎。
後來麥卡錫到IBM打工,遇到了研究神經網路的羅切斯特並得到了洛克菲勒基金會的資助,決定在第二年達特茅斯召開人工智慧夏季研討會,這便是人工智慧名字的由來。
從1955年到1965年,人工智慧進入快速發展時期,在機器學習領域,出現了“跳棋程式”並在1959年實現了人工智慧戰勝人類的事件打敗了當時設計他的設計師Samuel,並在1962年,打敗了州跳棋冠軍。
在模式識別領域,1956年Oliver selfridge研發了第一個字元識別程式,並在1963年發明了符號積分程式SAINT,在1967年SAINT的升級版SIN就達到了專家級的水準。
同時美國政府也投入了2000萬美元資金作為機器翻譯的科研經費。當年參加達特茅斯的專家們紛紛發表言論,不出十年,計算機將成為世界象棋冠軍、可以證明數學定理、譜寫優美的音樂,並且在2000年就可以超過人類。
二、第一次寒冬
但在1965年人工智慧迎來一個小高潮之後,質疑的聲音也隨之到來,Samuel設計的跳棋程式停留在了戰勝周冠軍,機器翻譯領域因為一直無法突破自然語言理解(NLP),1966年的美國公佈了一份名為“語言與機器”的報告全盤否定了機器翻譯的可行性。
1969年,發起人之一的minsky發表言論,第一代神經網路(感知機perceptron)並不能學習任何問題,美國政府和美國自然基金會大幅削減了人工智慧領域的研究經費。在20世紀70年代人工智慧經歷了將近10年左右的寒冬時期。
三、第二次高潮與寒冬
直到80年代,人工智慧進入第二次發展高潮,卡耐基梅隆大學為日本DEC公司設計的XCON專家規則系統(專注於解決某一限定領域的問題,具備2500條規則,專門用於選配計算機配件,因此避免了常識問題)可以為該公司一年節省數千萬美金。
同期日本政府撥款8.5億美元支援人工智慧領域科研工作,主要目標包括能夠與人交流、翻譯語言、理解影象、像人一樣進行推理演繹的機器。
但是隨後人們發現,專家系統通用性較差,未與機率論、神經網路進行整合,不具備自學能力,且維護專家系統的規則越來越複雜,且日本政府設定的目標也並未實現,人工智慧研究領域再次遭遇了財政苦難,隨之人工智慧發展進入第二次寒冬。
四、第一次算力與演算法爆發
上世紀90年代,計算機在摩爾定律下的計算機算力效能不斷突破,英特爾的處理器每18-24個月電晶體體積可以縮小一倍,同樣體積上的積體電路密集度增長一倍、同樣計算機的處理運算能力可以翻一倍。
1989年,還在貝爾實驗室的楊立坤透過CNN實現了人工智慧識別手寫文字編碼數字影象。
1992年,還在蘋果任職的李開復利用統計學方法,設計了可支援連續語音識別的Casper語音助理(Siri的前身),在1997年IBM的國際象棋機器人深藍戰勝國際象棋冠軍卡斯帕羅夫(不再止步於州冠軍,第一次真正意義上的戰勝人類),同年兩位德國科學家提出了LSTM網路可用於語音識別和手寫文字識別的遞迴神經網路。
五、算力+演算法+資料三駕馬車聚齊:發展進入快車道
直到2006年,也就是我們身處的這不到20年的時間是當代人工智慧快速發展的階段,同年傑弗裡辛頓發表了《learning of multiple layers of representation》奠定了當代的神經網路的全新架構。
2007年還在Stanford任教的華裔女科學家李飛飛教授,發起了ImageNet專案,開源了世界上最大的影象識別資料集(超過1400萬、2萬多標註類別的影象資料集)。
在2006年亞馬遜的AWS的雲計算平臺釋出,進一步大幅提升了人工智慧網路模型計算所需要的算力。
同時,隨著2014年4G時代的到來與智慧手機大規模普及,移動網際網路的極速發展,催生了覆蓋人起居生活工作的方方面面的各色應用,帶來了神經網路訓練迭代所需的養料“海量的資料”,同時隨著IoT物聯網的興起、支援分散式計算(邊緣計算)的感測器時序(temporal)資料指數級生成。
六、技術發展離不開政府支援,中國將人工智慧列入國家戰略
2017年中國政府也引發了《新一代人工智慧發展規劃》明確了中國新一代人工智慧發展的戰略目標:到2020年,人工智慧總體技術和應用與世界先進水平同步,人工智慧產業成為新的重要經濟增長點,人工智慧技術應用成為改善民生的新途徑。
到2025年,人工智慧基礎理論實現重大突破,部分技術與應用達到世界領先水平,人工智慧成為中國產業升級和經濟轉型的主要動力,智慧社會建設取得積極進展;到2030年,人工智慧理論、技術與應用總體達到世界領先水平,成為世界主要人工智慧創新中心。
人工智慧發展簡史–符合事物發展本質-螺旋式上升
回顧人工智慧歷史發展的60多年間,有上升期、有瓶頸期、有寒冬期,但卻一直不斷的演進進步,正如恩格斯在《自然辯證法》所說,一切事物都是由螺旋形上升運動是由事物內部矛盾引起的,矛盾雙方經過反覆鬥爭,引起對立面的兩次否定,兩次轉化,事物的發展從肯定到否定再到否定之否定,形成一個週期性,每一週期的終點同時又是下一週期的開端。
一個週期接著一個週期,每一週期完成時出現彷彿向出發點的復歸,形成由無數“圓圈”銜接起來的無限鏈條,呈現出螺旋形的上升運動。
而如今的我們,正處在一個人工智慧高速發展時代,且已經滲透到人們日常生產、生活、工作的方方面面,大家可能會問,為什麼不是10年前、20年前而是現在?
這就不得不提人工智慧三要素,分別是:演算法、算力和資料,三者缺一不可。而人工智慧早期發展的瓶頸,很多都是因為你三要素的一種或者多種要素的缺乏,導致人工智慧產業陷入短暫的困境,如下圖所示。
而如今,隨著4G、5G基礎網路通訊設施的快速發展,使萬物互聯成為可能,全球有天文數字級別的人、裝置、感測器被連線,產生海量的資料,而這些資料正是人工智慧演算法模型迭代的充足養料。
而為什麼中國有建設成為人工智慧創新中心的底氣?因為我們國家在網路基礎設施建設方面在全球最為領先,移動互動聯網滲透人們生產生活最為徹底 ,“配送下鄉”的電商平臺淘寶、拼多多、京東,美團等網際網路“買菜”服務下沉到社群,村子裡在直播玩短影片的大爺大媽,每個人都不知不覺的在享受著“人工智慧”科技發展所帶來的紅利,同時也被“演算法”支配著時間。
困在演算法裡的外賣小哥、內容平臺利用推薦演算法向你定向投餵的“豬食內容”、“人臉”資訊被濫用,“演算法”的偏見與歧視,正如一切事物的兩面性一樣、技術的發展同時一定會帶來負面的影響,引發社會輿論的挑戰。
如何更好的保護人們的隱私的同時,讓演算法更好的為人們服務?如何讓人工智慧將來不會“覺醒”,失去控制甚至傷害人類?如何讓深度學習這個相對黑盒更具可解釋性,更安全、更魯棒?
相信諸位也跟我剛接觸這個領域一樣帶著許多困惑。這些學界和工業界都已經有一些嘗試與探討,我希望在這本書的有限章節中向你儘可能簡要但清晰的分享。
七、人工智慧的未來在哪?
未來人工智慧又將去向何從,會像是科幻電影里人工智慧終將覺醒、他們因為不具備”人性”可以更加理智的不會錯的進化統治甚至“奴役”人類?
還是由於人類生存活動使地球的生態環境不斷惡化,“病毒”不斷肆虐,人類無法外出,只能沉陷於由人工智慧創造的虛擬環境中,像是”頭號玩家”所描述的世界,在虛幻世界中實現”自我”價值?
雖然無法先知,但是可以預見的是,人工智慧未來一定會具備以下趨勢:
從專家系統轉向通用型的認知智慧,像是我們上文提到的早期只能針對問題解決問題的某個細分領域的人工智慧,未來的人工智慧是更加通用型的、在感知能力的基礎上具備像人一樣具備認知智慧,除了分類、歸納、檢測、識別具備推演、預測的能力;
深度學習模型從過去的黑盒不可解釋,變得更加具備“可解釋性”,從而透過演算法模型更公平、更安全、更魯棒;
深度學習向多模態發展,正如人類文明進行學習不僅僅是透過眼睛觀看,還有“口眼耳鼻舌身意、色相聲香味觸法”,因此深度學習需要多感測器的資訊融合進行模型學習訓練與判斷;
由於高階任務的帶標籤訓練資料十分匱乏,這會促使人們進一步研究稀疏資料環境中的學習技術,比如,小樣本學習和自我監督學習以及如何提升學習的效率以及如何讓學習的進度追趕上資料產生的進度,增量學習也是一個解決當前現狀的實用方向。
資料隱私和資料安全引起社會廣泛關注,如何保護隱私的前提下同時進行模型訓練迭代,聯邦學習已經被大多公司和組織廣泛使用。
八、總結
這本書適用於所有剛剛從其他行業轉型的AI產品經理,或作為一名剛畢業即將或者已經踏入職場的“新鮮人”,又或者是對於人工智慧這個行業感興趣想要了解的朋友們,希望透過我的一些經驗和案例總結濃縮了七節課,希望可以幫助大家瞭解人工智慧行業的同時,理解人工智慧產品經理這個崗位,甚至可以快速實操上手。
第一章,我們介紹人工智慧發展的介紹,從歷史到現狀再進一步嘗試預見其未來。
第二章,我們介紹進入人工智慧領域必知必會的基礎知識,包括人工智慧最為重要的三駕馬車,人工智慧、機器學習、深度學習之間的關係?對於AI產品經理需要理解的演算法模型,如何衡量演算法模型的好壞,如何建立評價體系?
第三章,我們介紹產品經理技能“方法論”,包括需求管理能力、向上管理能力、橫向管理能力、專案管理能力、產品管理能力包括如何完成一個產品從0到1的構建,包括常用的管理工具/商業工具等,需要具備的資料分析能力、透過資料進行商業分析的能力等
第四章,我們介紹主要與軟體演算法類相關的人工智慧專案,包括人臉演算法技術的場景應用:智慧相簿、AI人像影片美妝、人體演算法、手勢演算法、人像風格化演算法等場景應,人臉AI小遊戲等直接面向C端消費者場景的專案;
第五章,我們介紹軟硬結合的AI演算法類專案,包括智慧音箱、智慧電視、兒童手錶、機器狗、智慧座艙專案;
第六章,我們介紹B端垂直行業的AI應用類專案,包括智慧工廠、智慧辦公、智慧門店專案;
第七章,我們介紹AI產品的商業模式設計。
最後,我們會推薦幾本書籍和影視劇作品作為拓展性閱讀,希望有餘力的同學可以參考閱讀