回覆列表
  • 1 # 大位元商務網

    專訪微軟沈向洋:感知和認知是人工智慧研究方向

    微軟執行副Quattroporte沈向洋在主題演講闡述人工智慧

      在西雅圖開幕的Build全球開發者大會上,微軟首次沒有在首日主題演講提到Windows,將最重要的位置留給了雲服務和人工智慧。微軟CEO薩提亞·納德拉(Satya Nadella)更明確提出,微軟要用人工智慧重新定義微軟的所有業務。

    如果說人工智慧是貫穿未來微軟所有業務的血液,那麼領導微軟未來核心競爭力的重任就落在了微軟全球執行副Quattroporte、人工智慧及研究事業部負責人沈向洋的肩上。大會首日的主題演講,正是由沈向洋來最後進行壓軸技術展示。

    在主題演講之後,沈向洋接受了包括新浪科技在內的中國媒體群訪。雖然已經在臺上演說了將近一個小時,但在近一個小時的採訪過程中,沈向洋一直站著侃侃而談。談到人工智慧未來發展的時候,這位美國科技巨頭公司職位最高的華人臉上掛著一種自然的興奮。

    AI重新定義微軟

    談到如何具體實施“人工智慧重新定義微軟業務”時,沈向洋表示,微軟所有的產品都必須要人工智慧化。舉例來說,所有的Office產品都正在進行人工智慧化,很多技術都還是剛剛開始。Powerpoint不僅加入了自動翻譯功能,還添加了圖片自動說明的功能。Word裡面也使用了人工智慧技術,其中最激動人心的技術就是機器閱讀。

    他介紹稱,微軟剛剛收購了一家加拿大人工智慧創業公司Maluuba,後者就是用自然語言和深度學習的方法來做機器閱讀功能。這方面的技術會給Office帶來巨大的影響。目前微軟人工智慧部門和Office部門正在密切協作。

    而在微軟的轉型重點雲服務,微軟在努力用人工智慧的雲幫助企業使用者,其中包括Azure雲服務中的認知服務,這會是Azure未來的重中之重。而Windows部門和Hololens也加入了很多計算機視覺和計算機語音方面的人工智慧技術。

    對話互動AI是方向

    對話互動人工智慧(Conversational AI)的概念是過去一年各大人工智慧公司都在推崇的概念。沈向洋介紹稱,計算機最早是指令介面,後來是圖形互動介面,但這些還是需要人類學習計算機的語言。到了對話互動人工智慧的階段,則是計算機來學習人類的語言。

    但他強調,目前對話互動人工智慧的產品研發還處在早期階段,還遠遠沒有達到透過對話實現人機互動。微軟的Cortana和蘋果的Siri都還是計算機根據人類指令完成一些任務。

    沈向洋表示,自己比較看好聊天機器人的發展方向,微軟在中國推出了小冰,在日本做了Rinna,在美國推出了Zo,這些都是計算機試圖理解人類情感的嘗試。他提出,人工智慧只有智商IQ是遠遠不夠的,還需要擁有情商。而且目前人工智慧的水平甚至還沒有達到一個四五歲孩子的能力。

    感知和認知是AI研究方向

    沈向洋提到,人工智慧這個詞彙是上世紀六十年代美國計算機教授約翰·麥卡錫(John McCarthy)最先提出的。人的智慧分為感知和認知兩個部分。在感知方面,最大的一部分是視覺感知,然後是聽覺,之後還是其他感知。

    在這方面,計算機進展很大。他預計,未來五年計算機語音識別可以達到識別人類的水平,未來十年計算機視覺也可以達到這一點。實際上,今天計算機視覺在人臉識別方面已經超過了人類,但到一個新地點,看到一個新東西就可以識別和理解,這大概需要十年的時間。

    但談到認知,計算機卻遠遠沒有達到和人類相比的水平。首先是自然語言處理,然後是知識獲取。在自然語言處理方面,目前的深度學習方法雖然帶來了一些幫助,但解出來的效果還不是足夠好。

    沈向洋繼續闡述說,深度學習是目前最大的突破,但也存在一個問題——雖然效果非常好,但卻沒有辦法解釋。人類可以分析出為什麼一二三,但深度學習和人工智慧目前都做不到。

    共同推進行業發展

    在談到人工智慧未來發展的規範時,沈向洋介紹微軟剛剛成立一個“人工智慧倫理委員會”,由人工智慧研究院和微軟法務部門的負責人擔任聯席主席,微軟每一個大業務和產品部門都會派代表參加委員會。

    此外,去年12月,微軟還聯合谷歌、Facebook、亞馬遜、IBM五家人工智慧領域的巨頭成立了人工智慧合作組織(Partnership on AI),共同制定人工智慧行業未來的發展規範。據沈向洋介紹,目前這個組織已經有100多家公司加入其中。

    他提到,微軟會提供一個平臺和工具,向科研人員開放;同時也做垂直領域,包括Office AI和在雲裡面的應用。作為一家商業公司,微軟和其他平臺競爭很正常。谷歌和亞馬遜都在積極推進人工智慧的研究,但大家作為一個社群,應該聚集一些力量。

    “這方面可以從當初Android的興起中學習一些經驗。深度學習下一波浪潮中,我們怎樣可以做到更好。我也不覺得微軟一家公司就可以做出這些東西。現在微軟已經是非常開源了,包括完全開源的CNTK。開源對這個世界的科技發展產生了巨大的深遠影響,微軟會完全擁抱開源。”

    如果說人工智慧是貫穿未來微軟所有業務的血液,那麼領導微軟未來核心競爭力的重任就落在了微軟全球執行副Quattroporte、人工智慧及研究事業部負責人沈向洋的肩上。大會首日的主題演講,正是由沈向洋來最後進行壓軸技術展示。

    在主題演講之後,沈向洋接受了包括新浪科技在內的中國媒體群訪。雖然已經在臺上演說了將近一個小時,但在近一個小時的採訪過程中,沈向洋一直站著侃侃而談。談到人工智慧未來發展的時候,這位美國科技巨頭公司職位最高的華人臉上掛著一種自然的興奮。

    AI重新定義微軟

    談到如何具體實施“人工智慧重新定義微軟業務”時,沈向洋表示,微軟所有的產品都必須要人工智慧化。舉例來說,所有的Office產品都正在進行人工智慧化,很多技術都還是剛剛開始。Powerpoint不僅加入了自動翻譯功能,還添加了圖片自動說明的功能。Word裡面也使用了人工智慧技術,其中最激動人心的技術就是機器閱讀。

    他介紹稱,微軟剛剛收購了一家加拿大人工智慧創業公司Maluuba,後者就是用自然語言和深度學習的方法來做機器閱讀功能。這方面的技術會給Office帶來巨大的影響。目前微軟人工智慧部門和Office部門正在密切協作。

    而在微軟的轉型重點雲服務,微軟在努力用人工智慧的雲幫助企業使用者,其中包括Azure雲服務中的認知服務,這會是Azure未來的重中之重。而Windows部門和Hololens也加入了很多計算機視覺和計算機語音方面的人工智慧技術。

    對話互動AI是方向

    對話互動人工智慧(Conversational AI)的概念是過去一年各大人工智慧公司都在推崇的概念。沈向洋介紹稱,計算機最早是指令介面,後來是圖形互動介面,但這些還是需要人類學習計算機的語言。到了對話互動人工智慧的階段,則是計算機來學習人類的語言。

    但他強調,目前對話互動人工智慧的產品研發還處在早期階段,還遠遠沒有達到透過對話實現人機互動。微軟的Cortana和蘋果的Siri都還是計算機根據人類指令完成一些任務。

    沈向洋表示,自己比較看好聊天機器人的發展方向,微軟在中國推出了小冰,在日本做了Rinna,在美國推出了Zo,這些都是計算機試圖理解人類情感的嘗試。他提出,人工智慧只有智商IQ是遠遠不夠的,還需要擁有情商。而且目前人工智慧的水平甚至還沒有達到一個四五歲孩子的能力。

    感知和認知是AI研究方向

    沈向洋提到,人工智慧這個詞彙是上世紀六十年代美國計算機教授約翰·麥卡錫(John McCarthy)最先提出的。人的智慧分為感知和認知兩個部分。在感知方面,最大的一部分是視覺感知,然後是聽覺,之後還是其他感知。

    在這方面,計算機進展很大。他預計,未來五年計算機語音識別可以達到識別人類的水平,未來十年計算機視覺也可以達到這一點。實際上,今天計算機視覺在人臉識別方面已經超過了人類,但到一個新地點,看到一個新東西就可以識別和理解,這大概需要十年的時間。

    但談到認知,計算機卻遠遠沒有達到和人類相比的水平。首先是自然語言處理,然後是知識獲取。在自然語言處理方面,目前的深度學習方法雖然帶來了一些幫助,但解出來的效果還不是足夠好。

    沈向洋繼續闡述說,深度學習是目前最大的突破,但也存在一個問題——雖然效果非常好,但卻沒有辦法解釋。人類可以分析出為什麼一二三,但深度學習和人工智慧目前都做不到。

    共同推進行業發展

    在談到人工智慧未來發展的規範時,沈向洋介紹微軟剛剛成立一個“人工智慧倫理委員會”,由人工智慧研究院和微軟法務部門的負責人擔任聯席主席,微軟每一個大業務和產品部門都會派代表參加委員會。

    此外,去年12月,微軟還聯合谷歌、Facebook、亞馬遜、IBM五家人工智慧領域的巨頭成立了人工智慧合作組織(Partnership on AI),共同制定人工智慧行業未來的發展規範。據沈向洋介紹,目前這個組織已經有100多家公司加入其中。

    他提到,微軟會提供一個平臺和工具,向科研人員開放;同時也做垂直領域,包括Office AI和在雲裡面的應用。作為一家商業公司,微軟和其他平臺競爭很正常。谷歌和亞馬遜都在積極推進人工智慧的研究,但大家作為一個社群,應該聚集一些力量。

    “這方面可以從當初Android的興起中學習一些經驗。深度學習下一波浪潮中,我們怎樣可以做到更好。我也不覺得微軟一家公司就可以做出這些東西。現在微軟已經是非常開源了,包括完全開源的CNTK。開源對這個世界的科技發展產生了巨大的深遠影響,微軟會完全擁抱開源。”

    唇語識別成人工智慧研究新方向 市場有待深入挖掘  

      牛津大學研究員Yannis Assael表示:“我們相信AI唇讀是一種非常實用的輔助性技術,比如更智慧的助聽器,不便出聲的公共場合,以及在嘈雜環境下精準的語音識別等。”舉例而言:透過唇語識別,讓無法開口說話的殘障人士“開口說話”;讓聽力障礙者和不少老年人更清晰地聽懂他人;而在軍事情報領域,唇語識別讓遠距離獲取情報成為可能。

    人工智慧技術方興未艾。在大資料分析、雲計算等基礎上已經發展起來眾多的實際應用技術,比如人臉識別、影象識別、語音識別等等,不斷挑戰著人們對科技的新認知。最近,另一種應用技術——唇語識別技術,讓人們看到人工智慧又給人們開了一扇窗。

    據介紹,唇語識別技術,簡單地說即終端裝置透過大資料技術,捕捉說話時的嘴部動作,來解讀說話人所要表達的內容。其最直接的現實應用場景就是,幫助聽力、發音障礙者實現與他人的順暢交流。

    其實早在2003年,英特爾公司就曾推出一款名叫視聽說識別系統的軟體,電腦開發者可以在此基礎上研製讀懂“唇語”的計算機。而國外技術最純熟的當屬谷歌,其旗下公司Deepmind AI系統的唇語識別正確率在去年已經達到46.8%。

    在國內,BAT這些網際網路巨頭雖未涉足這一領域,但也有一些創新公司在唇語識別技術方面取得了突破。6月20日,《重慶新聞聯播》節目就用長達兩分多鐘的時間,對海雲資料的唇語識別技術進行了報道。據報道,該公司唇語識別技術的中文識別率已高達71%,英文識別率達到80%,一度超過了谷歌Deepmind去年的成績。

    唇語識別將成人工智慧研究新方向

    人們總是對新鮮的事物保持著好奇心,因此比較成熟的唇語識別技術一經曝光就引發了廣泛關注。

    在剛剛結束的2017數博會上,海雲資料唇語識別技術與海爾、360等企業的技術一起入選“數博會2017十大黑科技”,引發國內大資料、人工智慧行業從業者的廣泛興趣。中國媒體還將唇語識別技術和武俠小說中的“唇讀術”相提並論,為該技術平添了一層神秘色彩。

    目前,全世界涉及唇語識別技術研發的企業除了英特爾、谷歌、海雲資料之外,還有微軟。早在2011年,歐洲遊戲媒體就聲稱微軟第二代Kinect體感外設非常強悍,足以“讀懂”唇語,還能夠檢測玩家的憤怒情緒。除了企業,研究唇語識別的還有一些機構,比如英國東英吉利大學等。

    據瞭解,此前各企業和機構對於唇讀有不同的稱呼,比如lipreading(唇讀)、speechreading(視話),visualhearing(視覺來聽),hearingbyeye(用眼來聽)等,但技術思維理念是一致的。

    有分析人士認為,在人工智慧即將大範圍落地的前夜,唇語識別技術雖然相比其他技術冷僻一些,但也讓業內看到了新的方向,相信今後會有更多的公司進入這個領域。

    唇語識別當前應用場景相當廣闊

    基於唇語識別技術開發的產品絕不是一個小眾產品。海雲資料創始人、CEO馮一村介紹說:“除公共安全領域外,唇語識別還可應用到移動支付、軍事情報、殘疾人教育等領域。”

    比如在公共安全領域,遍佈街頭的攝像頭為安全部門提供了大量的無聲影片資料,利用唇語識別技術可以對拍攝到的違法分子的口型進行識別,進而獲取有價值的偵查資訊。這將是一個巨大的2B市場。

    再比如以2C為主的移動支付領域,唇語識別技術也可為支付安全提供更大的保障。尤其是在軍事情報領域,隨著技術的發展,遠距離獲取情報獲將成為可能。

    來自牛津大學唇語技術研究LipNet團隊的Yannis Assael說:“我們相信,機器唇語解讀器有非常大的應用前景,比如改進助聽器,公共場所的無聲指令(Siri再也不必聽到你的聲音了),嘈雜環境下的語音識別等。”

    有報道認為,人工智慧未來將會出現一個數萬億美元的巨大市場,在面對具體乃至細碎的應用場景時,人工智慧的細分程度勢必如百年前的電力那般觸角龐雜。廣袤的嫁接空間意味著,從真實應用場景出發,人工智慧領域會出現不少藍海市場,被國內巨頭忽視的唇語識別也是其中之一。

    國內唇語識別市場有待深入挖掘

    相較於國外唇語識別技術“多企爭流”的情況,在國內研發該項技術的企業少之又少——在BAT等紛紛佈局眼下大熱的影象識別、語音識別、人臉識別、無人駕駛技術的大背景下,僅僅有海雲資料少數創新公司在該項技術上進行了佈局並初步形成研究成果。

    究其原因,其一是人工智慧細分領域紛繁複雜,這些巨頭不可能事無鉅細面面俱到;其二是影象識別、語音識別等技術相對成熟,可以較快地投入市場,在逐利的驅使下,肯定要首先進軍這些領域。不過,這也從側面幫助像海雲資料這樣的創新公司在BAT巨頭未涉足的領域獲得站穩腳跟的機會,甚至是提前建立起技術壁壘。

    業內人士認為,唇語識別雖還未迎來爆發的階段,但網上隨處可見、海量的影片資源已經為其做好大資料方面的準備,隨著技術的不斷進步,這項技術與將獲得越來越快速的發展。

    資料顯示,DeepMind與牛津大學的研究者使用總長超過5000小時的節目對人工智慧唇語識別系統進行訓練,正確率已經達到46.8%,比專業讀唇人士高出了大概3倍。而海雲資料以長達1萬多小時的新聞素材為“語料”模板,將中文的識別率提升到了71%。“未來隨著‘語料’越來越多,識別率也將穩步提升。”馮一村介紹說。

    技術的不斷進步也將推動市場的深入挖掘。目前,唇語識別還沒有到商用的地步(一般識別率高於95%即可達到商用標準),但隨著技術的不斷進步和識別率的提升,唇語識別市場或將迎來爆發,其對應的安防、軍事、支付等行業也將發生巨大的變化。

    浙江大學獲微醫集團捐贈1億元 成立睿醫人工智慧研究中心

    從上世紀50年代技術萌芽到70年代正式參與到醫學診斷中,醫學人工智慧已經快成為醫療科技進步的代名詞。人工神經網路和深度學習領域的不斷進步,以及在醫療領域不斷興起的創業潮,都在對現代醫學的發展程序產生重大影響。

    近年來,人工智慧領域大事件不斷。IBM自2006年開始研發Watson、2014年穀歌成立收購DeepMind,而在2016年,又因AlphaGo和李世石對弈、Google、Facebook、Amazon、IBM和Microsoft宣佈成立AI合作組織等產生的大事件效應,都為人工智慧領域的發展有著深遠意義,也促使該領域迎來了一波又一波的創業潮。

    據CBI報告顯示,2016年550家人工智慧初創企業共獲得50億美元投資。Gartner副QuattroporteTracy Tsai則進一步預測,到2020年,人工智慧將產生 3000 億美元的商業價值。人工智慧+醫療健康的創業專案數量在逐年增加,中國出現了數家值得關注的初創公司,甚至知名高校也跨入這個領域。

    名校構建中國首個開放式醫學人工智慧平臺

    2017年3月25日,中國著名學府浙江大學宣佈成立睿醫人工智慧研究中心,華人工智慧科學帶頭人、浙江大學校長吳朝暉教授帶頭成立專家委員會,並在浙江大學和杭州灣資訊港同時掛牌。中心宣佈將透過“產學研”一體化模式,構建中國首個開放式醫學人工智慧平臺。

    浙江大學在醫學人工智慧方面有著足夠的底氣,其計算機學院下設的人工智慧研究所是中國最早的人工智慧研究機構之一。在2016年國家科技獎評選中,浙江大學有9項獲獎位列全國高校第一,在醫藥學、工學及資訊科學等領域的能力國內領先,醫學部各附屬醫院是國內臨床醫學的佼佼者。

    重點研究在臨床大資料、影像學和基因組學上的醫學人工智慧共性關鍵技術,重點搭建醫學人工智慧服務平臺,培育醫學人工智慧產業生態環境和第三方醫學人工智慧服務企業,建立多學科多機構協同創新機制,形成相關行業規範標準,打造醫學人工智慧高等教育體系等。

    為了支援睿醫人工智慧研究中心的發展,浙江大學校長吳朝暉成立專家委員會、計算機學院吳健教授為中心負責人成立核心研發團隊,並配備相應運營和管理輔助人員,同時為中心提供一定數量的博士及碩士研究生名額,推進醫學人工智慧領域的人才培養。

    與此同時,睿醫人工智慧研究中心同時具備科研平臺屬性和產業轉化平臺屬性,它不僅是醫學人工智慧科研中心,還面向浙江大學附屬醫院及全國醫療機構和學科帶頭人開放技術合作和應用合作,實現與醫療機構診療經驗、學術研究、臨床資料的對接,尋求科研成果向產業成果的轉化,並以產業發展反哺科研工作,實現產學研的協同。

    “我們會利用浙江大學基礎優勢,以開放姿態和各大醫療機構及學科帶頭人合作,打通資料來源,建立多學科、多機構協同機制,爭取早日在醫學人工智慧的關鍵性技術上取得突破。”吳朝暉校長表示。

    最佳化醫療服務體系,應用場景廣闊

    人工智慧正在成為全球競爭的技術制高點,並於2017年首次進入全國兩會政府工作報告。人工智慧在醫療領域中的大規模應用始於2011年,目前在虛擬助理、醫學影像、藥物挖掘、營養學、生物技術、急救室/醫院管理、健康管理、精神健康等領域均有涉及。

    由此可見,醫學人工智慧擁有巨大發展前景。以睿醫人工智慧研究中心為藍本的高校機構,對於加速人工智慧技術在醫療健康領域的應用,加快重大疾病防控技術突破、佔據生物醫學相關新興戰略性產業發展的主導權、保護醫療健康資料安全、最佳化醫療服務體系均具有真實價值。

    而醫學人工智慧的應用,將有助於改善醫療服務體系面臨優質醫療資源配置不均衡、基層醫療機構和醫生服務能力不足、以疾病治療為中心的“被動醫療”服務模式等諸多現狀,最佳化醫療服務體系。

    在睿醫人工智慧研究中心的釋出會現場,我們又見到了一個熟悉的身影——微醫。微醫向浙江大學捐贈1億元人民幣支援睿醫人工智慧研究中心發展。

    廖傑遠認為,許多人對醫學人工智慧的理解是碎片性的。醫學人工智慧的核心有三要素:資料來源、技術能力和應用場景。不少醫學人工智慧企業都是從技術開始,但是技術和演算法模型,都是通用的,關鍵還在於後天的“教育”。

    首先,有沒有大資料來源,不斷訓練它,讓它越來越智慧。從一個病種、病程、病點開始,到能夠成為醫生的助手,這就不是單點行為,一定是一個系統。這個系統的後端,資料來源在醫院,在各種電子病例裡;

    其次,醫學人工智慧形成的醫學能力,要有各個醫學學科的能力,這樣才能形成真正的服務體系;

    最後,要有不同的應用場景。醫院、醫生、患者都是不同的應用場景,三者打通才能成為真正的醫學人工智慧平臺。

    如果這個平臺只依靠一家企業,或者只依靠某一家機構都比較困難。而浙江大學的條件是絕無僅有的,浙江大學的醫、工、信的能力都很強,1981年就開始做人工智慧研究,有深厚的底蘊。其校長吳朝暉教授更是人工智慧的專家,1991年曾到德華人工智慧研究中心深造兩年,一直從事相關領域的研究。

    因此,從條件上來說,浙江大學可以牽頭籌建人工智慧研究中心,但高校的每筆經費運用都有指向性,浙江大學要集中大力量來專注醫學人工智慧,也很需要人力和資金的支援。微醫捐贈的1億萬,正是從資金上推動了睿醫人工智慧研究中心的發展。

    當然,僅僅是微醫捐的錢是不夠的,國家也需要有相應的配套,還需要更多的機構參與,才會形成足夠的力量推動這件事。

    形成醫學人工智慧的“中國力量”

    在中國面臨大專家、大醫生稀缺,基層醫療資源薄弱的現狀下,醫學人工智慧的大跨步前進給我們憧憬了一個可期待的未來。睿醫人工智慧中心出現在這個時間節點,有它的必要性和必然性。正如浙江大學校長吳朝暉所想,我們也期待類似睿醫人工智慧中心這樣的高校科研機構承擔起建立自主智慧財產權的醫學人工智慧核心的能力,以此建立中國自主智慧財產權的醫學人工智慧引擎,並與各大醫療機構、各學科專家及產業界合作,形成醫學人工智慧的“中國力量”。

  • 2 # AI望遠鏡

    比較熱門的有,一是影象識別,刷臉支付和自動駕駛,是代表場景。二是語音識別,語音錄入和機器人聊天是代表場景。三是自然語言處理,文字識別,智慧家居,聊天機器人都有用到。四是邏輯推理,比如會下棋的阿爾法狗,IBM開發的沃森醫生系統,高考機器人等。

  • 3 # 涇渭漳淮

    比較大的幾個研究方向:

    1.影象識別和影片識別,這倆有些許差別,但共同點更多,都是分類器加影象處理。

    2.音訊識別和語音識別,(其實這倆差別挺大)。

    3.自然語言處理,機器翻譯。

    4.智慧推送或者推薦系統。

  • 4 # 反省心理

    人工智慧從低到高有五級:計算智慧(數字計算),記憶智慧(搜尋引擎),感知智慧(語音識別、影象識別等),認知智慧(機器學習,自然語言理解、人機互動等),創造智慧(模擬人腦創造性思維進行知識發現、問題解決、決策等活動)。研究方向都在這裡面。

  • 中秋節和大豐收的關聯?
  • 《超時空要塞》星間飛行中文歌詞?