在本文裡,Ben Lorica將展望那些會在2019年引導人工智慧發展的新趨勢。
自動化的實現會是分階段的。雖然實現完全的自動化還有很長的路要走,但是有許多工作流程和任務是可以實現部分自動化的。事實上,麥肯錫估計“雖然基於現有的技術只有不到5%的工作可以實現完全自動化。 但是,大約60%的職業裡的30%或更多的工作是可以實現自動化的。”
我們已經看到了一些基於計算機視覺和語音技術的產品和服務,在2019年會出現更多類似的產品。而語言模型和機器人技術方面的進一步改進將會帶來針對文字和物理世界任務的解決方案。與其等待一個完整的自動化模型,組織機構將會被競爭推動著採用部分自動化的解決方案。而這些部分自動化專案的成功將會進一步推動全自動化的發展。
在過去幾年裡,很多公司都在構建流程和基礎架構來解鎖異構的資料來源,以便提升主要的關鍵分析任務的表現。這些任務包括了商業分析、推薦器和個性化服務、預測、異常檢測和監控任務等。
除了使用計算機視覺和語音技術的新系統,我們預見深度學習和強化學習在企業裡的早期嘗試將出現在那些已經使用資料和機器學習的地方。例如,一些企業正在透過深度學習將時間和地理空間資料引入其系統中,從而形成可擴充套件和更準確的混合系統(即將深度學習與其他機器學習方法結合起來的系統)。
當前許多的人工智慧解決方案需要和消費者、人類工人和專家攜手工作。這些系統提升了使用者的工作效率,在許多情況下使他們能夠以難以置信的規模和準確度完成任務。恰當的使用者體驗和使用者介面設計不僅能夠簡化這些任務,而且長期來看,這能讓使用者信任人工智慧的解決方案,並使用它們。
憑藉創造了記錄的語音和計算機視覺的模型,深度學習在2011年復興。今天已經有足夠大的規模來證明需要專用的硬體。Facebook在一天裡就做出數萬億次預測。谷歌也有足夠的規模來證明自己製造專用硬體的合理性——從去年開始,谷歌一直在其雲環境中使用自己的張量處理單元(TPU)。2019年將出現更多的專用硬體。在中國和美國,許多公司和創業企業一直致力於製造面向模型構建和推理的硬體來用於資料中心和邊緣裝置。
雖然深度學習將繼續引領許多有趣的研究,但大多數端到端的解決方案依然是混合系統。2019年,我們將開始更多地瞭解其他元件和方法的基本作用——包括基於模型的方法,如貝葉斯推理、樹搜尋、進化、知識圖譜、模擬平臺等。我們可能會開始看到令人興奮的不基於神經網路的機器學習方法的發展。
我們處在一個高度經驗主義的機器學習時代。機器學習開發的工具需要認識到資料、實驗和模型搜尋、模型部署和監控的重要性。只看這個過程中的一個步驟:模型構建,企業就已經開始研究用於資料血緣、元資料管理和分析、計算資源高效利用、高效模型搜尋和超引數調優的工具。在2019年,我們預計將會出現許多新工具,它們能夠讓開發和實際部署人工智慧和機器學習產品和服務更加容易。
儘管已經存在了大量的“人造”新聞,我們仍然處於機器生成內容(人造影象、影片、語音和文字)的早期階段。至少到目前為止,刑偵和取證技術已經能夠找出偽造的影片和影象。但生成虛假內容的工具正在迅速發展,因此美國和其他地方的研究資助機構已經啟動了一些專案,以確保偵測技術能夠跟上它們的發展。
但隨著人工智慧系統被部署到關鍵任務應用中(甚至包括涉及生死的場景,比如自動駕駛汽車或醫療保健等),自動化帶來的效率提升必須伴隨著對安全性和可靠性的測量以及確保。線上平臺上機器欺騙的興起,以及最近涉及自動駕駛汽車的事故,已經徹底讓這個問題公開化。預計到2019年,安全問題將會得到更深入的討論。
因為我們所依賴的許多模型(包括深度學習和強化學習)都需要大量的資料,所以人工智慧領域可預見的贏家一直是能夠獲得大量資料的大公司或國家。但是,用於生成標註資料集的服務商(特別是那些依賴於人類標註的公司)正在開始使用機器學習工具來幫助他們的人類員工實現規模化和提高準確性。在某些領域,生成對抗網路(GAN)和模擬平臺等新工具能夠提供真實的合成數據用於訓練機器學習模型。最後,一系列安全和隱私保護技術促進了各組織之間的資料共享,這有助於公司利用不是他們自己生成的資料。總之,這些發展將幫助小型機構利用機器學習和人工智慧進行競爭。
在本文裡,Ben Lorica將展望那些會在2019年引導人工智慧發展的新趨勢。
趨勢一:我們將開始看到可以讓很多應用實現部分自動化的新技術自動化的實現會是分階段的。雖然實現完全的自動化還有很長的路要走,但是有許多工作流程和任務是可以實現部分自動化的。事實上,麥肯錫估計“雖然基於現有的技術只有不到5%的工作可以實現完全自動化。 但是,大約60%的職業裡的30%或更多的工作是可以實現自動化的。”
我們已經看到了一些基於計算機視覺和語音技術的產品和服務,在2019年會出現更多類似的產品。而語言模型和機器人技術方面的進一步改進將會帶來針對文字和物理世界任務的解決方案。與其等待一個完整的自動化模型,組織機構將會被競爭推動著採用部分自動化的解決方案。而這些部分自動化專案的成功將會進一步推動全自動化的發展。
趨勢二:企業中的人工智慧將會基於現有的分析應用而構建在過去幾年裡,很多公司都在構建流程和基礎架構來解鎖異構的資料來源,以便提升主要的關鍵分析任務的表現。這些任務包括了商業分析、推薦器和個性化服務、預測、異常檢測和監控任務等。
除了使用計算機視覺和語音技術的新系統,我們預見深度學習和強化學習在企業裡的早期嘗試將出現在那些已經使用資料和機器學習的地方。例如,一些企業正在透過深度學習將時間和地理空間資料引入其系統中,從而形成可擴充套件和更準確的混合系統(即將深度學習與其他機器學習方法結合起來的系統)。
趨勢三:在一個部分自動化和人參與自動化流程的解決方案的時代,使用者體驗和使用者介面的設計將會很重要當前許多的人工智慧解決方案需要和消費者、人類工人和專家攜手工作。這些系統提升了使用者的工作效率,在許多情況下使他們能夠以難以置信的規模和準確度完成任務。恰當的使用者體驗和使用者介面設計不僅能夠簡化這些任務,而且長期來看,這能讓使用者信任人工智慧的解決方案,並使用它們。
趨勢四:我們將會看到專門用於感知、模型訓練和模型推理的硬體憑藉創造了記錄的語音和計算機視覺的模型,深度學習在2011年復興。今天已經有足夠大的規模來證明需要專用的硬體。Facebook在一天裡就做出數萬億次預測。谷歌也有足夠的規模來證明自己製造專用硬體的合理性——從去年開始,谷歌一直在其雲環境中使用自己的張量處理單元(TPU)。2019年將出現更多的專用硬體。在中國和美國,許多公司和創業企業一直致力於製造面向模型構建和推理的硬體來用於資料中心和邊緣裝置。
趨勢五:人工智慧解決方案將會繼續基於混合模型雖然深度學習將繼續引領許多有趣的研究,但大多數端到端的解決方案依然是混合系統。2019年,我們將開始更多地瞭解其他元件和方法的基本作用——包括基於模型的方法,如貝葉斯推理、樹搜尋、進化、知識圖譜、模擬平臺等。我們可能會開始看到令人興奮的不基於神經網路的機器學習方法的發展。
趨勢六:人工智慧的成功將會刺激對新工具和流程的投資我們處在一個高度經驗主義的機器學習時代。機器學習開發的工具需要認識到資料、實驗和模型搜尋、模型部署和監控的重要性。只看這個過程中的一個步驟:模型構建,企業就已經開始研究用於資料血緣、元資料管理和分析、計算資源高效利用、高效模型搜尋和超引數調優的工具。在2019年,我們預計將會出現許多新工具,它們能夠讓開發和實際部署人工智慧和機器學習產品和服務更加容易。
趨勢七:機器欺騙仍將是一個嚴峻的挑戰儘管已經存在了大量的“人造”新聞,我們仍然處於機器生成內容(人造影象、影片、語音和文字)的早期階段。至少到目前為止,刑偵和取證技術已經能夠找出偽造的影片和影象。但生成虛假內容的工具正在迅速發展,因此美國和其他地方的研究資助機構已經啟動了一些專案,以確保偵測技術能夠跟上它們的發展。
趨勢八:可靠性和安全性將成為中心議題令人振奮的是,研究人員和實踐人員對隱私、公平和道德問題產生了濃厚的興趣,並積極參與其中。但隨著人工智慧系統被部署到關鍵任務應用中(甚至包括涉及生死的場景,比如自動駕駛汽車或醫療保健等),自動化帶來的效率提升必須伴隨著對安全性和可靠性的測量以及確保。線上平臺上機器欺騙的興起,以及最近涉及自動駕駛汽車的事故,已經徹底讓這個問題公開化。預計到2019年,安全問題將會得到更深入的討論。
趨勢九:大量訓練資料的民主化將帶來比較公平的競爭環境因為我們所依賴的許多模型(包括深度學習和強化學習)都需要大量的資料,所以人工智慧領域可預見的贏家一直是能夠獲得大量資料的大公司或國家。但是,用於生成標註資料集的服務商(特別是那些依賴於人類標註的公司)正在開始使用機器學習工具來幫助他們的人類員工實現規模化和提高準確性。在某些領域,生成對抗網路(GAN)和模擬平臺等新工具能夠提供真實的合成數據用於訓練機器學習模型。最後,一系列安全和隱私保護技術促進了各組織之間的資料共享,這有助於公司利用不是他們自己生成的資料。總之,這些發展將幫助小型機構利用機器學習和人工智慧進行競爭。