人工智慧影片分析關鍵技術有哪些？

首頁>Club>2022-02-01 08:52

人工智慧影片分析關鍵技術有哪些？

回覆列表

1 # Python樂園

計算機視覺 　　計算機視覺是指計算機從影象中識別出物體、場景和活動的能力。計算機視覺技術運用由影象處理操作及其他技術所組成的序列，來將影象分析任務分解為便於管理的小塊任務。比如，一些技術能夠從影象中檢測到物體的邊緣及紋理，分類技術可被用作確定識別到的特徵是否能夠代表系統已知的一類物體。　　計算機視覺有著廣泛的應用，其中包括：醫療成像分析被用來提高疾病預測、診斷和治療；人臉識別被Facebook用來自動識別照片裡的人物；在安防及監控領域被用來指認嫌疑人；在購物方面，消費者現在可以用智慧手機拍攝下產品以獲得更多購買選擇。　　機器視覺作為相關學科，泛指在工業自動化領域的視覺應用。在這些應用裡，計算機在高度受限的工廠環境裡識別諸如生產零件一類的物體，因此相對於尋求在非受限環境裡操作的計算機視覺來說目標更為簡單。計算機視覺是一個正在進行中的研究，而機器視覺則是“已經解決的問題”，是系統工程方面的課題而非研究層面的課題。因為應用範圍的持續擴大，某些計算機視覺領域的初創公司自2011年起已經吸引了數億美元的風投資本。　　機器學習 　　機器學習指的是計算機系統無須遵照顯式的程式指令，而只依靠資料來提升自身效能的能力。其核心在於，機器學習是從資料中自動發現模式，模式一旦被發現便可用於預測。比如，給予機器學習系統一個關於交易時間、商家、地點、價格及交易是否正當等信用卡交易資訊的資料庫，系統就會學習到可用來預測信用卡欺詐的模式。處理的交易資料越多，預測就會越準確。　　機器學習的應用範圍非常廣泛，針對那些產生龐大資料的活動，它幾乎擁有改進一切效能的潛力。除了欺詐甄別之外，這些活動還包括銷售預測、庫存管理、石油和天然氣勘探，以及公共衛生等。機器學習技術在其他的認知技術領域也扮演著重要角色，比如計算機視覺，它能在海量影象中透過不斷訓練和改進視覺模型來提高其識別物件的能力。　　現如今，機器學習已經成為認知技術中最炙手可熱的研究領域之一，在2011~2014年這段時間內就已吸引了近10億美元的風險投資。谷歌也在2014年斥資4億美元收購Deepmind這家研究機器學習技術的公司。　　　自然語言處理 　　自然語言處理是指計算機擁有的人類般的文字處理的能力。比如，從文字中提取意義，甚至從那些可讀的、風格自然、語法正確的文字中自主解讀出含義。一個自然語言處理系統並不瞭解人類處理文字的方式，但是它卻可以用非常複雜與成熟的手段巧妙處理文字。例如，自動識別一份文件中所有被提及的人與地點；識別文件的核心議題；在一堆僅人類可讀的合同中，將各種條款與條件提取出來並製作成表。以上這些任務透過傳統的文字處理軟體根本不可能完成，後者僅針對簡單的文字匹配與模式就能進行操作。　　自然語言處理像計算機視覺技術一樣，將各種有助於實現目標的多種技術進行了融合。建立語言模型來預測語言表達的機率分佈，舉例來說，就是某一串給定字元或單詞表達某一特定語義的最大可能性。選定的特徵可以和文中的某些元素結合來識別一段文字，透過識別這些元素可以把某類文字同其他文字區別開來，比如垃圾郵件同正常郵件。以機器學習為驅動的分類方法將成為篩選的標準，用來決定一封郵件是否屬於垃圾郵件。　　因為語境對於理解“timeflies”（時光飛逝）和“fruitflies”（果蠅）的區別是如此重要，所以自然語言處理技術的實際應用領域相對較窄，這些領域包括分析顧客對某項特定產品和服務的反饋，自動發現民事訴訟或政府調查中的某些含義，自動書寫諸如企業營收和體育運動的公式化範文，等等。　　機器人 　　將機器視覺、自動規劃等認知技術整合至極小卻高效能的感測器、制動器以及設計巧妙的硬體中，這就催生了新一代的機器人，它有能力與人類一起工作，能在各種未知環境中靈活處理不同的任務。例如，無人機、可以在車間為人類分擔工作的“cobots”等。　　語音識別 　　語音識別主要是關注自動且準確地轉錄人類的語音技術。該技術必須面對一些與自然語言處理類似的問題，在不同口音的處理、背景噪聲、區分同音異形/異義詞（“buy”和“by”聽起來是一樣的）方面存在一些困難，同時還需要具有跟上正常語速的工作速度。語音識別系統使用一些與自然語言處理系統相同的技術，再輔以其他技術，比如描述聲音和其出現在特定序列與語言中機率的聲學模型等。語音識別的主要應用包括醫療聽寫、語音書寫、電腦系統聲控、電話客服等。比如Domino抯Pizza，最近推出了一個允許使用者透過語音下單的移動APP。　　上述5項技術的產業化，是人工智慧產業化的要素。人工智慧將是一個萬億級的市場，甚至是10萬億級的市場，將會為我們帶來一些全新且容量巨大的子產業，比如機器人、智慧感測器、可穿戴裝置等，其中最令人期待的是機器人子產業。　　機器人應用的分法有很多種，從應用層面可以粗略地分為以下幾個類別。第一個類別是工業級機器人，像富士康這種公司已經運用得很好了，因為勞工成本越來越高，用工風險越來越高，而機器人則可以解決這些問題。第二個類別是監護級機器人，它可以在家裡和醫院裡作為病人、老人或孩子的護理，幫助他們做一定複雜程度的事情。中國對監護級機器人需求其實更迫切一些，因為華人口紅利在下降，同時老齡化又不斷地上升，這兩個矛盾，機器人都可以幫助解決。因此，這個領域的需求在民用市場佔比很大。第三個類別就是探險級機器人，用來採礦或者探險等，大大避免了人所要經歷的危險。此外還有用來打仗的軍事機器人等。　　網路媒體Business Insider預測，機器人將在許多崗位上取替人類：電話營銷員、校對員、手工裁縫師、數學家、保險核保人、鐘錶修理師、貨運代理商、報稅員、影象處理人員、銀行開戶員、圖書館員、打字員等。因為它們的價格競爭力驚人。麥肯錫全球研究院的研究表明，當中國製造業工資每年增長10%~20%時，全球機器人的價格每年下調10%，一臺最便宜的低階機器人只需花費美華人年平均工資的一半。國際研究機構顧能預測：2020年機器人將導致全球新一波失業潮。　　同時，人工智慧技術的發展還將讓許多舊產業獲得改頭換面式的新生，其中最典型的是汽車產業。汽車產業已存在上百年了，其間的變革也是非常大的，但駕駛汽車的始終是人，可最近幾年，隨著谷歌等公司的大力投入，機器或者說某種自動化的系統已經有望取代人來駕駛汽車，從而形成一個市場容量巨大的新產業，即無人駕駛汽車產業。這個產業的規模也將是萬億級甚至是10萬億級的。而且，這個產業還將與新能源產業疊加、融合在一起，形成“車聯網＋能聯網＋網際網路＋電動汽車”的複合產業——未來，我們會把插電式汽車和氫燃料汽車作為發電廠使用，從而使新能源汽車成為電網的一部分，成為新能源的供給者，與現在一些裝有太陽能發電系統的房屋是太陽能的供給者一樣。　　毫無疑問，與網際網路一樣，智慧技術會向幾乎所有舊產業滲透。華泰證券在一份人工智慧產業的研究報告中提及了九大行業：生活服務O2O、醫療、零售業、金融業、數字營銷業、農業、工業、商業和線上教育。實際上，將獲得新生的舊產業還有許多，如軍事、傳媒、家居、醫療健康業、生命科學、能源、公共部門……甚至包括受VR/AR（虛擬現實與增強現實）技術發展影響而產生的虛擬產業。近日，國務院釋出《新一代人工智慧發展規劃》，提出了面向2030年中國新一代人工智慧發展的指導思想、戰略目標、重點任務和保障措施，部署構築華人工智慧發展的先發優勢，加快建設創新型國家和世界科技強國。
今天，國信大資料帶您劃重點，全面解析《新一代人工智慧發展規劃》。

戰略目標重點任務
構建開放協同的人工智慧科技創新體系，從前沿基礎理論、關鍵共性技術、創新平臺、高階人才隊伍等方面強化部署。培育高階高效的智慧經濟，發展人工智慧新興產業，推進產業智慧化升級，打造人工智慧創新高地。建設安全便捷的智慧社會，發展高效智慧服務，提高社會治理智慧化水平，利用人工智慧提升公共安全保障能力，促進社會交往的共享互信。加強人工智慧領域軍民融合，促進人工智慧技術軍民雙向轉化、軍民創新資源共建共享。構建泛在安全高效的智慧化基礎設施體系，加強網路、大資料、高效能計算等基礎設施的建設升級。前瞻佈局重大科技專案，針對新一代人工智慧特有的重大基礎理論和共性關鍵技術瓶頸，加強整體統籌，形成以新一代人工智慧重大科技專案為核心、統籌當前和未來研發任務佈局的人工智慧專案群。
人工智慧熱不可擋，隨著刷臉支付、無人駕駛等人工智慧領域的發展……人工智慧已經被看作是繼蒸汽機、電力和計算機之後，人類社會的第四次革命。

那麼，哪些人工智慧技術突破可以應用到實踐中呢？且聽國信大資料君一一道來。

1、強化學習

解析：在典型的強化學習案例中，代理者透過觀察當前所處的狀態，進而採取行動使得長期獎勵的結果最大化。每執行一次動作，代理者都會收到來自環境的反饋資訊，需要平衡根據經驗尋找最佳策略和探索新策略兩方面，以期實現最終的目標。

應用：城市道路的自動駕駛；三維環境的導航；多個代理者在同樣的環境中互動和學習等。

2、生成模型

解析：生成模型從訓練樣本中學到一個機率分佈，透過從高維的分佈中取樣，生成模型輸出與訓練樣本類似的新樣本。
應用：模擬時間序列的特徵（例如，在強化學習中規劃任務）；超解析度影象；從二維影象復原三維結構；小規模標註資料集的泛化；預測影片的下一幀；生成自然語言的對話內容；藝術風格遷移；語音和音樂的合成等。

3、記憶網路

解析：一些網路結構可以讓模型具備不同程度的記憶能力。如Deep Mind團隊的微神經計算機，結合了神經網路和記憶系統，從複雜的資料結構中學習，透過漸進式神經網路，學習各個獨立模型之間的側向關聯，從這些已有的網路模型中提取有用的特徵，用來完成新的任務。

應用：訓練能夠適應新環境的代理者；機器人手臂控制任務；自動駕駛車輛；時間序列預測（如金融市場、影片預測）；理解自然語言和預測下文等。
4、微資料學習微模型

解析：這種技術的優勢在於更高效的分散式訓練過程，用更少的模型引數建立更小的深學習架構，而模型的效果卻保持最佳。訓練過程中需要傳輸的引數減少了，也能方便地將模型部署在記憶體大小受限制的嵌入式硬體上。

應用：訓練淺層模型來模擬在大規模的已標註訓練資料集上訓練得到的深度網路模型；構建效果相當但引數更少的模型結構；機器翻譯等。

5、學習/推理硬體

解析：促進人工智慧發展的催化劑之一就是圖形處理器（GPU）的升級，GPU支援大規模的並行架構，可以同時處理多個任務，效率遠高於CPU。因此需要專門為高維機器學習任務設計的晶片。晶片設計的改進點包括更大的記憶體頻寬，更高的計算密度，更低的能源消耗。
應用：模型的快速訓練；低能耗預測運算；持續性監聽物聯網裝置；雲服務架構；自動駕駛車輛；機器人等。

6、模擬環境

解析：開發數字環境來模擬真實的物理世界和行為將提供測試人工智慧系統適應性的機會。在這些模擬環境中的訓練可以幫助我們瞭解人工智慧系統的學習原理，如何改進系統，也為我們提供了可以應用於真實環境的模型。

應用：模擬駕駛；工業設計；遊戲開發；智慧城市等。

毫無疑問，人工智慧的迅速發展將深刻改變人類社會生活、改變世界。

在人工智慧領域，中國語音識別、視覺識別技術世界領先，自適應自主學習、直覺感知、綜合推理等初步具備跨越發展的能力，生物特徵識別、工業機器人、無人駕駛逐步進入實際應用……加速積累的技術能力與海量的資料資源、巨大的應用需求、開放的市場環境有機結合，形成了華人工智慧發展的獨特優勢。
未來，政府和企業必須主動求變應變，牢牢把握人工智慧發展的重大歷史機遇，研判大勢、主動謀劃、把握方向、搶佔先機，引領世界人工智慧發展新潮流，服務經濟社會發展和支撐國家安全，帶動國家競爭力整體躍升和跨越式發展。

∧ 中秋節和大豐收的關聯？

∨ 2017年泥瓦施工標準準是什麼？

熱門排行

劇多

人工智慧影片分析關鍵技術有哪些？