注:概念驗證(POC)是一種“封閉”而有效的解決方案,從瞭解要求一直到實現成功,可根據明確的標準對該解決方案進行評估和測量。對於任何人工智慧專案或程式,概念驗證讓決策者能夠:更快收穫價值、獲取技能和經驗、測試硬體、軟體和服務選項、確認和解決潛在的資料瓶頸、突出人工智慧對 IT 基礎設施和廣泛業務的影響、提升人工智慧的積極印象,提高使用者的信任度。
你是否明確知道自己想要解決的問題、其對應的具體要求,以及你將如何衡量成功?你是否考慮過或曾部署其他解決方案來解決此問題,後來因為傾向於人工智慧而放棄這些解決方案?是否明確限定了機遇的範圍?例如,你是否能簡要說明這個機遇會使用到的資料集、關鍵元件、將會受到影響的人員,以及其他依賴項?它是某個更大解決方案的一部分嗎?你是否具備讓它成為現實所需的技術資源和資金?你是否能夠不受技術、合同或其他因素的阻礙,直接使用你所需的資料來源?對業務的有利影響是否足以抵消所付出的努力?那些容易看到的成果非常重要,有利於提高使用者對人工智慧的信任度,讓更多的利益相關者參與進來。推動力和獲得的支援是否足夠(例如高層的支援)?受到影響的業務部門是否全力參與來解決這個問題?時間安排上是否合適?是否明確指定了交付團隊?這個團隊是否具有足夠的時間、技能和動力來完成這項工作?組織是否具備更廣泛的資料科學和 / 或人工智慧戰略?此戰略是否與其目標一致?組織目前已具備哪些資料科學基礎設施和專業知識?概念驗證成功完成之後,後續準備怎麼做?是否有資金用於維護或擴充套件該解決方案?負責運營的 IT 部門是否獲知了基本情況並準備好參與其中?
即便是按照最佳實踐構建和測試的基礎設施和軟體,仍然需要考慮人工智慧的各種要求。尤其是持續提供高質量資料這一要求。資料科學家能夠與 IT 系統架構師合作設計從資料中心到邊緣的部署架構,並且考慮軟體整合、網路連線、硬體問題和其他各方面。可能需要測試多個選項:應該採用測試加學習的方法,以便能獲取更多的經驗。
人工智慧演算法已經出現多年,但是直到最近,人工智慧的價值才開始在企業中得到快速擴充套件。
快速擴充套件的原因基於兩方面:一方面處理和儲存資料的成本都已大幅下降。另一方面,計算科學家已經改進了人工智慧演算法設計,包括神經網路在內,使得訓練模型獲得了更高的準確度。人工智慧系統首先學習資料,然後從中推理出結果
為了進一步加快人工智慧普及速度,推動了基礎設施創新,業界和學術界紛紛將與人工智慧有關的功能直接嵌入到硬體之中,例如:最新的 英特爾®至強®可擴充套件處理器為廣泛的人工智慧工作負載提供可擴充套件的效能,在深度學習模型訓練和推理中提供突破性的效能,英特爾®Nervana™ 神經網路處理器則採用專為神經網路構建的新型架構。
專業硬體的加持,使得人工智慧潛力明顯,但是許多企業還沒有開始採用人工智慧,其採用速度也比不上媒體和學術機構在報告中推測的速度。
經過媒體調查,這些企業擔心廣泛的潛在機遇帶來的挑戰。
那麼,什麼樣的機遇能夠帶來最好的結果?如何確保能取得成功的結果呢?
英特爾為此提出了一套“概念驗證(PoC)”的解決方案,並且詳細撰寫了一套“白皮書”,能夠幫助決策者回答這些問題,同時最大化價值,最小化風險。
注:概念驗證(POC)是一種“封閉”而有效的解決方案,從瞭解要求一直到實現成功,可根據明確的標準對該解決方案進行評估和測量。對於任何人工智慧專案或程式,概念驗證讓決策者能夠:更快收穫價值、獲取技能和經驗、測試硬體、軟體和服務選項、確認和解決潛在的資料瓶頸、突出人工智慧對 IT 基礎設施和廣泛業務的影響、提升人工智慧的積極印象,提高使用者的信任度。
概念驗證具體來說分為五個步驟。第一步確認機遇、第二步確定問題的特徵並分析資料、第三步架構和部署解決方案、第四步評估商業價值、第五步縱向擴充套件概念驗證。大資料文摘也將白皮書簡要介紹如下。第 1 步 確認機遇
請你務必從一開始就明確瞭解你希望利用人工智慧達到哪些效果,為何它對你的企業至關重要,以及你如何確保它能夠提供所需的功能,這些非常重要。如果你尚未明確能從人工智慧中獲得哪些益處,你應該實施評估,看看人工智慧可在哪些地方產生立竿見影的效果:
思考行業中的其他企業都在使用人工智慧做些什麼。在你的企業中,看看哪些方面存在明確需要解決的問題,或哪些方面能從人工智慧中獲益。在工作中利用現有的專業知識庫,使用內部已有的技能和經驗。在確定了哪些方面能從人工智慧獲益後,可以根據幾項標準來測試各個機遇。這項工作無需花費很長時間,而以下問題可以幫助你確認你的組織在規劃方面的不足,以免倉促啟動人工智慧專案:
你是否明確知道自己想要解決的問題、其對應的具體要求,以及你將如何衡量成功?你是否考慮過或曾部署其他解決方案來解決此問題,後來因為傾向於人工智慧而放棄這些解決方案?是否明確限定了機遇的範圍?例如,你是否能簡要說明這個機遇會使用到的資料集、關鍵元件、將會受到影響的人員,以及其他依賴項?它是某個更大解決方案的一部分嗎?你是否具備讓它成為現實所需的技術資源和資金?你是否能夠不受技術、合同或其他因素的阻礙,直接使用你所需的資料來源?對業務的有利影響是否足以抵消所付出的努力?那些容易看到的成果非常重要,有利於提高使用者對人工智慧的信任度,讓更多的利益相關者參與進來。推動力和獲得的支援是否足夠(例如高層的支援)?受到影響的業務部門是否全力參與來解決這個問題?時間安排上是否合適?是否明確指定了交付團隊?這個團隊是否具有足夠的時間、技能和動力來完成這項工作?組織是否具備更廣泛的資料科學和 / 或人工智慧戰略?此戰略是否與其目標一致?組織目前已具備哪些資料科學基礎設施和專業知識?概念驗證成功完成之後,後續準備怎麼做?是否有資金用於維護或擴充套件該解決方案?負責運營的 IT 部門是否獲知了基本情況並準備好參與其中?第 2 步 確定問題的特徵並分析資料
在你確認和測試過機遇之後,接下來可將注意力轉向瞭解和詳細闡述待解決的問題,將其對映至更廣泛的類別,例如推理、感知或計算機視覺。
組織遭遇的部分挑戰,尤其對於尚處於人工智慧早期階段的組織而言,就是內部沒有足夠的技能。
在你的人工智慧工作流程中,這也是思考更多可能會給解決方案帶來影響的技術問題的絕佳時機。例如:
你是否傾向使用某些硬體或軟體?為什麼(基準測試資料、TCO、首選供應商)?安全 / 監管 / 資料 / 其他方面的需求是否更傾向於選擇本地系統而不是雲?你的解決方案是在本地自己維護,還是部署到資料中心中?當前資料中心的利用率是多少?效能 - 功耗比有多重要?你會按照什麼頻率和數量為訓練 / 推理提供新資料?在靜態和動態情形下,如何保持原始資料和生成的洞察始終安全?第 3 步 架構和部署解決方案
下一個問題是,如何設計和部署已透過概念驗證測試的解決方案。如圖 3 所示,這由一個技術棧組成,包括:
基礎產品和系統基礎設施人工智慧特定的軟體,用於推動基礎設施建設起支撐作用的人工智慧框架,用於為計劃的解決方案提供支援虛擬化技術、前端軟體和 / 或硬體在這個階段,你可以考慮到底是構建、購買或再利用硬體和軟體,還是利用雲服務。
即便是按照最佳實踐構建和測試的基礎設施和軟體,仍然需要考慮人工智慧的各種要求。尤其是持續提供高質量資料這一要求。資料科學家能夠與 IT 系統架構師合作設計從資料中心到邊緣的部署架構,並且考慮軟體整合、網路連線、硬體問題和其他各方面。可能需要測試多個選項:應該採用測試加學習的方法,以便能獲取更多的經驗。
完成之後,你可以處理解決方案的其他人工智慧相關元素——構建模型、訓練和調優。
構建模型
模型構建屬於人工智慧的核心任務。資料科學家參與其中,使用訓練資料和管理引數來實施迭代測試。這樣,在他們傳送模型用於更廣泛的訓練和調優之前,可以檢查模型的初始融合準確性。
訓練和調優
訓練和調優是人工智慧工作流程中計算密度最高的部分。在這一階段,資料科學家需要確定在哪些引數下,模型能夠基於所提供的訓練資料實現最有效的融合,同時解決作業排程和基礎設施管理等常見的傳統 IT 問題。
這個過程非常耗費人力,資料科學家需要花費大量時間來手動整理資料並執行數百次試驗。
第 4 步 評估商業價值
作為解決方案設計的一部分,你需要定義概念驗證的評估標準:對於工程師,這些標準可以轉化成能夠設計、衡量、持續自動測試的評估標準。
現人工智慧解決方案架構可以表示為堆疊
以下這些評估標準可用於評估商業價值:
準確度:解決方案提供的結果和洞察是否正確?是否可以重複?完備性:這種解決方案是否正確使用所有資料來源?時效性:是否在需要時,按照需要提供洞察?除此以外,無論其執行狀況是否符合預期,此解決方案還需遵循其他標準:擴充套件性:如果資料量或使用者數量隨時間不斷增加,或者急劇增加,該解決方案是否能繼續發揮作用?相容性:解決方案是否為開放的,並且能使用標準協議與第三方資料來源和服務整合?靈活性:如果資料需求或模型發生變化,解決方案能否適應不斷變化的環境?工程性:能否簡單快捷地除錯訓練模型中的錯誤輸出?最後,需要根據人工智慧領域廣為人知的“可解釋性”(即決策質量)來評估解決方案的需求。與可解釋性有關的標準包括:
偏見:如何確保人工智慧系統不會基於訓練資料、模型或目標函式的缺點對世界存在偏見(或者對存有偏見的世界保持公正的態度)?如果其人類創造者下意識或潛意識地存有偏見呢?公平公正:如果決策是基於人工智慧系統制定的,如何確認這些決策是否公平公正?在這種環境中,公平公正意味著什麼——對誰公平?因果聯絡:該模型除了提供正確的推理之外,是否還能解釋一些基礎現象?透明性:針對基於人工智慧的洞察給出的解釋,使用者能否理解?在什麼樣的情況下,所發現的結果可以被質疑?安全性:無論使用者對得出結論的過程瞭解與否,如何增加使用者對人工智慧系統可靠性的信心?第 5 步 縱向擴充套件概念驗證
現代平臺的效能最佳化
截至目前,你已經定義了問題,設計瞭解決方案,分析了資料且建立了模型。概念驗證已成功構建、測試和部署。那接下來應該做什麼呢?
積極的使用者體驗有利於提升使用者需求,以獲得更大的成功。但是,概念驗證也會因此遭遇風險,成為受到過多關注的犧牲品。你可以採取一些措施,確保你的概念驗證持續保持成功,為更廣泛的人工智慧戰略提供支援:
縱向擴充套件推理能力。人工智慧不是以線性方式擴充套件的——例如,從單節點配置遷移後,50 個處理器並不一定會帶來 50 倍的效能。你仍然需要利用在單節點配置中採用的很多方法來測試和最佳化多節點配置。縱向擴充套件更廣泛的基礎設施。為確保人工智慧獲得成功,你需要驗證推理鏈路中的每一個環節。檢查現有的技術平臺、網路和儲存,以增加可用的資料量,改善時效性和延遲。此舉將最大限度減少未來遭遇瓶頸的可能性,同時最大限度提高從資料來源中獲得的價值。調整和最佳化概念驗證解決方案。隨著時間推移,你會積累更多的技能,用於提升和增強你所部署的人工智慧解決方案。為了獲得更好的結果,你可以最佳化資料監管和打標籤等領域的軟體,也可以嘗試訓練和部署新模型。橫向擴充套件至其它業務場景。你的概念驗證可能涵蓋其它業務領域的應用,例如預測性維護解決方案之前被部署到製造環境的某一個區域,現在可對其實施擴充套件。你可以採用一組方法來管理如何在更廣泛的使用者群內擴充套件概念驗證。管理和運營規劃。就本質而言,許多人工智慧應用案例都要求系統實時執行推理,而不是在離線或批處理模式下執行。此外,隨著時間推移,可能需要重新訓練並更新模型。這些因素對服務交付提出了一些額外要求。要確保預先分配了足夠的時間和技能資源,以便繼續提供概念驗證。原文連結:https://www.shangyexinzhi.com/article/details/id-125177/