首頁>科技>

阿里妹導讀:近幾年人工智慧、機器學習等詞漫天遍地,似乎有一種無AI,無研發,無AI,無測試的感覺。有人說:不帶上“智慧”二字,都不好意思說自己是創新。我們先暫且不評論對錯,只探討這背後值得我們思考的問題。

在測試領域,人工智慧和測試是什麼關係?為什麼測試領域會談及人工智慧?如果測試工程師不懂AI,是否有未來,測試人員該如何看待“AI測試”?帶著這些問題,阿里高階測試開發專家汪維希望藉此和大家做一些交流和探討。

測試發展變革史

借用一幅圖先讓我們快速來回溯一下測試變革所經歷的幾個不同的時期,從最早期的純手工測試,隨著整個IT技術的發展,測試也歷經了不少的變革,每一次變革我們不難發現側重點都有所不同。

從最初的驗證軟體的可工作狀態,到強調釋放生產力的自動化訴求,從封閉式的自動化能力到基於社群模式的開放式能力建設,再到從更加全面的研發流程體系來構建的持續整合的自動化能力,我們不難發現每次變革背後似乎都有一個核心詞在推動,那就是“效率”。但這個效率又有所不同,就是不同階段對於效率在逐漸從單點效率往系統性效率邁進。

如果我們認為前邊四個階段都是基於規則為核心的測試,而未來則會打破這種模式,推動這個核心改變的模式可能主要來源兩個方面,第一是研發技術的升級,第二是研發模式的更加敏捷和分散式開發,這兩者都打破了以規則為核心的測試理念。

因為我們可能面對更多的研發人員,更復雜的研發場景,更復雜多變的應用系統,在此基礎上便催生了對於軟體測試新的思考,那便是如何讓軟體測試變得更加的“Smart”,這便是我們正在經歷的時代,不過很不幸的是,我們可能大多數情況下測試還不夠“Smart”,很有可能我們在某些情況下我們還處於“1980-1990”的時代,我想這也是測試人員之痛。

圖片來源:https://becominghuman.ai/ai-in-testing-the-third-wave-of-automation-cfdd43f55d9c

現在測試發展面臨的主要挑戰

對於軟體測試而言,其實網際網路的發展和興起對軟體測試的發展帶來了巨大的挑戰,這不得不從本質問題說起,相對網際網路時代之前的傳統IT時代,軟體通常研發週期較長,軟體功能龐大,軟體更新頻率較低,軟體是作為支撐企業業務發展的配套設施,之所以叫配套設施,也就是對於企業而言及時沒有這個配套設施,業務發展依然可以進行,無非是管理效率可能會受到一些影響,而網際網路時代,其本質上軟體本身就是企業的商業模式的核心能力,不再僅僅是一個配套設施,而是核心設施,核心能力,其直接決定了在複雜多變的商業環境中是否具備核心競爭力。

因此對於軟體無論是在研發模式、交付模式上都提出了更高、更快的要求,“敏捷”研發思想和模式應運而生,敏捷的本質是為了獲得更快的Go To Market的能力,從而讓企業能獲得更快的商機,在敏捷模式下,本身是一種好事,這種模式下需要軟體更快的交付能力,而不是等著專業的軟體測試人員慢吞吞的進行功能驗證。

如果不是等著專業的軟體測試人員進行測試,那還能誰來參與測試?開發人員?但是開發人員測試自己的軟體還並沒有成為主流,大多數開發人員不會寫測試來測試自己的程式碼,他們選擇手工測試或者等待專業的測試人員來測試他們的軟體,從而保證軟體可正確執行。

這正是測試面臨的挑戰,如何能讓研發能參與測試?很不幸的是,目前AI在此領域還不能幫助太多,但也並非完全不能做什麼,在理解這個問題之前,我覺得有一個很好的問題,就是我們不妨來思考一下自動化測試的6個層次與人工智慧的關係。

人工智慧測試的六個層次

什麼是自動化測試的6個層次?這6個層次是我目前看到的對於AI和自動化測試相對清晰的一個抽象,先簡單介紹一下這6個層次的來源,這是由Applitools 的高階架構師 Gil Tayar在 Craft Conference 2018上介紹他們如何將 AI 技術應用到自動化測試的內容中提到的6個層次,分別為:

層次一:完全沒有自動,你需要自己寫測試!

層次二:駕駛輔助——AI 可以檢視到頁面,幫助你寫出斷言。你還是要自己寫“驅動”應用程式的程式碼,但是 AI 可以檢查頁面,並確保頁面中的期望值是正確的。在這種模式下,軟體測試工程師需要自己用傳統技術解決流程驅動的問題,但無需在指令碼中做Expectation的校驗或者無需用指令碼方式寫Check Point,而把校驗的工作交由AI來完成,AI技術在此過程中核心起到輔助的作用。

層次三:部分自動化——雖然能分辨實際頁面和期望值的區別這一點已經很好了,但是第二層次的 AI 需要有更深層的理解。比如說,如果所有頁面都有相同的變更,AI 需要認識到這是相同的頁面,並向我們展示出這些變更。進一步來說,AI 需要檢視頁面的佈局和內容,將每個變更分類為內容變更或是佈局變更。如果我們要測試響應式 web 網站,這會非常有幫助,即使佈局有細微變更,內容也應該是相同的。這是 Applitools Eyes 這樣的工具所處的層次。在這種模式下,AI逐漸具備了貫穿上下文的能力,如果相對層次二而言,層次二停留在”點“上,層次三模式下的AI已經具備了”線“的輔助能力。

層次四:條件自動化——在第三層,軟體中檢測的問題和變更仍然需要人來審查。第三層的 AI 可以幫助我們分析變更,但不能僅僅通過檢視頁面判斷頁面是否正確,需要和期望值進行對比才能判斷。但是第四層的 AI 可以做到這一方面,甚至更多其他方面,因為它會使用到機器學習的技術。

比如說,第四層的 AI 可以從視覺化角度檢視頁面,根據標準設計規則,例如對齊、空格、顏色和字型使用以及佈局規則,判斷設計是否過關。AI 也能檢視頁面的內容,基於相同頁面之前的檢視,在沒有人工干預的情況下,判斷內容是否合理。在這種模式下,AI逐漸具備了自我學習的能力,能從”面“上進行輔助自動化,但這實現起來非常的困難,目前相對不夠成熟。

層次五:高度自動化——直到現在,所有 AI 都只是在自動化地進行檢查。儘管使用自動化軟體,還是需要手動啟動測試,需要點選連結,而第五層的 AI 可以自動啟動測試本身。AI 將通過觀察啟動應用程式的真實使用者的行為,理解如何自己啟動測試。這層的 AI 可以編寫測試,可以通過檢查點來測試頁面。

但這不是終點,它還需觀察人的行為,偶爾需要聽從測試人員的指令。在這種模式下,相對前邊的幾種層次,這個層次的AI已經擺脫了人工”驅動“的模式,核心改變就是從人工”驅動“發展為”AI“驅動,如果說前邊幾種模式還需要測試人員編寫流程驅動指令碼,而在這種模式下,測試人員將擺脫這一束縛。

層次六:完全自動化——我必須承認,這個層次有點恐怖。這個層次的 AI 可以和產品經理“交流”,理解產品的標準,自己寫測試,不需要人的幫助。這種模式可能是我們所希望追求的最高境界,或許發展到這個階段,測試這個崗位需要重新被定義。

小結

在我看來AI技術的發展應該是測試人員需要重點關注的領域,我們往往會因為有些技術可能當下並不成熟,或者當下並沒有很好的落地場景,從而忽略對未來技術的關注度,在測試領域對於AI的探索也是如此,同時不難發現在業界其實已經有非常多的公司已經在自己的商業化解決方案中注入了AI能力,這種趨勢也是值得我們持續關注,最後我個人比較推薦在AI領域的落地和時間可以嘗試從本文提到的6個層次模型中去由淺入深的探索,這有利於在AI和測試的道路上有層次的循序漸進。

最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 2020工博會:河南首個5G 無人礦山專案落戶河南能源焦煤