看點:解讀被蘋果獨佔的 Dark Sky 背後技術:AI 精準預測 10 分鐘後會不會下雨。
智東西 4 月 8 日訊息,近期,CNN 等多家媒體報道了蘋果公司對天氣應用 Dark Sky 的收購,稱蘋果計劃在 7 月前把該款 App 從安卓平臺下架。這是蘋果首次收購第三方天氣應用。
粗略統計,僅與 iOS13 系統相容的天氣 App 就有 100 多個,蘋果自家也有天氣應用。在這種前提下,Dark Sky 憑藉什麼優勢得到科技巨頭蘋果的青睞?被納入到 iOS 閉環生態之中?
傳統天氣預報播報未來 24 小時天氣,不夠準確也已過時,而在開源的世界裡,播報未來 10 分鐘的天氣變化並不是難題。
Dark Sky 正是一款以分鐘級別準確預測使用者所在地未來一小時降雨情況的應用。隨時隨地,只要使用者開啟應用,它會迅速基於使用者定位播報天氣。比如,當前地區 5 分鐘後有強降雨、將持續 15 分鐘等。
有趣的是,Dark Sky 並不是基於氣象學方法做出天氣預測,而是別出心裁地只採用了大資料分析模型。
Dark Sky 的主創團隊也十分“特別”。三位創始人中,Adam Grossman 是物理學出身,Jay LaPorte 和 Jack Turner 研究電腦科學。團隊其他成員則是網路開發人員和後端工程師。換句話說,整個團隊都沒有氣象學背景。
就是這樣一群半路出家的“氣象工作者”,做出了這款倍受好評的天氣應用。
▲Dark Sky 聯合創始人:Jay LaPorte(左),Adam Grossman(中),Jack Turner(右)
01
大資料分析:剝離干擾資訊,準確插值預測
據 Dark Sky 聯合創始人亞當·格羅斯曼(Adam Grossman)介紹,Dark Sky 使用的雷達資料均來自美國國家海洋和大氣管理局(NOAA)。
NOAA 運營著一個覆蓋面極廣的氣象監控網路。該網路由超過 140 個雷達組成,對美國全境和一些其他地方形成了覆蓋。法律規定美國公民可以免費獲取這些雷達資料。
Dark Sky 團隊以二進位制格式下載這些資料,之後再進行必要的四步處理。
1、FANN 分離噪聲和非噪聲
除了有用的氣象資料,雷達網路還會收集到一些噪聲,比如地面反射波、蟲鳥的遷徙活動和一些人類活動等。這些資訊有可能被誤認為是降水訊號。因此,第一步要對雷達資料進行篩選。
據悉,噪聲大部分由低強度資料組成(即圖中淺藍色區域)。Dark Sky 團隊會先將所有低強度資料不加區分地刪除。但是,除了噪聲資料以外,這一步操作也移除了風暴前緣和後緣的有價值資料。而這部分丟失的資料對於預測降雨情況至關重要。
為了彌補這部分資料的丟失,Dark Sky 團隊引入了 AI 技術,使用快速人工神經網路庫(FANN)建立模型。
研究人員發現,噪聲資料不僅是低強度的,而且具有一種可識別的“紋理”。經過大量的資料訓練後,FANN 模型能夠準確地識別出這種“紋理”,進而將數以千計的雷達資料分為兩類:噪聲和非噪聲。
研究人員稱訓練過程需要持續一段時間,但最終得到了一個簡潔、快速的程式。該模型可以識別 90~95% 的噪音,幾乎沒有誤報。
▲資料分離結果
2、CV 演算法,提取風暴速度
氣象系統是典型的非線性動力系統,十分混亂複雜。在進行天氣預測時,要考慮到許多因素,比如複雜的流體動力學原理、地球的旋轉角度、地勢的不平坦情況、注入系統的太陽能等等。
這也是一個世紀以來,氣象學家設計出了各種複雜模型,但仍無法提供準確天氣預測的原因。
但是,Dark Sky 團隊注意到,氣象系統的變化在更小的時間尺度上會趨於線性。例如,在天空飄動的積雲會更傾向於以相對直線運動。
當把時間尺度縮小時,降水帶也會更加連貫,甚至在幾分鐘的時間間隔內表現為線性變化。有一些情況下,這個線性過程可以持續一個小時或更久。
為了量化這個過程,研究人員引入了計算機視覺(CV)模型。利用開源計算機視覺庫 OpenCV 中的光流與目標跟蹤演算法,研究團隊對多個雷達影象幀進行了比較,創建出了一個速度分佈圖。
為了使結果更加直觀,研究人員用顏色替換箭頭,製作出一張三通道影象。影象中,紅色代表x方向的速度,藍色代表y方向的速度,綠色代表風暴強度的變化。
3、GPU 完成預測和動畫製作
研究人員會將速度影象輸入 iPhone 或 iPad 上的 GPU,風暴預測過程和動畫製作過程都在 GPU 中完成。
研究人員指出,由於不同風暴的特徵差異、地理環境的不同等,預測結果會有所出入。例如,如果風暴更連貫和穩定,能夠預測的時間就會更長。
4、誤碼監測
為了保證預測的準確性,Dark Sky 團隊會對每一次預測進行誤碼監測。
據介紹,研究人員會用預測結果與實際天氣情況進行對比,從而確定預測的誤差有多大。此外,研究人員還會對每個雷達站進行實時檢查,從而保證預測結果的準確性。
根據 ForcastWatch4 月份報道,去年一年 Dark Sky 在美國加利福尼亞州聖荷西的預報準確率達到了 80.91%,今年三月份達到 87.93%。
02
整合 GPS 定位,進行微氣候調整
除了準確的預測,Dark Sky 的另一大賣點是“超本地化(Hyper-local)”。為了實現超本地化的功能,Dark Sky 需要獲取使用者的準確定位資訊。
根據外媒 FastCompany 報道,Dark Sky 會根據地球上某個點的物理引數,對雷達影象的預測結果進行調整。這些引數包括使用者所在地的海拔、坡度、到最近水域的距離、熱島效應情況等。
進行微氣候調整後,預測結果會更加精準。例如,假如 GPS 訊號顯示使用者正在湖邊,預測的氣溫可能就會略微升高,更符合使用者的體感溫度。
03
宗旨:向用戶呈現所有可能性
研究團隊認為,大資料分析提供了一種提高天氣預報準確性的手段,但是人類永遠不可能 100% 地準確預測天氣。為了向用戶傳達這種觀念,Dark Sky 中的預測結果總是以百分比形式顯示。
Dark Sky 聯合創始人格羅斯曼認為這種顯示方式提供了一定的透明度。“(以往的)天氣預報缺少的最重要的東西是誤差和不確定性。”他說到。
04
結語:Dark Sky 指明天氣預報新思路
Dark Sky 按照大資料分析而非氣象學方法來做天氣預測,還集成了 GPS 定位功能,實現了在較短時間內的精準預測,由此吸引了大批受眾,被稱為最準確的天氣預報 App。
但是,研究團隊也指出 Dark Sky 的短板是無法進行較長時間範圍的預測,正如創始人格羅斯曼所說:“我們的系統無法預測未來 6 個小時內的狀況。”
有相關人士指出,蘋果正是看中了 Dark Sky 在短時間內的精準預測能力,或將把 Dark Sky 整合到自己的天氣應用中。目前蘋果未就這種說法發表評論,但品牌戰略家、使用者體驗設計師 Parker Ortolani 據此設計出了一版概念圖。
參考信源:CNN,FastCompany,phoneArena,iMore,ForcastWatch
來自: 智東西(ID:zhidxcom)