回覆列表
-
1 # cnBeta
-
2 # 查無此人30842114
原理很簡單,一個等邊三角形,如果投射到一個平面上,結果依然是等邊三角形(投射點與平面為垂直關係)。如果等邊三角形透投射到一個斜面上,其得到的結果就會發生扭曲。透過訓練電腦將扭曲的形態和斜面之間產生一種邏輯聯絡,於是電腦就可以“猜”出物體在三維空間中的座標資料,於是就能在電腦裡模擬出三維圖形。再進一步發展,透過將扭曲的圖形貼合套嵌到某個照片上,比如說一張人臉照片上,只要貼合套嵌得合適,同樣也可以將人臉照片轉化為三維模型。
谷歌母公司Alphabet旗下DeepMind最近開發了一種人工智慧技術,它可以在觀察2D平面圖像之後以3D渲染整個場景。目前一些人工智慧研究人員正在試圖教機器學習像人類一樣。我們不是以畫素為單位看世界,而是環顧我們的環境並對其中的一切進行假設。
DeepMind團隊則訓練了一個人工智慧如何從其未見的角度猜測事物的樣子。 DeepMind的科學家提出了一個生成查詢網路(Generative Query Network,GQN),這是一個神經網路,旨在教人工智慧如何從不同的角度想象物體的場景會是什麼樣子。基本上,人工智慧觀察場景的2D平面圖像,然後嘗試重新建立它。在這種情況下,重要的是DeepMind的人工智慧不使用任何人為標記的輸入等。它只觀察三幅影象,並開始預測場景的3D版本是什麼樣子。
研究人員正在努力實現“完全無監督的場景理解”。目前人工智慧尚未接受真實世界的影象訓練,因此下一步將從照片中渲染逼真的場景。未來,DeepMind基於GQN的人工智慧可能只使用照片就可以生成與現實世界幾乎完全相同的按需3D場景。