回覆列表
  • 1 # 機器之心Pro

    谷歌近期的確是成果頗豐,接連發了好幾篇部落格,分別介紹了自動語音分離、無監督細胞熒游標記和AR顯微鏡癌症檢測的深度學習應用。

    1 自動語音分離在《Looking to Listen at the Cocktail Party》一文中,谷歌提出了一種深度學習音訊-視覺模型,用於將單個語音訊號與背景噪聲、其他人聲等混合聲音分離開來。在這篇文章中,谷歌透過計算生成影片,增強其中特定人員的語音,同時減弱其他人的聲音。研究者的方法用在具有單個音訊軌道的普通影片上,使用者需要做的就是在影片中選出他們想要聽到的說話人的面部,或者結合語境用演算法選出這樣的人。這種方法用途廣泛,從影片中的語音增強和識別、影片會議,到改進助聽器,不一而足,尤其適用於有多個說話人的情景。

    這項技術的獨特之處是結合了輸入影片的聽覺和視覺訊號來分離語音。直觀地講,人的嘴的運動應當與該人說話時產生的聲音相關聯,這反過來又可以幫助識別音訊的哪些部分對應於該人。視覺訊號不僅在混合語音的情況下顯著提高了語音分離質量(與僅僅使用音訊的語音分離相比,正如在本文中所證明的),但是重要的是,它還將分離的乾淨語音軌道與影片中的可見說話者相關聯。

    谷歌認為該項技術有很廣泛的應用前景,目前正在探索如何將該技術整合到谷歌的產品中,敬請期待!

    2 無監督細胞熒游標記谷歌在《細胞》(Cell)雜誌上發表了一篇名為《In Silico Labeling: Predicting Fluorescent Labels in Unlabeled Images》的文章。在論文中,研究者指出,深層神經網路可以從透射光影象預測熒光影象,在不對細胞做出改變的情況下生成標記的有用影象,同時有可能實現未修飾細胞的縱向研究、用於細胞治療的微創細胞篩選以及使用大量同時標記的研究。此外,谷歌還開源了模型、完整的訓練和測試資料、經過培訓的模型檢查點及示例程式碼。

    上畫展示了相同細胞的透射光影象、熒光影象,以及用谷歌的模型預測的熒游標記。Outset 2 表明儘管輸入影象中有偽影,該模型也可以預測正確的標記。Outset 3 表明模型推斷出這些結構是軸突,可能是因為它們離最近鄰的細胞比較遠。Outset 4 表明模型可以發現頂部很難察覺的細胞,並正確地將左側的目標識別為無 DNA 的細胞碎片。

    3 AR顯微鏡癌症檢測谷歌在美國癌症研究協會(AACR)年會上發表演講,介紹論文《An Augmented Reality Microscope for Real­time Automated Detection of Cancer》(under review)。演講介紹了一種增強現實顯微鏡(ARM)原型平臺,有望幫助加速和促進世界各地病理醫生對深度學習工具的採用。該平臺包含改良光學顯微鏡,可以實時地將影象分析和機器學習演算法結果直接呈現。重要的是,ARM 平臺可以利用低價、易獲取的元件進行改造,以適應世界各地醫院、診所的現有光學顯微鏡,且無需分析組織的整張幻燈片數字影象。

    左:ARM 的概述圖。數字攝像頭捕捉和使用者相同的視野,並將影象傳遞給附加的計算單元,以執行機器學習模型進行實時推斷。結果將被反饋給自定義的 AR 顯示器,該顯示器和目鏡串聯,可將模型輸出投影到和幻燈片相同的平面上。右:裝置原型,已被改造成典型的臨床應用級別光學顯微鏡。

    透過 ARM 目鏡觀察到的影象示例。這些影象展示了淋巴結癌細胞轉移示例,顯微鏡物鏡分別是 4x、10x、20x 和 40x。

    谷歌認為 ARM 可以對世界醫療狀況產生巨大影響,尤其是發展中國家的傳染病診斷,如肺結核、瘧疾等。此外,即使對於採用了數字化病理診斷工作流程的醫院,ARM 也可與數字化工作流程結合使用,數字化工作流程中掃描器仍然面臨很大挑戰或者仍然需要快速週轉(如細胞學檢查、熒光成像或術中冰凍切片)。當然,光學顯微鏡在病理科之外的很多方面也被證明有效,谷歌認為 ARM 可以得到大範圍的應用,如醫療、生命科學研究和材料科學。谷歌將繼續探索 ARM,幫助加速機器學習技術對世界的積極影響。

  • 2 # 24曉識

    分享最近6月7月份的google釋出的兩篇關於深度學習應用的文章,生物醫學和機器人,google在深度學習方面的研究方向很多,有很多底層演算法的創新和最佳化,希望國內企業多多努力,一起加油!

    1.automating drug discoveries using computer vision,利用計算機視覺實現藥物發現的自動化。這篇文章來自谷歌brain team的首席科學家vincent vanhoucke.

    文中指出該項研究的目的在於幫助科學家在實驗中自動識別出蛋白質晶體,蛋白質晶體是生物醫學研究中發現複雜生物分子結構的關鍵步驟,這種結構決定了分子功能,它幫助科學家設計出專門針對該功能的藥物。 但是蛋白質晶體很難被發現,以往主要透過目視檢查來識別蛋白質晶體,容易發生人為錯誤而錯過它,錯過它會導致失去重要的生物醫學發現的機會。 目前研究討論透過機器識別可以獲得超過94%的精度,對這一領域的研究來說是會是一個很大的進步。

    直觀講就是透過機器視覺識別出科學家需要的晶體,不過這種晶體非常小,結構各不相同,且需要足夠樣本資料來訓練和深度學習,這些都增加了很大的難度。

    如果這項研究獲得成功,那麼未來新藥物的研究速度會有很大提升,意義非凡。

    2.Scalable Deep Reinforcement Learning for Robotic Manipulation,機器人操作的可擴充套件深度強化學習。文章來自Alex Irpan,軟體工程師,谷歌大腦團隊和Peter Pastor,高階機器人學家。

    總結下來就是需要機器人具備人類的一切感知和反應能力,這真的很難,目前科學家們用7個機器人執行4個月的時間,用15到30%的時間採集資料,當它動作執行的更好一些的時候,從資料採集切換到學習模型,這項演算法用相機拍到的影象,然後指揮手臂和夾鉗如何移動,目前已經收集了1000多個不同的離線資料。

  • 中秋節和大豐收的關聯?
  • 冬天來了,怎麼做下飯的醃蘿蔔乾?