首頁>Club>
4
回覆列表
  • 1 # 竹子姐的檀指間

    我們應該還記得那個叫“阿爾法狗”的傢伙。天下棋譜,瞭然於心,勤學苦練,精進棋藝,前年他以4-1打敗世界冠軍李世石,從此獨孤求敗。

    去年他的師弟,同樣出自谷歌Deepmind的阿爾法元(Alpha Zero),出山了。此貨一篇棋譜也沒讀過,也沒受到過任何人的指點。一副棋盤,黑白兩子,從零開始,自參自悟,他與師兄阿爾法狗交手,100-0,完勝而歸。

    按照Deepmind開發團隊的說法,阿法元不僅戰勝了此前開發過的所有版本的阿法狗,且首次實現了完全脫離人類的自我學習。這是一種“恐怖”級別的機器學習能力。

    我們都已經讀書學習十幾年了,不禁要問:“機器學習”到底學了什麼?怎麼學的?

    通俗的講,機器學習就是學習一種專門的識別能力(或預測能力)。

    “識別能力”又是什麼意思呢?

    那舉個例子吧,有這種學習能力的軟體,在看了很多張貓咪和其它的照片後,如果再看到一張照片,就能識別出這張照片是否是貓咪照片。(訓練出一個能識別是否為貓咪照片的分類器。)

    為什麼還要特意說“專有”呢?

    因為上邊那個例子中學習到的能力,只能用來識別貓咪,不能用來識別其它動物。如果需要狗狗照片的識別能力,需要再次專門訓練。如果要同時能夠識別狗狗和貓咪,需要把貓咪、狗狗和其它照片歸類後給那個軟體看才行。(分類器是針對特定問題的,不存在通用分類器。)

    就好比要從一堆鬆餅中辨認出哪個是吉娃娃

    怎麼又提到“歸類”呢?

    就是說,給照片先要按照片內容人工歸為三類:貓咪照片、狗狗照片、其它照片,給軟體每看其中一張照片的同時,要告訴它:這是一張貓咪(或狗狗、其它)的照片。軟體看的多了,就知道貓咪類照片、狗狗類照片和其它類照片的差別。(分類器訓練時,需要使用已經歸類的帶標籤的資料,所謂有監督的學習。)

    學習的過程,通俗的說,就是見得多了自然識貨。

    能說的再具體一點嗎?

    整個過程可以分為兩個階段:多見的學習階段,和 識貨的應用階段。學習階段要看很多已經歸類的照片,總結出一些規律,比如“貓咪的耳朵都是尖的、臉是圓的;狗狗的耳朵都是耷拉的、臉是長的,嘴是突出的”。總結出的規律,還有一個高大上的名詞“模型”。在應用階段,就是運用這個規律(模型),比如看到一個照片中的動物,耳朵都是尖的、臉是圓的,就識別出這是一隻貓咪。以下是這個過程的示意圖。

    圖中“特徵提取”又是個什麼意思呢?

    還是繼續上邊的例子來說明吧。看到了一張貓咪或狗狗的照片,照片的數字化表示是一長串0和1的數字,按圖片約定的格式,這些數字會表示照片中哪個位置(畫素)上是什麼顏色。這些最原始的畫素資訊,和照片承載的“貓咪照片”這個資訊,中間跨度很大,所以原始的畫素資訊需要被提煉為一些概要資訊(特徵),比如,色塊的分佈、紋理、輪廓等。提煉這些概要資訊--特徵的過程,就是所謂的特徵提取。

    “特徵”有什麼用呢?

    訓練學習的過程,就是把提取獲得的特徵和類別建立聯絡的過程,獲得特徵與類別對應關係的規律(模型)。在應用階段,也是先要對被識別的照片做同樣的提煉處理,產生特徵資訊,然後用學習獲得的規律做推測得出所屬類別的結論。

    “特徵提取”看來是很重要又很麻煩的事啊。 確實如此。在機器學習中,設計和提取好的特徵是很重要的工作環節,圍繞這個問題有“特徵工程”這麼個方向,並發展出特徵學習,以及深度學習。

    說了這麼多,你懂了麼?

    機器學習正在進步,我們似乎正在不斷接近我們心中的人工智慧目標。語音識別、影象檢測、機器翻譯、風格遷移等技術已經在我們的實際生活中開始得到了應用,但機器學習的發展仍還在繼續,甚至被認為有可能徹底改變人類文明的發展方向乃至人類自身,而我們需要做的就是不斷學習,掌握這門新的技術,創造更多不可思議。

  • 中秋節和大豐收的關聯?
  • 你如何看待當年的NBA得分王、籃球名人堂成員丹特利,最後去做了交通協管員?