回覆列表
  • 1 # 來自Z時代

    確實,現在做人工智慧方向的工程師,有不少被稱為“調參俠”,但也並不全是。

    以我自己為例,我做cv方向(計算機視覺)的, 調參在我日常工作中佔的比例並不大。

    在CV這塊,除了超引數外,影響模型效果的主要還是要網路結構、資料和損失函式,這三方面確定下來後,調參基本花不了多少時間。

    迴歸正題!

    調參俠,到底調什麼參?

    在人工智慧裡面,引數大致可分為2大類:

    引數(parameters)/模型引數:由模型透過學習得到的變數,比如權重w和偏置b,這個多半是不能調節的,它是由神經網路自己學習出來的。

    超引數:在機器學習中,超引數是在神經網路訓練之前設定值的引數,而不是透過訓練得到的引數資料。常見的有學習率、迭代次數、隱藏層的層數、每層神經元的個數等。通常情況下,需要對超引數進行最佳化,給學習機選擇一組最優超引數,以提高學習的效能和效果。這一般是根據經驗進行設定,影響到權重w和偏置b大小的數值。

    為什麼會被稱為“調參俠”?

    主要原因有以下2個:

    多半是剛入門的演算法工程師做的事情,他們不是很懂神經網路的結構、資料分佈等等,只能透過調整超引數,以期望獲得較好的結果,這樣有時候是可行的;

    更重要的原因是,GitHub上開源了很多模型,並附上了預訓練引數,如常用的檢測、分割、分類等等,這些模型都非常成熟,大部分直接呼叫就可以,然後根據自己的訓練資料,稍加修改,就可以得到非常好的結果。公司只要結果,不要求創新,開源專案已經可以做到這點了,所以大多數只要調參即可。

    怎麼避免成為“調參俠”

    目前AI人才競爭越來越激烈,“調參俠”的時代已慢慢過去,這些事情其實根本不需要AI工程師來做,未來的研發工程師就可以承擔這些了! 幾年前如果熟練使用TensorFlow,同時掌握基本的AI演算法就可以很容易找到一份高薪的工作,但現在不一樣了,AI崗位的要求越來越高,對知識的深度也提出了更高的要求。

    要想跟上時代,得武裝自己,才能不被淘汰。

    對於真正的人工智慧工程師而言,他們往往是從資料和特徵下手的,同時還需要豐富的行業經驗。一定要記住一句行業內的諺語,資料和特徵才決定演算法 的上限,而選擇的演算法和引數只是決定了已逼近這個上限的速度。

  • 2 # 人工智慧和數字經濟

    人工智慧產品開發包括資料採集、預處理、資料探索、選擇演算法訓練模型。訓練模型主要選擇梯度下降演算法,透過調整啟用函式、隱藏層、池化層等不同引數,達到最優解。

  • 3 # 程式碼接盤俠

    調參俠其實和寫程式所說的碼農差不多的意味,是對從事這個行業人員的調侃。比如寫程式的,剛開始都會接觸增刪改查的業務,做多了都會說curd一樣。從事人工智慧還有許多的其他名稱,比如調包俠,指標奴。

    人工智慧的技術和知識還是很廣泛的,並不只是調參。還有資料和特徵工程,數學演算法知識等。

  • 4 # ElonMusk

    因為演算法封裝之後,最高大上的就只剩下調參了,什麼資料清洗,特徵選取與特徵工程不算什麼技術活了,能幹的人很多。就調參需要了解演算法。

  • 5 # glsensor

    只會用別人的模型的人唄,其實這也是外界以及從事人工智慧比較膚淺的人的一種誤解和偏見。人工智慧當然不能只用別人的模型。

  • 6 # NC少年

    調參並不可恥,好的調參俠,非常厲害

    演算法工程師技術上講,基本上只和資料和模型打交道。模型就是一個黑色魔法盒,而這個黑盒子就是透過資料和調參而來。

    模型中有兩類引數,一類我們叫權重,可學習的引數;一類叫超參,需要不停地實驗,來確定下來。所謂調參就是調教的後者。當然這些實驗,需要專業的設計技巧,不在本文範圍之內,感興趣的可以找吳恩達老師的書看看。

    很多人說演算法工程師是調參俠,沒技術含量。同樣都是xgb,為什麼有人能拿冠軍有人只能很弱?或許你會說特徵工程做的好。但換到影象和文字領域,模型的基本就是搭積木,這種搭積木也算是超參,模型的層數,模型的維度。

    一項超解析度比賽,韓國某支隊伍獲冠軍,把大家都認為理所當然的批標準化去掉,意外獲得了冠軍。

    實踐很重要,調參不可恥。調的好,可以拿冠軍。甚至可以將調參經驗寫成一篇論文。谷歌當時就有一篇論文,暴力的將各種函式嘗試了一遍,發表一篇論文。

    有時候是先走實踐,再猜測或推測出來的理論。對不對?別管黑貓白貓,能抓耗子就是好貓。目標為導向。

    並不是所有的調音師能超出美妙的音樂。雖然就那麼幾個音符。調參技巧弄得好,可以發論文,可以提升業務指標,帶來利潤。

    大道朝天,可能就兩條路:從理論到實踐,或從實踐道到理論要麼理論深,可以發各種論文。透過理論指導建模,獲得更好的效果。要麼實踐牛逼,可以拿各種資料比賽冠軍。要麼,都牛逼,那就是天才。比如透過實踐發現一種好的方法,然後再透過理論來證明他。

    不幸的是,大多數人一種都做不到。

    厲害的調參俠,也不是那麼容易當的。關鍵是思考,善於思考反思的人,無論是從理論還是實踐,都會比機械重複的拿來主義進步快,更容易成為大俠。

  • 7 # 張慕遠

    這…

    第一次看到這個稱呼,不過人工智慧領域確實是有點這種問題。

    我們舉一個簡單的例子,就拿現在比較火熱的人工智慧方法:深度神經網路來說吧。

    那麼什麼是深度神經網路呢?首先要從神經網路說起。

    顧名思義,神經網路就是當年科學家們用模擬人類神經元互相協調工作的辦法來實現人工智慧的一種理論演算法。

    在此再解釋一句,所謂的神經元,就是人類的思維活動的承載零部件,大家在腦中的一些思維活動都需要有神經元的參與。

    那什麼又叫深度神經網路呢?

    說白了就是幾層神經網路疊加在一起。更為具體的原理,我在此就不贅述了,這個深度神經網路較為簡單的說法,我們可以舉一個比較形象的例子來說明:

    現在我們需要解決一個問題,就是如何識別照片裡的某個動物,是人還是其他的什麼動物。

    我們現在採用深度神經網路的辦法,來對這張圖片進行識別。

    那麼一個人他具有哪些比較醒目的特徵呢?

    最為常見的,那就是有一個腦袋,有軀幹還有四肢。但是這裡就要存在一個問題,像平時生活中常見的小貓,小狗也是有一個腦袋,有一個軀幹,也有四肢。所以說我們深度神經網路的第1層問題就是需要把這個人的這個輪廓和貓狗之類的輪廓和人類相似的來區分開來。在此不得不又要引出一個概念輪廓相似,這是一個說簡單一點就是拓撲學上的含義。在此就不加深入講述了,感興趣的話可以自行搜尋拓撲學的相關內容。在使用這個深度神經網路第1層判別人和貓狗之間的區別的時候,它就會存在一個神經網路的引數問題,我們需要將這個引數調整到一個適當的程度,才能將人和動物區分開來。

    當然有了第1層區分之後,我們可能還有第2層以及更多層區分,比方說這個人是不是穿了衣服,這個人的膚色這個人的毛髮,比方說頭髮是長在頭上,而不是渾身上下都有。在這個時候,這一層的神經網路又會涉及到一個引數調整的問題,將引數調整到合適的值才能讓機器正確的識別是否穿衣服,毛髮是否都長在頭上等等等等。

    總之呢,我們從這個深度神經網路的識別的這個流程可以看到現在這些人工智慧,實際上就是一個對現有模型中的一些引數進行調整的過程,所以說樓主問題中的這個調參俠確實是名副其實。

  • 中秋節和大豐收的關聯?
  • JR·史密斯推特怒噴特朗普:乾點事吧,為什麼NBA球星大多數都不待見特朗普?