回覆列表
  • 1 # 嘟嘟黑科技

    具體來說,則是自動根據自然語言處理處理,進行自動歸納,和打標籤。使用者標籤我們自然看不到的,當然自己喜歡看哪方面的大概也知道吧?文章標籤和使用者標籤匹配度大於80%,才會進行推薦。臨界推薦指數一越高,推薦的量就越大。

    第三次的推薦量,主要看臨界推薦指數二 加 發文時間

    臨界推薦指數二越大,發文時間越短,那麼推薦量就越大。相對應的,發文時間越長推薦量就越小,臨界推薦指數二越小,文章推薦量就越小。

    關於前三次推薦,一般在12到24小時內完成,在這之後,就是第四第五次了,這時候的推薦量寥寥無幾。

    第四次推薦是發文通過後的一個星期,有一些推薦量,具體指標不明,跨度太大,無法量化描述。第五次推薦是發表後一個月,屬於炸屍性推薦,基本可以無視。

  • 2 # 大娛塘

    11-11-2

  • 3 # 煙雨lo臺

    官方釋出的,才是最好的,就不在此贅述了,直接上鍊接:

    https://www.toutiao.com/i6511211182064402951/

  • 4 # 人間煙火琴棋酒

    (上)

    2.列舉古代敬惜字紙的例子,中國古代對字紙非常崇拜。因為字=內容生產= 傳播分發。古代內容生產和內容分發是完全合一的,而現代內容生產和內容分發則是分離的。

    3. 看待諮訊發展的一個特別視角,關鍵詞就是內容生產和內容分發。南方週末黃金時代的三駕馬車說法,一個報社最重要的三股力量是採編、經營、發行。

    4.影響內容生產、內容分發的三大因素:受教育人口質量與數量,技術進步和機制。

    (中)

    1.網際網路技術發展,門戶網際網路開始誕生,少數網站有內容採編的權力,集納所有的媒體內容,讓全華人民來看,即門戶模式。入口網站對資訊的傳播非常重要,入口網站的分發能力非常強。

    2.07,08年中國進入內容與分發雙軌制時代。報社掌握內容生產和分發,網際網路放大分發效果,中心式分發推動乏力。

    2.非中心分發模式有兩種:演算法分發和社交分發。

    3.移動網際網路推動非中心式分發大爆發:上網人數提升,線上時長提升,人機合一。

    4.非中心式分發推動資訊大爆發。

    5.社交分發有利有弊,粉絲價值,冷啟動難,紅利消失,不夠精準。

    6.重大變數:短影片拉低內容生產和消費門檻。

    (下)

    1.演算法推薦的基本流程:消重,稽核和推薦。

    2.演算法推薦對內容生產的新需求 :數量,質量和豐富性。

    3.演算法推薦對內容質量的把控:攔截低質,獎勵優質,模型識別,注重反饋。

  • 5 # TsinghuaNLP

    推薦系統的本質:從巨大的內容池中為使用者匹配出感興趣的內容

    推薦系統的本質,就是從一個巨大的內容池裡,給當前使用者匹配出幾篇感興趣的文章。這個內容池有幾十萬、上百萬的內容,涵蓋文章、圖片、小影片、問答等各種各樣的體裁。資訊的匹配主要依據三個要素:使用者、內容、感興趣

    下面我會把這 3 個要素詳細地介紹一下。

    其次,內容刻畫

    推薦演算法的實質:擬合一個使用者對內容滿意度的函式

    前面簡單介紹了推薦演算法的 3 個要素,那麼推薦演算法本身是什麼呢?它實際上是一個擬合你對內容滿意度的函式。它會估算你進入一篇文章後的點選機率,看完後的點贊、評論機率;在此基礎上,它還會給出你對這篇內容的正面評論、負面評論與中性評論的機率。

    一篇文章在推薦系統中的生命週期:初審 - 冷啟動 - 正常推薦 - 複審

    當大家發表完一篇文章,拍完一個影片後,就會生成一個內容。這個內容在整個系統裡面經過如下一些步驟。

    內容初審

    首先就是要對這個內容進行稽核,也叫初審。

    初審的目的在於判斷這篇文章有沒有違反國家有關法律的風險。在這一過程中,機器會判斷優先順序,將內容交給不同的人稽核。在機器和人工的共同配合下,內容會以較快的速度透過初審,從而立即展現在讀者面前。

    冷啟動

    在內容稽核之後就是“冷啟動”的過程。“冷啟動”,是一個推薦上的概念。新的文章發表之後,和之前那些已經在平臺上火起來的文章相比,具備一定的劣勢。這些現在還是“冷”的文章中的大部分可能是火不起來。這裡就存在一個矛盾:如果不把這篇文章展現給使用者,就不知道將來會不會火起來。

    1

    資訊推薦系統本質上要解決使用者、環境和資訊的匹配。

    2

    點選率、閱讀時間、點贊、評論、轉發,這些都是可以量化的。但一個大體量的推薦系統,服務使用者眾多,不能完全由指標評估,引入資料以外的要素,也很重要。有些演算法可以完成,有些演算法還做不到、做的不好,這就需要內容干預。

    4

    演算法推薦要達到不錯的效果,需要解決好這四類特徵:相關性特徵、環境特徵、熱度特徵和協同特徵。

    相關性特徵,解決內容和使用者的匹配。環境特徵,解決基礎特徵和匹配。熱度特徵,在冷啟動上很有效。協同特徵,考慮相似使用者的興趣,在一定程度上解決所謂演算法越推越窄的問題。

    完全依賴模型推薦成本過高,因此有了簡化策略的召回模型。基於召回策略,把一個海量、無法把握的內容庫,變成一個相對小、可以把握的內容庫,再進入推薦模型。這樣有效平衡了計算成本和效果。

    文字特徵對於推薦的獨特價值在於,沒有文字特徵,推薦引擎無法工作,同時,文字特徵顆粒度越細,冷啟動能力越強。

    7

    語義標籤的效果,是檢查一個公司NLP(自然語言處理)的試金石。

    頻道、興趣表達等重要產品功能,需要一個有明確定義、容易理解的文字標籤體系。所以,在隱式語義特徵已經可以很好地幫助推薦,且做好語義標籤需要投入遠大於隱式語義特徵的情況下,我們仍然需要做好語義標籤。

    8

    除了使用者的自然標籤,推薦還需要考慮很多複雜的情況:

    1)過濾噪聲:過濾停留時間短的點選,打擊標題黨;2)懲罰熱點:使用者在熱門文章上的動作做降權處理;3)時間衰減:隨著使用者動作的增加,老的特徵權重會隨時間衰減,新動作貢獻的特徵權重會更大;4)懲罰展現:如果一篇推薦給使用者的文章沒有被點選,相關特徵(類別、關鍵詞、來源)權重會被懲罰;5)考慮全域性背景:考慮給定特徵的人均點選比例。

    9

    比起批次計算使用者標籤,採用流式計算框架,可以大大節省計算機資源,可以準實時完成使用者興趣模型的更新。幾十臺機器就可以支撐每天數千萬使用者的興趣模型更新,99%的使用者可以實現發生動作後10分鐘模型更新。

    10

    影響推薦效果的因素有很多,我們需要一個完備的評估體系,不能只看單一指標,點選率、留存、收入或是互動,我們需要看很多指標,做綜合評估:兼顧短期指標和長期指標,兼顧使用者指標和生態指標,注意協同效應的影響,有時候需要做徹底的統計隔離等。

    11

    很多公司的演算法做得不好,不是人的問題,是實驗平臺的問題。

    如果A/B Test,每次資料都是錯的,不是這兒錯就是那兒錯,總上不了線,這個事就廢了。而一個強大的實驗平臺,可以實現每天數百個實驗同時線上,高效管理和分配實驗流量,降低實驗分析成本,提高演算法迭代效率。

  • 6 # 非著名攻城獅

    複審,當推薦到一定程度後,系統會給使用者的反饋情況進行復審,比如說有人舉報,或者負面評論過多,如果在複審種,發現你屬於標題黨或者內容過於負向,將系統將會不再推薦,這一階段會有人工參與,這是你是否成為爆款的最後一步,很多一開始幾萬閱讀,然後就不推薦了,就是在這一步被終止了。

    以下四類模型會對推薦起重要作用

    第一類是相關性特徵,就是評估內容的屬性和與使用者是否匹配。

    第二類是環境特徵,包括地理位置、時間。

    這些既是偏置特徵,也能以此構建一些匹配特徵。

    第三類是熱度特徵。

    包括全域性熱度、分類熱度,主題熱度,以及關鍵詞熱度等。內容熱度資訊在大的推薦系統特別在使用者冷啟動的時候非常有效。

    第四類是協同特徵,它可以在部分程度上幫助解決所謂演算法越推越窄的問題。

  • 7 # 九合壹匡

    如果第一階段需要達到這此指標透過,則進入下一階段推薦,再給你10000多的推薦,達到10000推 薦考核的指標,再給你更大的推薦。

    機器推薦都達標後,進入人工稽核,人工稽核沒有問題的話,就可以給你加大推薦。

  • 8 # 三度扯歷史

    關鍵詞、關鍵詞、關鍵詞!

    重要的事情說三遍。

    這個問題之前我先問你幾個問題:

    1.如果一個人迎面向你走來,你是如何判斷他是男人還是女人的呢?

    答案是:用眼睛看他的外觀,看他的穿著打扮。

    對於一般人來說長頭髮的就是女人,短頭髮的就是男人;穿男性服裝的就是男生,穿女性服裝的就是女人;比如穿裙子的必定是女人。還可以看相貌。

    2.如果讓你找到你的老公,你去哪裡找呢?

    答案是:根據經驗,如果他沒有在你的身邊,那麼有很大機率是在家裡或者公司。

    3.如何在一群人當中找到你喜歡的?

    答案是:你可能喜歡漂亮的,也可能喜歡個子高的,也可能喜歡膚白貌美的,也可能喜歡水蛇腰的,以至於這些特徵,你就能夠在一群人當中一眼找到自己所喜歡的那一個人。

    4.如何讓一群人同時在人群中找到一個人?

    答案是:把這一個人的外貌特徵告訴這一群人。

    根據上面的問題,你有所察覺了嗎?

    第1個問題當中,你要判斷一個人是男人還是女人,只能是透過他的外貌特徵去判斷,嗯,他的外貌特徵包括了頭髮,相貌,穿著打扮等等。

    都是透過一些自己所喜歡的關鍵詞找到自己所喜歡的內容

    第4個問題當中,如何讓一群人同時在人群當中找到一個人,這其實與我們平時在瀏覽器當中搜尋,相對應的內容是一樣的,我們需要輸入不同的關鍵詞匹配出來的內容,那一定是我們需要的。

    如果沒有,那就加大對關鍵詞的搜尋

    說白了就是你所喜歡的這個關鍵詞,正好和這一篇文章的關鍵詞相匹配,所以機器就把它推薦給你了。

    如果喜歡那就擴大關鍵詞範圍,讓文章關鍵詞相對應的或者是相關聯的關鍵詞使用者看到這篇內容,如果他們也喜歡,那麼就繼續擴大關鍵詞範圍,也就是所謂的擴大推薦量。

    還有一種可能是把你的內容推薦給1000個使用者之後,發現這些使用者並不喜歡你的那種,那他就會降權處理,所謂的降權處理指的就是這樣的推薦量,因為機器判定你的這篇內容可能是相對來說比較低質量的,或者是沒有價值的。

    嚴重的可能會封號。

  • 中秋節和大豐收的關聯?
  • 為什麼現在很多小學女生都燙髮染髮,現在的學校已經這麼隨便了嗎?