首頁>Club>
4
回覆列表
  • 1 # 使用者8487041297854

    多模態機器學習主要有五個方面的工作

    1.Representation 主要任務是學習如何更好的提取和表示多模態資料的特徵資訊,以利用多模態資料的互補性

    2.Translation 主要任務是如何將資料從一種模態轉換(對映)到另一種模態

    3.Alignment 主要任務是識別在兩種或更多不同模態的(子)元素之間的直接關係

    4.Fusion 主要任務是將來自兩種或兩種以上模態的資訊結合起來進行預測

    5.Co-learning 協同學習是在不同模態資料、特徵和模型之間轉移知識

    多模態特徵表示(representation)

    對原始資料提取一個好的特徵表示一直是機器學習關注的重要問題,好的特徵表示主要有平滑性、時間和空間一致性、稀疏性和自然聚類等特性。特徵表示代表了一個實體資料,一般用張量來表示。實體可以是一個影象,音訊樣本,單個詞,或一個句子。多模態的特徵表示是使用來自多個此類實體的資訊,主要存在的問題有:(1)如何組合來自不同模態的資料 (2)如何處理不同模態不同程度的噪音 (3)如何處理缺失資料。

    多模態表示有兩種:聯合特徵表示(Joint representations)和協同特徵表示(coordinated representations)。聯合特徵表示將各模態資訊對映到相同的特徵空間中,而協同特徵表示分別對映每個模態的資訊,但是要保證對映後的每個模態之間存在一定的約束,使它們進入所謂的協同空間。

  • 中秋節和大豐收的關聯?
  • 明明項羽當了老大,為啥西楚不算一個朝代,“楚朝”為何被否認?