多模態特徵？

首頁>Club>2021-04-16 15:40

多模態特徵？

回覆列表

1 # 使用者8487041297854

多模態機器學習主要有五個方面的工作

1.Representation 主要任務是學習如何更好的提取和表示多模態資料的特徵資訊，以利用多模態資料的互補性

2.Translation 主要任務是如何將資料從一種模態轉換（對映）到另一種模態

3.Alignment 主要任務是識別在兩種或更多不同模態的(子)元素之間的直接關係
4.Fusion 主要任務是將來自兩種或兩種以上模態的資訊結合起來進行預測

5.Co-learning 協同學習是在不同模態資料、特徵和模型之間轉移知識

多模態特徵表示（representation）

對原始資料提取一個好的特徵表示一直是機器學習關注的重要問題，好的特徵表示主要有平滑性、時間和空間一致性、稀疏性和自然聚類等特性。特徵表示代表了一個實體資料，一般用張量來表示。實體可以是一個影象，音訊樣本，單個詞，或一個句子。多模態的特徵表示是使用來自多個此類實體的資訊，主要存在的問題有：（1）如何組合來自不同模態的資料（2）如何處理不同模態不同程度的噪音（3）如何處理缺失資料。

多模態表示有兩種：聯合特徵表示（Joint representations）和協同特徵表示（coordinated representations）。聯合特徵表示將各模態資訊對映到相同的特徵空間中，而協同特徵表示分別對映每個模態的資訊，但是要保證對映後的每個模態之間存在一定的約束，使它們進入所謂的協同空間。

∧ 中秋節和大豐收的關聯？

∨ 明明項羽當了老大，為啥西楚不算一個朝代，“楚朝”為何被否認？

熱門排行

劇多

多模態特徵？