把各位答主的答案看了一遍,總結了以下幾點(純屬彙總,智慧財產權歸各位答主所有 : ) ):
有一個硬幣,它有θ的機率會正面向上,有1-θ的機率反面向上。θ是存在的,但是你不知道它是多少。為了獲得θ的值,你做了一個實驗:將硬幣拋10次,得到了一個正反序列:x=HHTTHTHHHH。
無論θ的值是多少,這個序列的機率值為 θ⋅θ⋅(1-θ)⋅(1-θ)⋅θ⋅(1-θ)⋅θ⋅θ⋅θ⋅θ = θ⁷ (1-θ)³
嘗試了所有θ可取的值,畫出了下圖(θ的似然函式):
如果硬幣是均質的,那麼經過多次試驗擴充樣本空間,則最終求得的最大似然估計將接近真實值0.5。
7.似然函式的主要用法在於比較它相對取值,雖然這個數值本身不具備任何含義。例如,考慮一組樣本,當其輸出固定時,這組樣本的某個未知引數往往會傾向於等於某個特定值,而不是隨便的其他數,此時,似然函式是最大化的。
8.似然函式乘以一個正的常數之後仍然是似然函式,其取值並不需要滿足歸一化條件,這種特性允許我們疊加計算一組具備相同含義的引數的獨立同分布樣本的似然函式。
9.在data mining領域,許多求引數的方法最終都歸結為最大化似然機率的問題。
把各位答主的答案看了一遍,總結了以下幾點(純屬彙總,智慧財產權歸各位答主所有 : ) ):
機率用於在已知一些引數的情況下,預測接下來的觀測所得到的結果;而似然性則是用於在已知某些觀測所得到的結果時,對有關事物的性質的引數進行估計。在這種意義上,似然函式可以理解為條件機率P(B|A)的逆反,即P(A|B).似然函式:給定輸出x(這裡的小x是指聯合樣本隨機變數X 取到的值,即X = x),關於引數θ(未知)的函式 L(θ|x)。它(在數值上)等於給定引數θ後變數X的機率:L(θ|x) = P(X=x|θ)。所以從定義上,似然函式和機率密度函式是完全不同的兩個數學物件:前者是關於θ的函式,後者是關於X的函式。所以這裡的等號= 理解為函式值形式的相等。它們不是同一個函式,但是具有相同的函式形式(類似a^x與x^a的關係)連續型機率分佈時L(θ|x)=f(x|θ),同樣需要注意的是,此處並f(x|θ)非條件機率密度函式L(θ|x)表示的是在給定樣本x的時候,哪個引數theta使得x出現的可能性多大eg:有一個硬幣,它有θ的機率會正面向上,有1-θ的機率反面向上。θ是存在的,但是你不知道它是多少。為了獲得θ的值,你做了一個實驗:將硬幣拋10次,得到了一個正反序列:x=HHTTHTHHHH。
無論θ的值是多少,這個序列的機率值為 θ⋅θ⋅(1-θ)⋅(1-θ)⋅θ⋅(1-θ)⋅θ⋅θ⋅θ⋅θ = θ⁷ (1-θ)³
嘗試了所有θ可取的值,畫出了下圖(θ的似然函式):
如果硬幣是均質的,那麼經過多次試驗擴充樣本空間,則最終求得的最大似然估計將接近真實值0.5。
7.似然函式的主要用法在於比較它相對取值,雖然這個數值本身不具備任何含義。例如,考慮一組樣本,當其輸出固定時,這組樣本的某個未知引數往往會傾向於等於某個特定值,而不是隨便的其他數,此時,似然函式是最大化的。
8.似然函式乘以一個正的常數之後仍然是似然函式,其取值並不需要滿足歸一化條件,這種特性允許我們疊加計算一組具備相同含義的引數的獨立同分布樣本的似然函式。
9.在data mining領域,許多求引數的方法最終都歸結為最大化似然機率的問題。