意識的秘密
第四章 電影的幀數
(一)電影的幀數
如前所述,我自幼就對電影的視覺機制非常感興趣。明明知道電影只是由一幀一幀的靜態圖片連線在一起播放出來的,可我的眼睛和大腦卻根本就看不出任何的異樣。電影中的動態場景與日常生活中的場景並沒有任何不同,甚至還有3D電影,裡面的場景栩栩如生,感覺彷彿身臨其境,偶爾我還會被撲面而來的突襲嚇了一大跳。為什麼明明知道不是真的可卻還是會腦不由己?儘管我千方百計、處心積慮,但始終還是找不到任何的破綻,這到底是怎麼回事?
據說電影的幀數是每秒24幀,也有每秒48幀的,但最低不能低於每秒16幀,因為低於每秒16幀看起來就會不連貫了,當前主要還是每秒24幀。據說這是因為大腦存在對影像的“視覺暫留”現象,當眼睛在感知物體時,會在視網膜上成像,轉化為神經訊號輸入大腦,大腦便感覺到物體的影像,但當將物體從眼前移去時,大腦對物體的印象不會立即消失,而要延續0.1-0.4秒的時間,這種現象被稱為“視覺暫留”現象。但我覺得這兩個數值之間有點問題,因為如果按照電影每秒24幀的速度計算,那麼每一幀的反應時間是0.04秒,這與“視覺暫留”0.1秒到0.4秒的時間似乎不協調。我的意思是,如果“視覺暫留”是電影視覺機制的主要原因,那麼按照“視覺暫留”0.1秒到0.4秒的時長,每秒10幀或2.5幀也是可行的,但事實上最低卻不能低於16幀呢,這是怎麼回事?而且,為什麼會有0.1秒到0.4秒這樣的差距,這裡有3倍的差距,同是“視覺暫留”,為什麼時間卻相差這麼大?
我將每一幀影象的視覺過程分為四個階段:
第一階段是每一幀影象的光線刺激投射到眼睛視網膜感光細胞上,感光細胞將一幀光線刺激轉化為一幀神經訊號,我稱這一幀神經訊號為“訊號幀”,稱這一階段為“感受階段”;
第二階段是每一幀訊號幀被傳輸至大腦內最初始的神經元細胞,我稱這一階段為“傳輸階段”,稱這些最初始接收訊號幀的大腦神經元為感受層,感受層只有一層,只負責接收訊號幀,是“全畫素的”。
第三階段是感受層將依據接收到的訊號幀的種類和強弱向後傳導給記憶結構中特定對應的神經元和突觸,我稱這個階段為“中轉階段”;
第四階段就是記憶結構將接收到的每一幀訊號幀再一層一層地向後傳導,大腦對每一幀訊號幀的感知是將這一幀訊號幀啟用的多層“稀疏”的記憶結構合成在一起的結果,我將這裡的記憶結構稱為“記憶層”,“記憶層”應該是“多層”的,將這一階段稱為“感知階段”。
這四個階段並非視覺反應所獨有,而是一切“感知反應”都具備的,是“感知反應”的四個階段。
我猜每一幀影象訊號幀的反應時間0.04秒可能只是視網膜感光細胞將外界光線刺激轉化為視覺神經訊號的時間,雖然光速是每秒30萬公里,但是視網膜感覺細胞將光線刺激轉化成神經訊號的速度比這個慢多了。如果反應速度太快,那每秒24幀可能就不夠用了。“視覺暫留”0.1秒到0.4秒的時間很可能不是一次性的反應時間,而是影象訊號幀多層神經反應的時間。我猜由於影象訊號幀訊號強弱的差異,所以影象訊號幀能向後傳導的層數也就存在差異,有的訊號弱,只能傳一兩層,那“視覺暫留”就只能0.1秒了,有的訊號強,能傳十幾層,那“視覺暫留”的時間可能會長一點,就可以到0.4秒了。
圖D-01
這裡涉及到我的兩個非常重要的動態執行機制猜想。第一個是“多層合成”猜想,大腦對每一幀影象訊號幀的感知是由這一幀影象訊號幀啟用多層記憶結構合成的,可以說是“每幀多層合成”,也可以說是“一幀包含多層”,“多層合成”發生於某個時間段,如圖D-01所示,圖中的每一層是同一幀訊號幀在這個時間段中依次發生的神經反應;第二個是“多幀疊加”猜想,大腦某一時刻對影象或場景的感知由多幀影象訊號幀疊加在一起的,可以說是“每時多幀合成”,也可以說是“一時包含多幀”,“多幀疊加”只發生於某個時間點,也如圖D-01所示,圖中的每一層是大腦內部多個訊號幀同時發生的多個神經反應。這兩個猜想構成了意識模型的動態執行機制,也是電影靜態影像之所以呈現動態情景的基本原因。
基於我的猜想,我們在看電影時大腦每秒鐘之內接收到了24幀影象訊號幀,這24幀影象訊號幀又各自激活了多層記憶結構,若按五層計算,那就是說每一秒鐘大腦內部發生的訊號幀啟用反應有上百幀,因而我們在看電影時大腦的每一秒鐘都是挺辛苦的,難怪看完電影時全場至少有一大半人會打哈欠。我還猜人類之所以愛看電影,很可能是因為電影也是一種大腦運動,能消耗大量物質和能量,尤其是能消耗某些可能帶來負面情緒的物質,從而讓我們感覺似乎大腦壓力被排洩了。據說大腦每天消耗的能量佔了消耗總能量的20%,這麼多幀的啟用反應肯定會讓大腦消耗非常多的能量,可能我大腦的消耗量還不止20%。
據說有人做了一個實驗,頭上戴一個攝像頭出去跑步,他在一路上用眼睛所看見的一切都是穩定的和清晰的,但他的攝像頭所錄下的影像卻搖晃的和模糊的,與他的眼睛所看到的狀況完全不一樣。為什麼會這樣?
這個問題非常有趣,我想了很久。首先,攝像成像與大腦成像是兩種完全不同的機制。攝像成像是光線與膠捲底片發生反應並在膠捲底片上留下反應痕跡後由人眼來感知,但大腦成像就像是光線與膠捲底片發生反應但成像效果卻只有膠捲底片自己才能感覺得到。這兩者的形成機制完全不同,難以對比。
其次,雖然難以對比,但我猜有一點可能很重要,那就是基於我的猜想大腦成像實際是記憶結構成像。既然記憶結構是“穩定的”,那麼我們的主觀感知是我們所看到的應該就是“清晰的”。這隻能想像,一切只能是在想像中。
最後,我猜攝像成像與大腦成像的反應時間差距很大可能是主要原因。以光的速度,無論快門有多快,攝像成像中每幀膠捲底片上所接收到的光點可能是成萬上億個,膠捲底片上的任何一個點可能都是由成萬上億個光點累積反應的結果,因而只要鏡頭或膠捲底片稍微晃動,將致使這成萬上億個光點散落在膠捲底片上從而致使影象模糊。大腦成像是訊號幀反應啟用神經網路,簡單說就是訊號幀的神經反應,無論視網膜感光細胞將光線刺激轉換為訊號幀的時間,還是訊號幀在多層網路結構中傳導的時間,都比光速要慢得多。也就是說,大腦成像的反應時間比攝像成像要長得多,因而我們大腦中的“訊號幀”就“走得慢”啊,可以讓我們的大腦好好地感覺感覺,這可能是大腦成像顯得穩定和清晰的主要原因。
有時我也常常胡思亂想,要是大腦神經反應時間加快會是個什麼情況,會不會就能讓我們更容易地發現思維的秘密?這神經反應時間慢對人類的思維究竟是件好事還是件壞事?要是製作機器大腦我應該把他的反應時間設定為多少才能發揮出最佳的效率?
我猜大腦之所以感覺電影是活動的,很可能是因為前後影象訊號幀之間的差異與大腦中關於活動的記憶結構相符合。
圖D-02
圖D-02實際上是動圖,據說名字叫“旋轉舞者”。大多數人都會把這張圖識別成舞者是順時針旋轉,我也是大多數時間把這張圖看成是順時針旋轉,偶爾會把這張圖看成是逆時針旋轉。
我覺得我們常見的旋轉大都是以左腿為中心的順時針旋轉,因而我們的記憶結構中順時針旋轉是相對直接或強壯的聯結,於是我們很容易將既可以識別為順時針旋轉也可以識別為逆時針旋轉的圖形優先識別為順時針旋轉,除非我們記憶中以右腿為中心的逆時針旋轉是更直接或者強壯的聯結,我們才會把既可以識別為順時針旋轉也可以識別為逆時針旋轉的圖形優先識別為逆時針旋轉。這符合我的“強聯優先”猜想。
基於“強聯優先”猜想和“活動可塑”猜想,我設計了一個大腦實驗:雖然我大腦中的優先識別是順時針旋轉,但是若是我閉上眼睛在大腦裡反覆想像逆時針旋轉,儘可能地想清楚細節,我就可以暫時地強化逆時針旋轉的記憶結構,這樣就有可能讓逆時針旋轉成為優先識別,那麼當我睜開眼睛時的一瞬間我應該就比較容易識別出逆時針旋轉。
憑空想像逆時針旋轉非常不容易,你可以試試。經過我不斷的努力,我居然又成功了!
這個大腦實驗不僅驗證了“強聯優先”猜想和“活動可塑”猜想,而且還強化了我對意識是“啟用記憶”和記憶結構是“互動形成”的信心,但是你要想理解這一點,你必須得去想像,去體驗,光聽我說沒什麼用。這個大腦實驗對我最重要的意義在於驗證了我對大腦動態視覺的基本猜想,因為我一直在追問這個答案。
首先,我猜大腦每秒鐘產生的訊號幀啟用反應有上百幀之多,這些訊號幀之間一定存在差異,動態視覺一定與這些訊號幀之間的差異有關;其次,我猜在我們嬰幼兒時期這些訊號幀不停地在刺激地我們的大腦作出反應,從而形成了有關動態視覺的記憶結構,無論順時針旋轉還是逆時針旋轉在我們的大腦裡都有相應的記憶結構;最後,我猜動態視覺之所以產生可能是因為這些神經訊號幀激活了有關動態視覺的記憶結構,因為我們常見的旋轉大多是左腿為支點的順時針旋轉,所以順時針旋轉成為我們大腦內的“強聯”,於是我們“優先”看出順時針旋轉的機率就非常地高,如果我們能暫時讓逆時針旋轉成為“強聯”,那“優先”看出逆時針旋轉的機率同樣也會比較高。
當我在仔細觀看“旋轉舞者”時,我還發現順時針旋轉和逆時針旋轉之間的切換非常地突然,而我的眼睛盯著圖片並未作什麼改變,但旋轉的方向卻已經發生了改變,因此,我猜大腦內關於順時針旋轉和逆時針旋轉的記憶結構的差異一定非常細微,很可能由於訊號幀細微的順序變化造成了這兩種旋轉之間的突然切換。
小時候老師說人眼也是一種凸透鏡,外界光線投射到視網膜上的影像是顛倒的,然後大腦再將這顛倒的影像再顛倒過來。對此我滿腹疑問。首先,大腦怎麼知道視網膜上形成的訊號幀中的影像是顛倒的?其次,大腦又透過什麼方式將這顛倒的影像再顛倒過來?我們的大腦裡有個小人嗎,是他坐在我們的大腦裡專門負責把顛倒的影像再顛倒回去嗎?想了很久也無法接受大腦中還會存在某個和我們大腦類似的器官或組織,即使有這種器官或組織,那它又是怎麼執行的呢?
我想基於我的“物質反應”猜想,根本無所謂顛不顛倒,我們大腦內部也不會存在什麼負責將顛倒的影像再顛倒回去的器官或組織,大腦只是對外界刺激作出反應而已,我們大腦連反應本身都察覺不了,怎麼可能察覺出來視網膜上的影像是顛倒的?我知道理解這一點也很困難,事實上我也花了好長時間才想明白這一點。當然,我所謂的“想明白”,實際上就是大腦中的神經網路已經透過想像的方式形成了有關的記憶結構,當神經訊號啟用這些記憶結構時,於是我就自以為是地以為我想明白了。對我而言,理解後面這一點比理解前面那一點要難得多。
小時候有看見很多所謂的立體影象,感覺頗為驚奇,明明是平面的影象卻怎麼可以看出立體的效果?
圖D-03
上圖初看起來並沒有發現什麼特別,但仔細看看,居然看出了一顆“愛心”,上面還有一行英文“love”,確實有點浪漫的感覺;但再仔細看看,又發現這顆“愛心”和“love”都消失不見了;我費了好長時間也沒有辦法從這張平面圖中發現“愛心”和“love”的蛛絲馬跡,這是個什麼情況?
圖D-04
上圖中有一個“忍”字,但一般地看也看不出來,我感覺只有調整眼睛的視焦我才有可能發現,要只是一般地看這張圖,無論如何我也發現不了“忍”字的輪廓。
我對這種立體效果的成因非常感興趣,後來去看了立體電影,感覺非常真實。摘下立體眼鏡,我發現銀幕上是有重影的,實際上就是兩份影像,後來知道了立體眼鏡的左右兩個鏡片分別只過濾其中一份影像,也就是說左眼和右眼分別只看見了一份影像,立體效果是左右兩份影像分別在大腦裡成像的結果。
圖D-05
後來瞭解到,左眼視網膜的視覺神經訊號分別傳入大腦左半球和右半球,而右眼視網膜的視覺神經訊號也分別傳入大腦的左半球和右半球,也就是說,大腦左半球和右半球都同時輸入左右兩眼的視覺神經訊號。這對我而言就意味著大腦左右兩個半球都分別形成了獨立的記憶結構,並且該記憶結構與左右兩眼的視覺神經訊號有關。
因此我產生了“兩份對比”猜想,意思是記憶結構是兩份,不僅在某個半球中是兩份,而且兩個半球又構成兩份,而立體效果就是兩份對比的結果。我猜想這些平面的立體影象之所以能夠看出立體效果,只是因為從某個角度產生並輸入大腦的神經訊號能夠啟用大腦裡有關立體影象的兩份記憶結構。至於為什麼“兩份對比”就能產生立體效果,我不知道。或許這只是大腦物質反應的主觀印象而已,但這句話是原因與結果融為一體,無法解析。
(二)豐乳肥臀
從小父母離異,這種感覺雖然習慣了,但還是不好受,於是在年少時就立誓將來一定不要讓我的孩子再受這種不好受。曾經對美好愛情和幸福婚姻我也有著非常強烈的願景和追求,“窈窕淑女,君子好逑”,“願得一心人,白首不相離”,“許一人以偏愛,盡此生之慷慨”,下定決心將來一定要忠貞不二,矢志不逾。
然而,世事難料,長大後我竟然發現這太難了。即使女朋友再漂亮,再性感,也阻擋不了我時不時還會被其他美女所吸引,甚至還有各種想入非非,你懂的。雖然子曰“食色,性也”,雖然俗話說“愛美之心,人皆有之”,雖然有詩云“自古英雄多好色,人不風流枉少年”,但是我對這些仍然不滿意,我想知道原因,我想知道“忠誠專一”為什麼這麼難?我沒覺得自己言而無信,厚顏無恥,我覺得自己內心非常想堅持,儘管我一次又一次地咒罵自己,甚至掌摑自己,但我還是無法制止自己,我感覺我的大腦裡似乎有一股強大的力量在拉拽著我,讓我滑向一個我並不願意去的地方,而我居然無力阻止。我使盡全身力氣,但抵抗的效果竟然微不足道。好吧,我可能並不是個好男人,但我絕對是個誠實的男人。
後來看到一本名為《豐乳肥臀》的書,我從來都沒有看過這本書的內容,到現在也沒有,但當時這個書名對我來說就是一種莫名的刺激,甚至還有些難以言狀的興奮。僅僅是個書名就能讓我意亂情迷,我非常地訝異。此前我一直對女性的乳房和臀部有著很多的困惑,非常地不理解,女性在胸前頂著晃來晃去的兩大垞,不麻煩嗎?在身後掛著扭來扭去的兩大塊,不難受嗎?可這明顯是累贅的部位為什麼我竟然還愛看呢,還心癢癢地充滿著各種嚮往與渴望?
我覺得一個男人好色,那是人品問題;一群男人好色,那是文化問題;若是連我都好色,那就是大腦機制問題。對我來說,這首先不是道德問題,而是我的專業問題,我只是想知道我們的大腦究竟是怎麼回事?
基於“多層合成”猜想,我猜當我看見“豐乳”這兩個字時,這兩個字的神經訊號首先應該啟用記憶結構中關於“豐乳”文字的記憶結構,然後再啟用記憶結構中“豐乳”形象的記憶結構,最後啟用能夠激發“興奮”和“渴望”神經遞質的記憶結構,因此,當我僅僅看見這兩個字時,我的大腦就把相互聯結的記憶結構都激活了,並且還“多層合成”在一起,於是我就反應出了“興奮”和“渴望”的情緒。
之所以“豐乳”形象能夠與“興奮”和“渴望”的情緒聯結在一起,那一定是因為長期的經歷和體驗所形成的記憶結構聯結。如果我是同性戀,可能我就會沒有這樣的聯結,與我的“興奮”和“渴望”的情緒相聯結的可能就是男性的胸膛或者男性別的什麼,究竟是什麼,我不知道,因為我畢竟不是同性戀,實在沒有親身體驗,自然就無法想像。但異性戀聯結的會是什麼,我知道,因為我就是一個異性戀。必須要申明,我對同性戀沒有絲毫的歧視和負面評價,他們只是大腦神經網路的聯結和我有一點點不一樣而已。
我發現我的“興奮”和“渴望”與這個“豐乳”和“肥臀”是誰的沒有關係,即使不是女朋友的,對我一點影響都沒有!只要是好看的,我都會“興奮”和“渴望”,公平公正,絕無偏私。突然靈機一動,難道我們的記憶結構是“區域性”的?定睛一看,居然我猜對了!
圖D-06
圖D-07
這兩張圖片是網路上隨便找的,即使它們只是兩張圖片而已,即使我並不知道圖裡的女性是誰,但我想這絲毫不會影響男性們的“審美能力”。
我的重點是當我們把眼睛定住不動的情況下,我們應該就會發現:我們只能“看清區域性”。當我們能看清“豐乳”時,我們應該就看不清脖子和手臂;當我們能看清“肥臀”時,我們應該也就看不清腰背和大腿了。如果你能安靜下來定住眼睛仔細地觀察,你應該就能夠發現無論是看任何一張圖片,還是看任何一個場景,我們都只能“看清區域性”。這是非常重要的感知體驗,是理解意識模型重要的主觀基礎。對我來說,感知體驗相當於技術實驗,但我的感知體驗只能在大腦裡進行,沒辦法在實驗室裡開展。
之所以會去猜記憶結構是否是“區域性”的,是因為我頭腦中有一個無法解開的難題,突然覺得只有“區域性結構”可能才是最佳解決方案,除此別無可能。雖然此前有了“多幀疊加”猜想和“多層合成”猜想,但我實在沒辦法想像我們的大腦究竟是如何透過這個多層記憶結構去感知外部世界,尤其是不知道當感受層接收到感官傳輸過來的訊號幀後,它該如何把這些神經訊號傳導至記憶結構並透過“多幀疊加”和“多層合成”去反應啟用多層記憶結構。當體驗到我們的大腦只能“看清區域性”後,我確定記憶的結構是“區域性”的,這就使我解開了這個難題。
外界光線刺激被視網膜感光細胞轉化成神經訊號,視網膜上的每個感覺神經細胞與感受層上的每個神經元細胞應該都是一一對應的,我們可以把感受層理解成膠捲底片,要是不對應的話,意識模型就崩潰了。以前我以為影象訊號幀就是眼前的整個影像,是眼前整個影像都投射到這個膠捲底片上,於是這裡產生了一個巨大的問題。
我認為意識就是“啟用記憶”,可是無論如何,我相信我們大腦裡的記憶結構絕對不會是無限的,應該是有限的,而眼前場景所產生的訊號幀是無窮無盡的,是無限的,即使記憶結構是“稀疏”的,我認為我們的大腦也無法將這無限場景儲存到我們有限的記憶結構中去。我們的大腦是如何用這有限的記憶結構去感知這無限的場景變化的呢?我不知道該怎麼做,因而這個問題一直困擾我多年。當我明白了記憶結構是“區域性”的之後,這個問題便解決了。
我們可以這樣粗略理解,我們的記憶結構是“區域性模組化”的,我們對眼前場景的感知事實上是將該場景分割成“區域性模組”的訊號幀來進行的,這樣才可以與“區域性模組化”的記憶結構聯結起來,在這種機制下,“區域性模組化”的記憶結構可以無限次地被呼叫。只有這樣記憶結構“區域性模組化”的機制,我們的大腦才有能力對眼前無窮無盡的場景作出反應。我想不出還會有什麼機制能比這個記憶結構“區域性模組化”更好的機制了,我認為這是能夠讓多層神經網路執行起來的唯一機制。在此基礎上,我形成了“區域性結構”猜想。
圖D-08
圖D-09
圖D-08與圖D-09是同一張圖片,只是位置顛倒了,但很顯然我們的感知是天差地別,這是為什麼?網路上類似圖片有很多,我就不一一例舉了。在我看來,這不是什麼視覺錯覺,這些圖片明確展示了大腦內部記憶結構的“區域性模組化”。
無論是否顛倒,當我們定住眼睛看任何一張圖片都會發現我們只能看清其中的某一個區域性,看清嘴唇時,我們看不清鼻子和眼睛,看清鼻子時,我們看不清眉毛,甚至看清左眼時,我們看不清右眼,看清上嘴唇時,我們看不清下嘴唇;若是不定住眼睛,我們就會感覺自己似乎能夠看清整個臉龐。定住眼睛,大腦裡的影象訊號幀就都是同一幀影象,因而我們只能看清一個區域性;不定住眼睛,大腦裡就同時存在著多幀不同的影象訊號幀,因而我們覺得自己看清了不止一個區域性。“視覺暫留”其實就是基於這樣的機制,是多幀訊號幀在記憶結構中並存時的主觀感覺。
圖D-08的嘴唇與我們記憶結構中情緒“愉悅”的嘴唇形象相聯結,因而看到這個區域性的嘴唇時,我們便反應出了“愉悅”的印象;圖D-08的眼睛與我們記憶結構中情緒“愉悅”的眼睛形象相聯結,因而看到這個區域性的眼睛時,我們便也反就出了“愉悅”的印象。而圖D-09中的嘴唇和眼睛則剛好相反,我們無法反應出情緒“愉悅”的印象。當然,如果圖D-08的嘴唇與我們記憶結構中“性感”或“美麗”的感覺記憶結構相聯結,那麼看到這個嘴唇時我們也會反應出“性感”或“美麗”的印象。總之,你大腦裡有什麼樣的記憶結構,你便會反應出什麼樣的感覺印象。
當訊號幀是圖D-08的嘴唇時,這一幀訊號幀便將“愉悅”、“性感”和“美麗”等記憶印象都“多層合成”在一起。我們的大腦將嘴唇訊號幀、眼睛訊號幀和鼻子訊號幀等多幀訊號幀前後疊加在一起合成了感知,但“多幀疊加”的整體感知只是各個區域性訊號幀的獨立合成,因而對整個臉龐的感知實際上是對嘴唇訊號幀的區域性感知、對眼睛訊號幀的區域性感知、對鼻子訊號幀的區域性感知等等合成的結果,由於對嘴唇訊號幀的區域性感知是“愉悅”、“性感”和“美麗”,所以這個“愉悅”、“性感”和“美麗”就被當成了是對整個臉龐的感知。於是,我們便無可救藥地錯誤以為這是一張“愉悅”、“性感”和“美麗”的臉龐,但實際上並不是。
這就產生了我們認識機制中的第二個“錯覺”:我們對外界感知的“感知直覺”是“全域性整體”的,但事實上的大腦反應卻是“區域性分解”的,我們對外界“整體”的“感官直覺”是由“多幀”“區域性”感知前後“疊加”而成的。我也稱這個“錯覺”為“範圍錯覺”,意思是我們以為我們的大腦對外界感知的範圍就是外界事物的“全域性整體”,但事實上我們的大腦對外界感知的單元範圍比我們以為的要小得多,我們是將“全域性整體”“分解”成一個個的“區域性”來進行感知的。換句話說,我們的大腦沒有能力對外界事物的“全域性整體”進行感知,而只能對外界事物的“分解”“區域性”進行感知,因而我們的大腦對外界“全域性整體”的主觀印象實際上不是事實,而是一個“錯覺”。
第一個“錯覺”“內容錯覺”與第二個“錯覺”“範圍錯覺”是一個整體,一直是在共同作用,從未分開獨立過。兩者一直關聯在一起,但也有一定的區別:“內容錯覺”是想說“我們大腦看到的比我們眼睛看到的要多得多”;“範圍錯覺”是想說“在某一瞬間我們大腦實際看到的比我們眼睛以為看到的要少得多”。“範圍錯覺”最大的問題在於掩蓋了我們大腦對外界事物“全域性整體”進行感知的天然缺陷,無可救藥地將區域性感知當作整體感知。
圖D-10
圖D-11
圖D-10實際上都是正方形,但是我們感覺不出正方形的視覺印象;圖D-11實際上都是圓形,但是我們也同樣感覺不出圓形的視覺印象。這是為什麼?
圖D-10中實際上有七個正方形,中間是一個白色的小正方形,其餘六個正方形中由於沒有任何一個區域性可以成為正方形的區域性,所以我們視覺的整體感知就沒有辦法“多幀疊加”出正方形的印象來。也可以這樣說,這六個正方形的反射光線刺激視網膜產生了無數幀神經訊號幀,由於其中任何一幀神經訊號幀都不能夠啟用大腦中有關正方形的記憶結構,所以大腦無法反應出正方形的印象。
圖D-11中實際上也有七個圓形,中間是一個黑色的小圓形,其餘六個圓形中也是由於沒有任何一個區域性可以成為圓形的區域性,所以我們視覺的整體感知也一樣沒有辦法“多幀疊加”出圓形的印象來。同樣也可以說,這六個圓形的反射光線刺激視網膜產生了無數幀神經訊號幀,由於其中任何一幀神經訊號幀也一樣不能夠啟用大腦中有關圓形的記憶結構,所以大腦同樣無法反應出圓形的印象。
我曾經千方百計地嘗試看能不能破除這些錯覺,讓正方形看出正方形來,讓圓形看出圓形來,然而我努力了很久,最終發現毫無辦法。這也讓我確信意識就是“物質反應”,因為是反應,所以才完全不由我,我的主觀意願起不到任何作用,再努力也沒用。這個“物質反應”的具體方式就是“神經訊號啟用記憶結構”,只要某些神經訊號幀能夠啟用特定的記憶結構,那我們就會反應出特定的印象,那怕明知與事實不符,我們仍然也無法避免;如果某些神經訊號幀不能啟用特定的記憶結構,即使事實確實如此,我們也仍然無可奈何。不要輕易地相信眼前的所謂的“事實”,因為實際上你看不到“事實”,你看到的只是你頭腦中已有的記憶結構所產生的印象。所謂的“錯覺”其實並不是錯覺,我們的意識才是真正的“錯覺”。
圖D-12
圖D-12中根本不存在一個三角形,只是三個圓形都有一些缺口而已,但是由於這些缺口與我們大腦中對三角形的區域性記憶結構相符,這些影象所產生的神經訊號幀能夠啟用大腦中關於三角形的記憶結構,所以我們大腦經“多幀疊加”和“多層合成”之後就感覺到這裡面有一個三角形。當然,之所以能夠識別出一個三角形也是因為我們大腦裡關於“三角形”的記憶結構是“稀疏”的,若是不“稀疏”,我們肯定不能識別出一個三角形來。
我們的大腦既能夠“視而不見”,又能夠“無中生有”,你說他愚不愚蠢?但難以置信的是這居然就是我們的認識能力,是我們智慧的基礎!
要指出的是,“區域性”是相對的,“整體”也可以成為“區域性”,“區域性”也可以再分為“區域性”,這個“區域性”的“區域性”和那個“區域性”的“區域性”還可以合併成一個新的“區域性”,因而並不存在絕對的“區域性”,只有相對的“區域性”。即使是在同一秒鐘,我們的大腦對於場景“區域性”的認定也是變換不停的。
記憶結構之所以是“區域性”的,是因為我們的大腦只能以“區域性”的方式感覺和理解外界。記憶結構為什麼會是“區域性”的?我不相信這種結構是什麼基因或理性的結果,我猜很可能是神經元和突觸“兩兩相聯”這種最簡單聯結方式的結果。
圖D-13
上圖中有很多的“9”,我們在看這張圖的時候,無論我們看到了多少個“9”,大腦中被啟用的都只是關於“9”的記憶結構。我們大腦中的記憶結構不需要“5個9”的記憶結構或“22個9”的記憶結構,只要這一個關於“9”的記憶結構就行,多個“9”的印象都是疊加合成的結果。這就是大腦高效的感知方式。
其實上圖中在這些“9”之間藏著一個“8”,但是我們初看起來似乎很難找到這個“8”,這個“8”肯定在這張圖裡,肯定就在我們的眼前,我相信我們的視網膜上肯定產生了這個“8”的神經訊號,我猜只是這個“8”的神經訊號未能啟用關於“8”的記憶結構而已。為什麼把“8”藏在這麼“9”之中就會那麼難找呢?
我猜我們視網膜上產生的每一幀訊號幀中其實有多個“9”,但每個“9”只能單獨啟用關於“9”的記憶結構,也就是說,每一幀訊號幀只能啟用一次關於“9”的記憶結構,但一秒鐘之內,視網膜至少產生了24幀的訊號幀,因而關於“9”的記憶結構一秒鐘之內被激活了24次以上,肯定處於強烈的啟用狀態之下。意識就是神經訊號啟用記憶結構,因而意識的主觀印象取決於什麼樣的記憶結構被啟用,既然關於“9”的記憶結構被強烈啟用,那麼“9”就是此刻的主觀印象,單個“8”於是就淹沒在“9”的汪洋大海之中。
意識模型的動態執行機制是多幀多層疊加合成,我猜多幀多層疊加合成的過程中一定啟用反應激活了很多的記憶結構,但最終的主觀印象結果一定是以被眾多神經訊號幀最強烈啟用的記憶結構為主的,這就是我的“多幀為主”猜想。
多幀多層疊加合成是意識模型的動態執行機制,而多幀為主更像是這個動態執行機制的主觀印象結果,原本不應該算是執行機制,但為了更好地理解這個意識模型,我不得不把這個主觀印象結果也納入意識模型之中來。強聯優先是關於記憶結構的,而多幀為主是關於神經訊號的,記憶結構相對神經訊號而言更具有決定性,但卻不是絕對的。一般情況下,若記憶結構不存在強弱差別,那麼原則上會出現多幀為主的印象結果;若是記憶結構存在強弱差別,那被啟用的原則上是強聯優先的印象結果;不過,千萬不要將強聯優先和多幀為主割裂開來,這只是為了敘述的需要人為所做的區分,事實上在我們大腦的日常活動中這強聯優先和多幀為主就是一個整體,強聯之所以強聯很可能本身就是多幀的結果。
(三)多層立體神經網路結構
“霓虹燈字箱”是我對大腦內部基本結構的猜想,核心是記憶結構。我認為記憶結構至少可以分為兩層,一層是語言,一層是語義,同時,語義又可以分為多層,有形象印象、感覺印象、判斷印象和情緒印象等等,因此,“霓虹燈字箱”實際上就是一個“多層立體神經網路結構”。
大腦的生理構造問題我無力解決,即使我想創造機器大腦實現機器意識,我也無法按照人腦的生理構造去實施;我只是想要建立一個意識模型,用以解釋人類的思維和行為,當然我也不能完全拋開大腦的生理構造,只是我對大腦生理構造的猜想是非常模糊和非常籠統的,是不能細究的。
“多層立體神經網路結構”(以下簡稱“多層結構”)是我的意識模型的框架,是大腦內部的虛擬結構。在“多層結構”的外面還有感受器官和傳輸神經。
感受器官是大腦外部能夠接受外界刺激的人體的各種器官和組織,它能將接收到的外界刺激轉化成能夠被大腦感知的神經訊號,經傳輸神經傳導輸入到大腦之中。我把感受器官分為七大類:視聽嗅味性膚內;“視聽嗅味”好理解,分別對應著眼、耳、鼻、舌;“性”是能感受性刺激或能引發性興奮和性高潮的器官或組織,包括但不限於生殖器官,其實“性”對於人類大腦非常重要,“性”是一種非常重要的大腦活動;“膚”是指能感受外部接觸的全身面板,我們的面板能夠感受冷熱、軟硬、強弱、銳鈍、乾溼、澀滑、痛癢等等,是非常重要的感受器官,有些面板也可以成為“性器官”的一部分;“內”是指能感受各種來自體內諸如疼痛、憋悶、躁熱、抽搐、心跳等的神經組織,這些神經組織並沒有明確的邊界,往往只是一些分佈於身體內部的神經末梢或者神經細胞,但無論如何,這些體內的神經組織都是我們不可或缺的感受器官。
傳輸神經就是將感受器官受外界物理刺激所產生的神經訊號傳輸到大腦神經元細胞的神經細胞。在我的設想之中,傳輸神經都是大腦之外的神經細胞,大腦之內的神經元細胞不屬於傳輸神經,這是為了設計意識模型而人為進行的分類。感受器官和傳輸神經不是意識模型的內容,不在“多層立體神經網路結構”之中,我設想的“多層立體神經網路結構”就是大腦內部的結構,其實這個結構非常簡單,但是非常龐大。我相信“大道至簡”,唯其至簡,方能至繁。結構龐大,是實現至繁的必要條件,大腦內近百萬億的突觸聯結是人類成為萬物之靈的物質基礎。
圖D-14感受器官、傳輸神經、感受層垂直示意圖
“多層立體神經網路結構”主要分為兩層:感受層和記憶層,感受層只有一層,相當於“全畫素”的相片;記憶層就是記憶結構,可以再分為若干層,記憶層是整個“多層立體神經網路結構”的主體,記憶層相對於感受層的“畫素”是“稀疏”的。
事實上大腦內部並不存在這樣所謂的“多層立體神經網路結構”的生理構造,這個多層結構完全是我虛擬出來的,只是為了比較生動形象地表達我頭腦中對有關意識模型框架結構的神經反應。這個多層結構完全是我基於自己個人的經歷和體驗所提出來的猜想,沒有任何的“客觀依據”,無法進行任何形式的“科學驗證”。
(四)感受層
圖D-15感受層、記憶層垂直示意圖
“感受層”是指大腦中最初接受來自人體各種感受器官神經訊號傳入的神經元細胞。感受層只有一層,應該是在大腦最表層的位置,當然,大腦的最表層並不都是感受層,只有那些能夠直接接收到各種感受器官傳來的神經訊號的大腦神經元才能構成感受層。感受層也可以理解為“外部單層”在大腦裡的直接反映,是“內部多層”的第一層。
我認為神經訊號從感受器官到大腦感受層之間的傳輸路線是對應的和固定的,因為我猜感受層的神經元是神經訊號的中轉站,若傳輸路線不對應、不固定就會造成體系混亂,就像是相機成像,任何光點到相紙之間的路線都是確定的,若是不確定,那相片就沒法看了。
我猜感受層的神經元細胞一定能根據輸入神經訊號的種類和強弱將神經訊號向下傳導給特定的神經元或突觸。例如,感受層的某個神經元如果感受到的是“黑色”的神經訊號,那麼它會把這個“黑色”的神經訊號向下傳導給記憶層中能識別“黑色”的神經網路;如果感受到的是“白色”的神經訊號,那麼它就會把這個“白色”的神經訊號向下傳導給記憶層中能識別“白色”的神經網路;如果感受到的是“直線”或“直角”的神經訊號,那麼它就會把這個“直線”或“直角”的神經訊號向下傳導給記憶層中能識別“直線”和“直角”的神經網路。但必須說明的是,事實上這些神經網路就是記憶結構,是在這些神經訊號的刺激下才形成了記憶結構,我認為並不存在天然的“黑色”、“白色”、“直線”和“直角”的神經網路,所有的記憶結構都是在與神經訊號互動的過程中逐漸形成。
我猜感受層的任何一個神經元都能夠感受不同的神經訊號,並且還能根據這些神經訊號種類和強弱的不同將它們傳導到記憶層中特定的神經元和突觸。感受層神經元的這個特點是我主觀設定的,並沒有任何依據,不過,這一特點在整個意識模型裡非常地和特別地重要,如果感受層沒有這個功能,那麼這個意識模型就崩潰了,根本無法執行。
我還有另外一種設想,感受層不在大腦裡,而是在感覺器官裡,例如視網膜上每一個畫素點對應的神經元可能不是隻有一個,而是有四、五個或六、七個,根據外界刺激種類和強弱的不同,每個畫素點中啟用的神經元可能只有一個或兩三個,就是每個畫素點只啟用對應神經元中的部分神經元,這樣相對更容易建立起一個對外反應系統。當然,這也只是我的無根無據的猜想,現在還無法驗證。我相信只要能先把基本框架定下來,細節問題遲早會解決的。
我相信人只是“物”的一種,是一種有著特殊結構的“物”,人的意識是大腦內部的“物質反應”,人類所有的意識活動都只是“神經反應”。既然是“反應”,那反應的過程都應該是固定的。
我猜想“感知反應”的第一階段和第二階段都是固定的,每個神經末梢的神經訊號會固定地輸入到大腦感受層中對應的特定的神經元。感受層就像是鏡面,任何物體的光線到鏡面路線是直線固定的,要是不固定的話,那這個鏡面就沒法看了。
我猜想的第四階段的反應也是固定的,每幀訊號幀都會透過突觸傳導啟用互相聯結的記憶結構,由於聯結是固定的,那啟用的記憶結構也將是固定的。正是因為相信“啟用記憶”的過程是有固定套路的,我才有信心說要破解意識的秘密,要是沒有套路,那我還破解什麼?
雖然我真的不知道大腦最表層的神經元是否具有這樣的功能,但是我想讓機器大腦具備這樣的功能應該不是難事。如果這個機器大腦真的能夠執行,那麼我就會非常困惑,我到底是發現了意識的執行機制,還是發明了意識的執行機制?因為感受層這個功能完全是我無憑無據的猜想,我是不是可以申請發明專利?
圖D-16感受層平面示意圖
圖D-15是我手畫的示意圖,這裡的每一點都代表著感受層的一個神經元,這張圖就代表著幾億個感受層的神經元細胞,畫的點數不夠,只是個意思。我猜感受層的神經元應該在3億個以上,因為視網膜上有1.3億個視感光細胞,兩隻眼睛應該就有2.6億個視感光細胞,感受層中對應的神經元應該也有2.6億個,其它感官的感受神經元加起應該至少不會低於3億個吧。
雖然感受層只有一層,但是若干種不同的感受可以同時發生。例如人們在看電影時既有視覺,又有聽覺;在吃飯時則不僅有視覺和聽覺,還有嗅覺和味覺等。對於普通人而言,或者說視覺正常的人而言,我們的感受層所接收的神經訊號的80%以上是視覺訊號。
感受層的功能只是接收感受器官傳導來的訊號幀,不能識別,不能理解,不能思維。拿相片來比喻,感受層就是相片,它只將外界場景在大腦中成像,但是相片並不知道相片裡到底是什麼。感受層只負責接收,識別、理解和思維那是記憶層的事。
(五)記憶層
本書猜想基本都是圍繞記憶展開的,意識就是神經訊號啟用記憶結構。沒有記憶結構,人腦無法感知,也無法思索,記憶結構猜想是本書的主要內容。我建立的意識模型基本都是對記憶結構的猜想,並且以記憶結構作為大腦內部結構的主體,這是理解我的意識模型的主要脈絡。
記憶層就是大腦記憶結構的分層,是理解意識模型的重中之重。所謂“記憶層”是能對感受層進行識別和理解的、由神經元及突觸聯結而成的“多層結構”。我猜想的“記憶層”並非是平面的,也並非是有著明顯區隔的,所謂的“分層”純粹是主觀虛擬的。最初的理解就是大腦的記憶層中儲存在著各種不同感官記憶,例如有視覺記憶、聽覺記憶、嗅覺記憶和味覺記憶等等,它們有自己的特定的記憶結構,並且它們之間肯定是聯結的;後來想到即使是視覺記憶也有各種各樣不同的記憶結構,我沒法知道視覺記憶可以被分為多少層;我想像的多層記憶結構實際是一個四通八達的、既獨立又聯結的立體網路結構,因此,我特別強調分層是虛擬的。
我對記憶結構有很多猜想,可分為靜態執行機制和動態執行機制兩種。靜態機制包括七個猜想:第一是“固定聯結”猜想,我猜記憶就是固定聯結的神經網路結構;第二是“互動形成”猜想,我猜記憶是在神經訊號與記憶結構的互動過程中形成的;第三是“活動可塑”猜想,我猜記憶結構可以在神經訊號的作用下發生改變,進行重塑;第四是“兩份對比”猜想,我猜記憶結構是兩份,立體效果是兩份記憶結構共同啟用的結果;第五是“稀疏結構”猜想,我猜記憶結構是以“稀疏”的狀態進行儲存的;第六是“區域性結構”猜想,我猜記憶結構的具體內容均是“區域性”的;第七是“強聯優先”猜想,我猜大腦神經訊號優先啟用強壯聯結的記憶結構。動態執行機制包括三個猜想:第一是“多幀疊加”猜想,我猜大腦某一時刻對影象或場景的感知由多幀影象訊號幀疊加在一起的;第二是“多層合成”猜想,我猜大腦對任何一幀訊號幀的感知都是由該訊號幀啟用的多層記憶結構的反應合成在一起的;第三是“多幀為主”猜想,我想大腦的主觀感覺是以多幀訊號幀啟用的記憶結構反應為主。
我計劃用這些猜想來解釋意識的秘密,由於只是猜想,所以只能是信不信由你了。
(六)兩像聯結猜想
我很早就自以為是地破解了夢境的秘密,但至少用了十年才破解了語言的秘密,可是我覺得這兩者之間原本只有薄紗之隔啊,夢境是大腦神經反應,而語言也是大腦神經反應,兩者的原理是相通的,我不應該花這麼長的時間啊,那為什麼我會花這麼長的時間呢?
我想自己破解夢境秘密和語言秘密的方式都像是一種“頓悟”,沒有邏輯,無法論證,無根無據,憑空產生,這種“頓悟”到底是怎麼回事呢?想了很久,我猜就是神經元突觸突然聯結上了。沒有這樣聯結的記憶結構,我的大腦就產生不出這樣的“頓悟”反應,有了這樣的聯結,再因為我不停的思索活動,終於在某一天的神經訊號激活了這個新的突觸聯結,於是我就很自然產生了這樣的“頓悟”反應。
既然記憶是神經元及突觸聯結在一起的結果,那記憶會不會是兩兩聯結的呢?於是我想我要是猜對了的話,那我們定住眼睛應該只能看清相鄰的兩個字。這只是我大腦的靈機一動,是又一個“頓悟”,於是定住眼睛試了試,居然我又猜對了!
例如當我們看“兩像聯結猜想”這六個字時,初一看我們感覺我們都可以看清這六個字,但是當我們把眼睛定住盯在“兩像”這兩個字上,不要左右晃動,維持三秒鐘以上,我們就會發現旁邊“聯結猜想”這四個字是模糊的,是看不清楚的;當我們把眼睛從“兩像”這兩個字向右移動一個字,到“聯”字上,再維持三秒鐘,我們就會發現最多可以看清“像聯”兩個字,而先前清晰的“兩”字則變得模糊了。
無論看什麼文字,我們都會發現在眼睛定住不動的情況下最多隻能看清相鄰的兩個字。我稱這個大腦實驗為“兩字實驗”,這個實驗非常重要。“兩字實驗”與“區域性結構猜想”是一脈相承的。
“兩字實驗”與字數一點關係都沒有,事實上當你看一個字中的字劃時,你也最多隻能看相鄰的兩條筆劃。例如“三”字,若是定住眼睛只看上面一橫,你應該可以看清這一橫,下面的兩橫應該是模糊的;若是定住眼睛看上面兩橫時,你應該也可以看清這兩橫,最下面的一橫應該是模糊的;同樣,若是定住眼睛看下面兩橫時,你應該也是隻能看清這兩橫,最上面的一橫應該也是模糊的。“四”字為什麼不是四橫?我猜很可能我們的先人發現四橫和三橫容易被混淆。為什麼容易混淆?因為大腦只能看清兩橫,三橫只比兩橫多一橫,還可以很容易地識別,但四橫以上的就容易混淆了,“四”字不用四橫來表示,這樣“三”字就更容易識別。因此,我們的先人將這種用橫划來描摹數字的方式只用到“三”為止,要是到“四”的話那就麻煩了。
另外,看任何字中的筆劃,事實上我們也只能看清其中相鄰的兩條筆劃。當然,這是個非常困難的大腦實驗,但你一定有過這樣的經歷和體驗,那就是當你仔細看某一個字,時間一久你會發現你似乎不認識眼前這個字了,這是因為你的大腦在對這個字的區域性筆劃作出反應,時間一長這個區域性反應干擾或掩蓋了對這個字的整體反應。
我把“兩字實驗”所隱藏的機制稱為“兩像聯結”猜想,這個猜想沒有任何直接的“客觀證據”,只有這個完全主觀的“兩字實驗”,其它的全靠想像。發現“兩像聯結”是我這一生第三個得意之作。
我認為大腦思維是“反應思維”,完全是物與物反應的結果,是“兩”個物作用的結果,這是“兩像聯結”猜想中“兩”字的最初源頭。大腦神經元和突觸都是“兩兩聯結”的,這也強化了我對“兩”字的印象。兩個神經元或突觸的聯結對於我們大腦的整體思維來說應該沒有多大意義,大腦整體的思維一定是包含了很多個“兩兩聯結”的神經元和突觸,我想這些神經元和突觸應該可以分成“兩邊”,這是一個更大規模的“兩兩聯結”,我猜每一邊是不是就是一個“印象”。我覺得使用“兩象聯結”的語詞可能有歧義,於是就選擇了“兩像聯結”語詞。
我猜想的“兩像聯結”是意識模型的執行單元,但我們根本就看不見,以至於根本沒法解釋。這個“像”可以是一個點、一條線、一個字、一種圖形、一種顏色,也可以一個音、一個調,還可以是一種氣味、一種舌味、一種觸覺等等,但是任何一個“像”又都可以再被分為兩個“像”。可能我們感知任何一個點的神經元都會有幾百個,因此,當你去觀察一個點時,這個點可以被分為“上像”和“下像”,或者“左像”與“右像”等等。同時,由眾多點組成的一條線可以被認為是一個“像”,也可以被分為兩個“像”,還可以成為另一個“像”的組成部分。這就使得解釋和理解變得異常地困難,因為我在解釋的這個“像”可能被你分成了兩個小“像”,又可能被你合併進了另一個大“像”,根本已經不是我在解釋的這個“像”。我想這應該也是“道可道非常道、名可名非常名”的機制原因之一吧。
你大約可以這樣理解,在感知的過程中,你最多隻能感知相鄰的“兩像”,要麼都是兩個字,要麼都是兩條線,要麼都是兩種色。
圖D-17
我們已經知道這中間兩個圓的大小是一樣的,但我們還是無法用眼睛發現這一點。
事實上,我們大腦的單層記憶結構無法同時包括這個圖上的三種不同大小的圓形,當你定住眼睛仔細觀察,你會發現我們只能看清相鄰的兩種圓形。看著左邊的兩種圓形,我們的印象是“中間圓小”;看著右邊的兩種圓形,我們的印象是“中間圓大”;我們看清整體三種圓形的“感官直覺”事實上是將兩幀影象訊號幀疊加合成的結果,並非是我們的大腦有能力對這三種圓形進行整體感知和判斷,我們只是將左右兩邊的圓形各自做了感知和判斷,因此,我們便得到左邊中間圓比右邊中間圓要小的“錯覺”。“棉花與鐵”的錯覺與這個錯覺也是基於同樣的原因。
圖D-18
圖D-17中左右兩邊圓形的距離隔得很遠,但圖D-18中上下兩塊梯形的距離相隔就非常地近,但我們還是一樣無法直接感知它們。我們已經知道上下兩塊梯形的顏色是一樣的,但是我們的“感官直覺”卻無得出這樣的結論,我們覺得上面的梯形要比下面的顏色深。除非我們用手指遮住中間的部分,我們才能發現它們的顏色是一樣的,但只要中間隔了這麼一塊,無論它們隔得再近,我們也仍然無法發現這麼簡單的事實。
這中間部分雖然不大,但是卻也有兩種顏色,我們的大腦只能“兩像聯結”,無法將這四種顏色合併在一起感知,只能進行“兩兩感知”,並將“兩兩感知”的結果疊加合成為對整體的感知,因而才產生了上下兩塊梯形顏色不一樣的“錯覺”。
我猜想的“兩像聯結”不僅是意識模型的單元,還是大腦意識和思維的機制根源,是至簡大道。