最近發現個詭異的事情。
我前幾天在淘寶和京東分別搜過一樣特別小眾的商品,小眾到什麼程度呢?小眾到一般人根本不知道這類東西的存在。
結果我今天開啟拼多多,拼多多居然在首頁第一條就推薦了這件東西。
這???
要知道我在拼多多上沒有搜過任何東西,純粹是因為好奇才下的,同時我也沒有在任何搜尋引擎搜過這個商品的名字。
也就是說,拼多多可能是從淘寶和京東那裡拿到我的搜尋記錄。
但我想這兩個大戶顯然不會和這樣一個競爭對手共享這種大資料。
那問題來了,拼多多是怎樣拿到我的偏好的呢?難道是淘寶有內鬼兜售?難道淘寶被拼多多的間諜攻破了資料庫?難道是我的華為手機把我賣了?
難道說現在各種軟硬體之間已經在互相利用及共享使用者資訊,但凡手裡有資料的都會拿到檯面上互通有無?
百思不得其解,細思極恐。
1、 你也遇到過嗎?
我把拼多多這個事情發在知乎裡,想看看是不是有人和我一樣有這種感受。結果好多人紛紛和我表示,現在才發現這個問題實在是太遲鈍了:
有人試過在B站搜一首歌聽,結果第二天網易雲音樂的每日推薦裡就有這首歌。B站和網易雲音樂有沒有py交易?——我猜應該是有的。當然這尚可接受。
有人在小紅書看到一個RC的鞋,然後就去淘寶上搜有沒有代購,後來感覺不靠譜就放棄了,結果馬上就在微博上就看見同款鞋的推廣。微博和淘寶有沒有py交易?我不知道。
有人只是去參加了一次北京婚博會,晚上回到家開啟微博和微信,發現資訊流廣告全部變成了婚紗照、婚慶公司、婚禮禮服等。令他感到恐怖的是在此之前從未在手機進行過結婚相關的任何搜尋。這一切發生改變的原因僅僅是因為他去了一次婚博會這個地方而已。
有人在知乎看到除甲醛的相關問題,只是百度了一下,結果連一個美食app都開始推薦除甲醛公司。在百度上開啟某理財網站,不到半小時推銷電話就打過來了。
有時候你在網上搜了一本小說,然後突然就會有很多假網站在百度上顯示他們網站有這本小說可以下載,然後讓百度把他推在首頁,你開啟連結一看其實裡面沒有,但是有其他東西的廣告。
qq也很牛逼,推送的店鋪廣告會一直隨著你的行程而變。你在武漢它就給你推武漢,你在蘇州它就推蘇州。
看完知友的傾訴,我覺得今天的網際網路真是太可怕了。我知道大資料發展到最後一定會迎來這一天——我們自己被賣了都不知道怎麼被賣的。
但我沒想到這一天來的這麼快。
我本來已經被忽悠得快相信大資料這個東西了。
我以前覺得,就像你去樓下餛飩店吃餛飩,由於你喜歡吃香菜,老闆為了留住你,在你去過第一次後,每次都多給你加一些香菜來討好你,這是好事情,所謂的大資料就應該這樣改善我的生活。
但如果這個老闆把我的喜好賣給方圓20裡地所有出得起錢的人,也不問他們拿了這個資訊要幹嘛,這個事情就變得讓我有點不安起來。何況,現在出售的可不僅僅是我愛吃香菜這點資訊。
有從業網際網路行業的朋友告訴我,這些都是正常現象,讓我去百度一下“阿里媽媽”就知道了,於是我真的去百度了。
你們能想象嗎,“人群捕撈”這種用詞居然能被當成公開的營銷策略來叫賣。
我不是牲口,誰也別想“捕撈”我。
2、 到底是誰出賣了你?
因為拼多多這個事情,我最近開始反思我的上網習慣。
除了這幫網際網路公司可能在相互勾兌之外,我們身邊還可能隱藏了哪些出賣我們的東西呢?
會不會是瀏覽器洩露了你的資訊?
當年瀏覽器還是流量主入口的時候,多少奸商在瀏覽器上打主意。今天這個生態還在不在,有沒有升級成新的手段?
會不會是輸入法的鍋?
要說嫌疑,輸入法其實是最大的,因為各個軟體之間就算沒有資料共享,但輸入法卻是連線各個軟體的東西。它掌握了你線上線下的中文輸出內容,如果有心利用,這可是個巨大的財富池。
還有路由器這個東西,這個最容易被普通人忽略。
我記得過去銀行搞網際網路安全科普,一條重要的經驗就是登陸網銀的時候不要用公共場合的wifi,而是直接連移動聯通的4G網路,因為你不知道公共wifi路由器是不是在中間截取了你的傳輸資訊。
其實想想,家裡的路由器就可靠嗎?很多人現在都反映用手機連家裡wifi搜個東西,然後發現家用電腦會給你推薦類似手機搜過的東西。現在很多搞網貸區塊鏈的公司甚至願意免費送你路由器,能安什麼好心?
當然,這些都不是最狠的,最怕就是直接在手機硬體上打主意。以普通人的動手能力和數碼水平,想在硬體層面上對抗那基本是完全無招架之力的。
為什麼斯諾登常年保持把攝像頭用膠布貼起來的習慣?他知道這裡面水有多深,很多app監聽著你的手機麥克風,剛和別人語音說過的東西馬上就推薦給你絕對不是空穴來風。
目前的語音識別已經非常完善。哪怕帶著很重的口音/使用方言,語音輸入法都有極高的識別率。當然,當手機在口袋裡時會出現很多幹擾,這會降低識別率;但哪怕只能識別一些片段,也足夠拿來完成很多分析了。
新加坡的一個團隊甚至成功利用每個手機上都有的加速計、陀螺儀、磁力計、近距離感測器搞到了你輸入的密碼。
原理是這樣的:當你伸手在螢幕上劃來劃去時,手機微不可察的細小位置變動會體現為加速度計、陀螺儀裡面數值的極小變化,通過細微的力矩差異足以推斷出你手指點在螢幕哪個角落。
這些感測器,過去並不認為它是敏感的、需要保護的,所以任何程式都可以讀它。
怎麼樣,是不是毛骨悚然?
智慧手機可能是至今發明的最私密的監控裝置。它持續跟蹤我們的位置,它知道我們居住在什麼地方,在何處工作,在何地消遣。知道我們什麼時候醒來什麼時候睡覺,因為人人都有手機,因此它還能知道我們和誰一起睡覺。
3、 “新零售”究竟是什麼鬼?
我的理解,所謂的新零售,其實就是用大資料殺熟。
一家酒店,如果有好多ip都在查詢,別想了,價格肯定嗖嗖漲;如果你用同一個ip的不同裝置反覆查,一天查好幾次,他還會故意無房;要是你第一次點了取消後,回頭再來看,價格會陡然升高,因為他知道你現在的需求可能特別迫切了。
馬未都講過他掏古董的時候也有類似的經驗:買古董如果當場看中當場買,往往價格會比較低,如果猶豫了一下,過兩天再去,對方就知道你是有明確購買意向的,立馬漲價。他管這叫做“買驚了”。
再比如,好多年之前,美帝就有過“如果附近沒有肯德基,就給使用者顯示更高的披薩價格”的案例。
那麼類似的,如果發現你住在“富人區”,賣給你的東西不貴個幾成,對得起大資料嗎?對得起網際網路業界的努力嗎?
以後那幫搞電商的還能做到分辨每一個購買者是高帥富還是屌絲,同樣買一雙nike,根據你平時的消費,判定是高帥富的,有一定鑑別能力的,給發真貨。一般窮屌絲,就圖個牌子的那種,直接發假貨,美滋滋。
現在人類基因組全測序完也才70個G的大小,包含你所有的資訊,如果以後這個也能被賣來賣去,保險公司一定會推薦你買你最不可能得病的保險,這樣他們的賠付率會大幅降低。
大資料要是再和證券市場一結合,那更是割韭菜的利器。在這種零和遊戲裡面,機構對散戶的收割會變成單向的屠殺。
如果一定要總結出那些檯面上的商人學者反覆唸叨的“新零售”究竟是什麼,那麼可以這麼給他下一個定義:
通過綜合一系列的分析,判斷出你是誰,你現在要做什麼,願意付出多少代價去做。
然後通過精準的使用者畫像,去對消費能力高、消費意願強烈的使用者展示更高的價格,賺取更多的利益。
更具體的說,他們會根據你以及你的朋友們使用搜索引擎搜尋的詞彙、時間、頻率,判斷你是“隨便看看”還是“心裡長草”甚至是“心急如焚”,從而給你以及你的整個社會關係圈調整報價。你會越來越被引導著去買那些對你來說非最佳、但對商家來說利潤更高的東西。
不要覺得關於你的看似不起眼的資訊洩露出去沒什麼。只要有心,從你身上多找點錢還是很容易的——而且你還發現不了。
所以你猜,為什麼中中國產應用,總喜歡一口氣要3、40項甚至更多授權,試圖把你的通訊錄你的簡訊你的攝像頭你的麥克風你的SD卡等等等等,把所有的內容都一網打盡呢?
未來這幫大佬們的市值再增長個幾千億,就靠這個了。
4、 更加可怕的未來就在前方
過去要洗一個人的腦是一件很麻煩的事情。
比如傳銷組織,要先把你騙去一個地方,安排壯漢把你關起來不讓走,然後主持人每天說得口乾舌燥,又唱又哭,還未必能洗成功。
未來?洗腦根本不需要那麼麻煩,隨著你交付出越來越多的個人資訊,掌握在雲端的資料日益龐大,比你自己更了解自己的利益集團和別有用心的人可以讓你的大腦自己自動產生出他們需要的念頭。
這些掌握了大量個人資訊的網站,不僅僅有你的生辰八字,身份住址,關鍵他記錄了你的行為,通過後臺反覆模擬計算,他可以以最短時間了解到你的需求,然後迅速滿足你。
慢慢地,網際網路的“好用”會逐漸綁架你的心智。
在龐大的資料面前,人類越來越像一個提供輸入的變數角色,任何試圖偽裝和保護自己的舉動,在無死角的資料監控下都顯得徒勞。
說實話,只是通過抓取我輸入的關鍵詞來打廣告這還不是最恐怖的,最恐怖的是,我只是在心裡想,然後它也會推送這樣東西的廣告給我。
而且在它推了以後,我居然覺得自己確實是需要的。
可見演算法工程師的工資不是白拿的。
這個過程是怎樣的呢?舉個例子:
有一天你心中突然想了解一下某個品牌膝上型電腦,結果一開啟某個網站發現廣告推薦已經給你把這個商品給推薦過來了。
你也許會心裡疑問,我明明沒在網上搜過這東西,也從來沒和人談起過這個品牌,怎麼廣告就知道我現在正好想了解一下呢?
其實很簡單,你之所以會有“想了解這個筆記本”的想法,並不是憑空產生的,有可能是你在瀏覽其他地方時,對筆記本相關的評測或推廣的目光停留稍微長了幾毫秒。
滾動慢了0.1秒那麼一下,人再“奸”都發覺不了這個小動作;甚至連你自己都沒注意到自己手指撥動慢了那麼一絲絲;但電腦卻可以輕鬆察覺到這個停頓——然後立即採取行動。
就這麼幾毫秒,這個動作馬上被記錄下來,說明你對這個商品有想法。現在,只需要“推”你一把,來幫你更快下定決心。
演算法就會在接下來的諮詢中傾向於給你推薦更多有關某個品牌創始人、遊戲、硬體方面的資訊。
積少成多,終於這些活動引起了你意識層面的念頭——我需要買一個新的膝上型電腦,演算法大功告成,這個時候可以正式給你推它的廣告了。
演算法還可以根據你周圍的朋友,從他們的網上留下的資訊裡歸結出最近這些朋友的高頻詞,即他們最近所關心的話題。而你是他們的朋友,所以演算法就認為你可能總會從朋友那聽到這個話題,從而變得關心。
個體的行為不全部是隨機產生的,在之前的所見所聞所搜尋中已經蘊含了你下一步行動的資訊。所以你會覺得計算機怎麼這麼厲害,都窺探到你心裡想什麼了。其實並不是猜到,而是你的意識被引導了,只是你察覺不到。
最終,我們自己變成了移動資料庫。
瞧啊!這個人在這上網呢,誰要給他顯示廣告,價高者得!
大資料時代,你無處可遁。
百度的李彥巨集曾經公開宣揚過,中國人願意用隱私換取便利。
5、後記
我諮詢了一個比較Geek硬核的朋友要怎麼擦除網際網路上留下的痕跡,他給我的建議是:
中中國產服務不要想刪除資料的事了。想徹底抹去網際網路上的痕跡是很賽博朋克的行為,不要自找苦吃。除非你像我一樣,關閉掉一切非必須的定位許可、照片讀取許可、通訊錄讀取許可,從來不在外面連wifi。所有app禁止讀取通訊錄,禁止讀取應用列表,禁止讀取資訊。
我說,那還有啥軟體能用啊?這不全歇菜了。
他說,所以我從來不用任何內地軟體,能用開源軟體一律用開源,任何內地產軟體都放在 virtual machine 或者 Sandbox 裡面用,多重代理加TOR。
我想了想,放棄了。
說真的,面對這種資本和技術的聯合圍剿,其實沒什麼好辦法應對,老外那麼多法律都管不住,中國到現在連這方面的意識都還沒有。
上次爆出來大資料殺熟還是上半年的事情,這事居然最後不了了之了。媒體集體閉嘴,關鍵詞搜尋消失,巨頭的力量真是牛逼透頂。
或許我們唯一能做的,也只有提高警惕了。