回覆列表
  • 1 # 樊榮偉筆記

    哈哈哈哈,泛泛大蝦神秘笑四聲想知道為什麼嗎?

    好了說下大資料的問題

    首先網際網路時代的資料有些是公開的,有些是不對外的

    泛泛大蝦簡單舉一二例來說

    以實際案例尋找商鋪為例

    可以快速的利用地圖工具對外的資料檢視周圍的交通這個一般人都知道的,但一些地圖工具對外公開了大城市的人口流動熱力圖,什麼意思呢,就是你可以利用這個工具查看出你城市的那塊流動人口多,人口密集程度,每日外來多少固定多少等,很好的解決了人流問題的大資料問題,當然這個資料不光可以用到開實體店。

    最近泛泛大蝦心情很不好,所以開頭笑四聲讓你們以為我很快樂

  • 2 # 造就

    OMAHA開放醫療與健康聯盟發起人

    大家好,我是鄭傑,來自於杭州。我出生於一個醫生世家,也在醫院邊上長大,但大學裡我讀的是計算機專業,畢業後我也沒當醫生。不過我很開心地發現,最近這些年我做的事情和醫學發生了關聯。

    現在我正在運營一個全新的醫療集團,但是我的業餘時間在做一個叫OMAHA(開放醫療與健康聯盟)的聯盟,今天我的分享和我做的事情有關聯。我的演講題目叫做:我的醫療資料,我做主 。

    醫患關係變化的背後是什麼?

    大家看到的這個logo是美國醫學會的一個圖章標誌,中間它有一個蛇杖,是以前西方醫學神的圖騰 。我發現,很多中國的醫療機構和衛生主管機構也把蛇杖放在他們的logo裡。

    在一百多年前,我們沒有這麼多的高新科技,問診都靠身體觸控。在那個年代,一個女性,除丈夫之外其他能觸控她的男性,就只有醫生,所以醫生的地位是非常神聖的。但到了這個時代,醫患關係正在發生改變。

    舉個小例子。我的一位大學老師不幸患了癌症,他閉門不出三個月,讀了所有這方面的資料、論文,然後到醫院,指著一疊東西對醫生說,大夫,你按照這個方法給我治吧,結果醫生傻眼了。

    這說明什麼?說明這個時代的醫患關係正在發生變化。

    那變化的背後是什麼?是資料。

    以前看病是靠望聞問切,現在的醫療都依賴於資料,依賴給你量化以後採集的資訊來做判斷。那麼這個資料會怎麼樣呢?

    一家基因測序公司幫我做過全基因組測序。 那麼這樣的全基因資料有多大?有90GB。同時,我們醫療資料的量還在不斷的擴大,在不遠的將來,我們每一個人的醫療資料都會超過一個TB。

    那問題又來了,我們有多少人手裡有自己電子化的醫療健康資料呢?

    如何擁有完整的醫療健康資料?

    你的醫療健康資料在哪兒?

    這是一個非常重要的問題。我們以前經常拿著病例本去醫院,那時候,醫生還會往你的病例本里貼化驗單。但最近我發現,我以前的好幾個病例本都丟了,我相信大家也有同樣的經歷。

    另外一方面,我們每個人一生中都會在不同的醫療、體檢機構去接受相應的服務,所以你的資料都分散在不同的機構裡面,而且全世界現在都面臨這個難題。

    我們如何才能擁有一個完整的醫療健康資料?為什麼完整性這麼重要?

    我再舉個例子,我有個很好的朋友,他在做肺部檢查時查出來有個陰影,懷疑是腫瘤,去醫院做了很多次會診,最終不放心還是開了一刀,但開胸後發現不是瘤,這一刀白捱了。

    後來他才想起來,自己早年當兵時得過一次嚴重的肺炎,如果他的醫療記錄裡有過這個病例記錄,也許他就不用挨這一刀了。

    所以,這些看似和我們沒有關係的醫療資料卻和我們的生命息息相關。

    那這裡我分三個方面來談談醫療資料:資料開放、資料彙集和資料利用。

    資料開放勢不可擋

    首先聊聊資料開放,目前我們擁有資料的醫療機構還沒有完全開啟,也不知道怎麼開啟,更不放心把資料給到患者。但同時,很多的企業和政府又很希望建立一個平臺,把醫療資料收集起來。

    他們把這個行動推廣到全美,這也啟發了我們去做OMAHA 。

    當下,中國也正在發生變化,深圳市在去年釋出了衛生基本法,其中第一次把向患者公開病例寫了進去,要求醫療機構在患者看完病之後的6小時內提供病例的查詢、影印和複製服務。

    影印大家都可以理解,但複製兩個字卻更加意義深刻,因為這要求醫院能夠電子化的資料複製給你。

    現在,國內已經有一些醫院可以給你一張資料光碟,以後有可能給你一個隨身碟 ,你可以把自己在這家醫院的所有醫療資料帶走。

    這當然是一步一步來,可以先是一個PDF,再慢慢走向一個計算機可以直接讀取的格式,這是我們的一個終極目標。也就是說,這個醫院給了我一個電子化的隨身碟,裡面的文件到了另外一個醫院可以直接匯入,這應該成為一個行業的共享規則。

    很多醫院擔心把完整病例給了患者以後會惹上醫療官司,還有很多醫院裡的資料其實不完整,它羞於拿出來。但恰恰有些院長會說,這不是很好嘛,我和患者非常透明,他可以反向來監督我們,讓我們醫生更認真的去寫病例。

    這是真正以患者為中心的醫院會有的考慮。我們很幸運地看到這樣的醫院越來越多了。

    不同資料該怎麼匯聚?

    開放之後還有第二個問題,資料要怎麼匯聚?

    大家都知道,在醫療行業裡,不同醫院之間的一些指標的正常範圍、專業術語都不一樣,那這個資料拿出來之後,你能整合成一份嗎?

    有些企業正在想辦法解決這個問題,比如蘋果公司,蘋果手機裡有一個health的功能,他就希望變成你的健康資料的一個橋接器、彙總器。所有和蘋果手機連線的APP和可穿戴裝置,只要你將血壓之類的體徵資料儲存進去,它就可以來幫你做資料的彙總。

    但如果我今天從蘋果手機換到Android手機怎麼辦?換到小米手機怎麼辦?換到錘子手機怎麼辦?

    所以你會發現,健康資料的彙總是一個工業級的標準,我們在反覆思考應該怎麼做,要幫行業做哪些基礎設施以解決基礎性的難題。

    這裡很重要的一點就是文件格式和術語標準。

    大家都知道AlphaGo,它之所以成為圍棋高手,是由於學習了兩千多萬個棋譜,不管是中國版的棋譜還是國外版的,都可以作為一個文件被儲存下來,而全世界共享的是同一套標準。

    同樣,我們的健康醫療的文件格式是什麼,這是我們需要去考慮的。

    其次就是術語標準。大家可能不知道,醫療界對一些術語的描述還是非常個性化。舉個例子,有一些醫院叫“盲腸炎”的部位其他醫院叫“闌尾炎”,但講的是一回事。

    怎麼樣才能把這些不同的術語匯聚整合並進行統一?

    所以我們搭建了一個協作運營的平臺,讓大家來共同維護一些詞條,建立它們的關聯關係。我們做的事,就是要給整個中文醫學術語體系搭建一個行業基礎設施,就像對於電商而言,要搭建基本物流設施一樣。

    完整的醫療資料有什麼用?

    假設有了資料彙總的分析設施,那麼它能帶來什麼?

    這裡我舉一個例子,這是我的一個好朋友,一個40多歲的理工男,他不幸得了嚴重的痛風,要經常檢測自己的尿酸,他不間斷給自己測了十年尿酸,還把這些資料填到excel表格裡面去,還給它做了迴歸線分析。

    他說要自己填寫資料實在很麻煩,要是每次測的時候都有個軟體能自動彙總就好了,同時這個軟體還能提醒我到了什麼時間點該做什麼。

    這就是很直接的一個例子,如何將他十年的資料自動彙總完整性 。由此可見,一旦你生病以後,真的就非常關注自己的資料了。

    當我們有了完整的資料以後,我們還可以享受到個性化的治療。我們都知道現在西藥不是對每個人都有效,也許你對這個藥有效,他對這個藥無效,你應該吃三顆,他要吃五顆。

    所以,醫療如今已進入到了一個長尾時代,不僅是個性化治療,而且將會有越來越多的疑難雜症、罕見病,都在這個資料完整的時代被發現。

    保障資料利用的安全

    隨著資料越來越多、越來越完整,我們還會碰到一個更直接的問題,就是如何保障隱私安全。事實上未來我們自己的健康資料的價值非常重大,也許很快會和你的保險來做對接。

    我們每個老百姓既有權獲得自己的資料,又要非常關注隱私問題。

    世界上已經有很多國家對此制定了相應的法律,中國也在慢慢的完善。醫療機構如果隨便把患者資料給到第三方,是有重大問題的。

    如果把自己的完整電子病歷給到第三方機構,他們也可以精確定位你的資訊。甚至於,就連你的聲音資訊都很寶貴,如果你的聲音資訊被採集,你以後甚至都不知道給你打電話過來的這個人是不是你的親人。

    在這個時代,你必須重視資料隱私和資料安全。不單是我們整個健康醫療大資料的流動彙總,不單單是第三方機構,更是所有老百姓、政府機構都要去關注和重視,整個產業界要去推動,這是一個全行業的事情。

    資料時代的赤腳醫生

    上世紀五六十年代的時候,中國有一個被聯合國高度認可的赤腳醫生模式。我的母親就做過赤腳醫生,當年在鄉下,她和父老鄉親關係特別好。

    那時候的醫生,真的是基於患者的大資料,來給對方做診斷的。那時候也沒有什麼裝置,就是在跟患者聊天、交流的過程中來了解對方。

    在未來的數字醫生時代,全新的赤腳醫生將來到你家門口。他在知道你的完整資料之後,可以給你做出更精準的診斷。

    我們要重視自己的資料,要更加主動的參與自己的健康保障,這個民主化醫療的時代就要來臨。

    所以我們說醫改也好,醫療服務行業也好,最終的目標都是讓每一個人能夠做好自我管理。只有做好自我管理,這個國家的醫療總費用才是最低的。

    而自我管理的背後就是了解你自己,你有你自己完整的資料,而且大家又在共享資料,才能去發現更美妙的事情。

  • 3 # 西線學院

      1、公開資訊及整理

      比如統計局的資料、公司自己釋出的年報、其他市場機構的研究報告、或者根據公開的零散資訊整理;

      2、購買的資料庫

      市場上有很多產品化的資料庫,比如Bloomberg、OneSource、Wind等等,這個一般是以公司的名義買入口,不光諮詢公司還有很多高等院校及研究機構也買了;

      3、自己的資料庫

      自己維護的資料庫有,但是比較少,一是專業的資料公司差不多能想到的都做了,二是自己做資料庫其實是一件很麻煩的事情。在有些資料是外界無法得到的情況下有可能自己維護一個小型的資料庫;

      4、諮詢行業專家

      當然是有償的,這個在專案中應該蠻常見的。有些行業專家會專門收集和銷售資料,想要的基本能買到。

      5、發問卷

      有時候為了單獨的專案也會收集很特別的資料,如果外界實在沒有但是專案上沒有不行就只有自己做了,比如自己發發問卷之類的,但是這類資料需求要控制工作量,因為除非資料本身是交付內容之一,要不然不能為了箇中間件花費太多時間和精力;

      6、客戶

  • 4 # 陳輝博士

    在資料的江湖裡,既有波瀾壯闊的大資料(Big Data),也有微波漣漪的小資料(Small Data),二者相輔相成,才能相映生輝。目前大資料流行,人們就“言必稱大資料”,這不是做學問的態度,不要碰到大量的資料,就給它戴上一頂 “大資料”的帽子。大資料體現出規律,小資料蘊含著智慧,它們都閃爍著理想之光。

    古人云:“聖人見微知著,睹始知終。”道家的一部重要著作《淮南子·說山訓》中說:“以小明大,見一葉落而知歲之將暮,睹瓶中之水而知天下之寒。”意思是說,看見一片落葉,就知道秋天來臨;看到瓶中水結冰,就知道天氣的寒冷程度,這是對見微知著的形象比喻。

    吳甘沙先生用《一代宗師》的臺詞來比擬大、小資料的區分,倒也甚是恰當。他說,小資料“見微”,作個人刻畫,可用《一代宗師》中“見自己”形容之;而大資料“知著”,反映自然和群體的特徵和趨勢,可用《一代宗師》中的“見天地、見眾生”比喻之。

    大就是大資料,就是全量資料;小就是小資料,就是個體資料。所以,對於資料科學,我們必須在把情況搞清楚的基礎上懂得哪些是大、哪些是小、怎樣處理大小辯證關係,才能在具體資料應用中做到抓大放小、以大兼小,以小帶大、小中見大。在研究小資料時,要以大兼小、以小見大,必須考慮目標的正確性、可操作性和決策的科學性、可行性。在研究大資料時,要抓大放小、以小帶大,既要考慮整體共性,又要注重個體特徵。這樣,資料應用中,大能與小資料量化的自我保持高度一致,小能與大資料預見的未來保持一致,既不能見小不見大,也不能見大不見小。對於資料科學,從資料中來,到資料中去,既要見大,也要見小,以小帶大、小中見大,才能真正用好資料。

    當認知科學領域發生“天翻地覆”的變化時,我們的未來又會是怎樣?認知革命,特別是“真相時代”的到來,“預測”將被“預見”取代,那麼,“預見未來”將不再是遙遠的星辰。如果認知科學的本質是計算科學,那麼,“大資料”和“小資料”爭奪所謂“大小”的“江湖地位”意義何在?但我們需要覺悟的是:此“資料”非彼“資料”。面向未來,“大資料”和“小資料”將開啟一個“全新故事”,一個“預見未來”的故事。

  • 5 # IT人劉俊明

    通常情況下,採集資訊有以下幾個渠道:

    第一:傳統資訊系統。傳統資訊系統採集的資訊往往具有較高的價值,一方面原因是傳統資訊系統採集的往往是結構化資料,易於統計和分析,另一方面原因是傳統資訊系統採集的資料往往是比較重要的資料,對後續的資料分析有重要的參考價值。傳統資訊系統包含的內容比較廣泛,比如常見的ERP系統。對於企業來說,傳統資訊系統的建設應該是資訊化建設的第一步。

    第二:Web平臺。資訊來源的另一個重要渠道是各種Web平臺,隨著Web應用的普及,尤其是Web2.0的普及應用之後,整個Web系統產生了大量的資料,這些資料也是大資料系統的重要資料來源之一。Web系統的資料具備幾個典型的特點,比如數量大、結構多樣性、真假難辨等等,這就需要透過資料分析來進一步體現其價值了。

    第三:物聯網系統。物聯網與大資料的關係非常緊密,物聯網系統的普及應用是產生大資料的重要原因之一,大資料的大部分資料來源就是物聯網系統。通常情況下,物聯網系統有五層結構,分別是裝置、網路、平臺、分析處理和服務應用,裝置往往是資料的來源。與傳統資訊系統和Web系統不同,物聯網的資料大部分都是非結構化資料和半結構化資料,要想對其進行分析需要採用特定的處理方式,比較常見的處理方式包括批處理和流處理。批處理比較常見的平臺包括Hadoop和Spark,而流處理通常採用Spark Streaming、Storm等。

    除了以上幾個比較常見的資訊採集渠道之外,透過線下活動進行資訊採集也是一種獲取資訊的手段和方式。對於廣大使用者來說,要注意線下資訊採集的安全性。

  • 中秋節和大豐收的關聯?
  • 三國演義《曹操壽終傳遺命》200字讀後感?