回覆列表
  • 1 # 矽釋出

    大資料可以對科研有以下幫助:

    · 大型強子對撞機實驗代表約 1.5 億個感測器每秒提供 4000 萬次資料。每秒有近 6 億次碰撞。經過篩選並避免記錄超過 99.99995% 的這些資料流後,每秒有 100 個目標的衝突。

    因此,僅使用小於 0.001% 的感測器資料流,來自所有四個 LHC 實驗的資料流在複製之前的年度速率為 25 PB(截至 2012 年)。複製後這將變成近 200 PB。

    如果所有感測器資料都記錄在 LHC 中,那麼資料流將非常難以處理。在複製之前,資料流量每年將超過 1.5 億 PB,或者將近 500 EBabytestes。以數字來看,這相當於每天500 個位元組(5×1020)位元組,幾乎是世界上所有其他來源的 200 倍。

    · Square Kilometer Array 是由數千個天線構成的射電望遠鏡。預計到2024年將投入使用。總的來說,這些天線預計將收集 14 EB 位元組,並且每天儲存 1 PB 位元組,這被認為是有史以來最雄心勃勃的科學計劃之一。 · 當斯隆數字巡天(SDSS)在 2000 年開始收集天文資料時,它在頭幾周收集的資料比以前天文學歷史上收集的資料要多。 SDSS 以每晚 200GB 的速度繼續執行,累積了超過 140TB 的資訊。當 SDSS 的繼任者,大型綜合測量望遠鏡在 2020 年上線時,其設計人員預計它將每五天獲取一次該資料量。

    · 解碼人類基因組原本需要 10 年 的時間來處理,現在可以在不到一天的時間內完成。在過去的十年中,DNA 測序儀已經將測序成本減少了10,000,這比按照摩爾定律預測的成本降低便宜了 100 倍 。

  • 2 # 烏辰子

    大資料是建立在當前蓬勃發展高新電子產業基礎上,經過幾十年技術沉澱發酵,產業結構不斷裂變,社會不斷追求更高效、更合理、更科學化。是當前社會應運而生的。是對資料採集、彙總、融合、處理、反饋、分享的大集合。

    大資料對科研的影響可謂方方面面,甚至是整個社會已經全面滲透。以前做科研時,對資料比較原始。一天才能畫好一張圖紙,幾天才能得到一個數據,各個部門要不斷協調。一個專案完成費時費力。效率低,資訊不流暢,比較封閉。當大資料融入時!是對整個科研事業全面系統升級最佳化。突破了時間、距離的界限。例如現在中國高鐵系統的管理、全國社保卡系統的管理、中國產大飛機C919的研發、製造等等…無不是對大資料全面應用、整合。

    大資料對科研來說有點是倍增器,放大了科研功效作用,提高了效能。及時反饋,增大了合力,加快了程序。總之,影響說之不盡。

  • 3 # IT大資料科技

    大資料在科研上的應用有很多呀,比如說就醫療上,利用大資料的技術比如hadoop,hive,hbase,flume,kafka,spark,redis等可以進行資料儲存,然後進行資料建模,接著資料分析,然後就行資料探勘來發現哪些我們觀察不到的關係,也可以進行智慧分析診療方案,預測病情,也可以為醫師提供決策,還有就行大資料在ct方面的應用,在影象重建上,可以採用分散式計算來快算實現演算法,從而快算的恢復原型,大資料在人工智慧方面應用很多,比如機器人,機器人首先需要資料建模,然後在利用大量的資料就行機器訓練,最後可以是機器人訓練的和人差不多,可以比人還厲害,就像谷歌的阿爾法狗,還有大資料在人文地理方面也起著相關重要的影響,改善區域和城市空間和居民行為,同時大資料在面向空間規劃可以起到最佳化的作用。還有在地震方面的研究,透過資料探勘可以提前預測地震的趨勢等。

  • 4 # 中研網

    大資料細分應用領域需求與市場分析

    製造業需求市場

    一、行業資訊化建設現狀

    當前,中國工業正處於轉型升級的攻堅時期,國家工信部印發《資訊化和工業化深度融合專項行動計劃(2013-2018年)》,積極推動資訊化和工業化深度融合,國家工信部先後認定16個兩化融合試點城市, 各地都取得了顯著的成果。上海作為首批8個國家級兩化融合試驗區之一,連續5年保持全國領先水平。

    圖表:2016年中國製造行業資訊化投資規模統計

    2013年,中國製造業資訊化投資達620億元,略有增長,同比增長率為0.8%。2015年,中國製造業資訊化投資規模達到655億元,同比增長3.4%。但是中國製造業中不同行業、不同規模的企業,資訊化建設狀況差距很大。石化、鋼鐵、汽車等行業集中度高企業的資訊化建設較好,一些企業已基本具備了與國際同行接近的資訊化水平;而紡織、輕工等行業,資訊化建設水平較低。

    隨著資訊科技的發展以及資訊化普及水平的提高,數字技術、網路技術和智慧技術日益滲透融入到產品研發、設計、製造的全過程,推動產品生產過程的重大變革。

    世界工業化發展正在面臨著新的變革,發達國家中德國戰略性地提出“工業 4.0”,美國著力打造“工業網際網路”,新的動態變化都將影響全球製造業版圖,中國製造業亟待轉型升級。

    二、行業資料量及其特點

    製造業的儲存資料一般被分為以下幾種型別:其一,產品設計資料,這類資料的典型特點是以檔案為主,非結構化,共享要求比較高,儲存時間也比較長;其二,企業生產環節的業務資料,其特點是以資料庫等結構化資料為主,這些資料的重要性不言而喻,它們不僅表現企業目前執行的狀況,而且為企業進一步發展決策提供有價值的分析;其三,生產監控資料,其特點是資料量非常大,對儲存空間以及I/O吞吐要求高。製造企業中,企業對資料的記錄多停留於兩種形態:1、傳統的紙筆記錄;2、Excel電子表格記錄。這些操作起來看似簡單的資料管理方式,在浪費人力物力的同時,還為企業生產及質量監控埋下了巨大的隱患。而真正挖掘資料背後的價值,更是無從談起。

    三、行業大資料應用需求分析

    在製造業的應用中,產、供、銷一體化為基本核心外,還有延伸的客戶關係管理、供應商資訊管理等外延系統,各種海量資料庫同時交叉執行,並行服務,使用者訪問量大,頻度高,系統負荷重,而且需要保證資料處理的高實時性,這樣資訊化才能有效地服務於生產和運營。日常操作及追加資源頻繁,是一種複合型的高度動態化應用:資料實時變化頻度高,牽扯麵廣,系統需要形成一個有機的整體隨時更新各個狀態。

    製造型企業的良性運營對資訊化的依賴性越來越大,對系統的可靠性、穩定性、安全性和反應速度均提出了很高標準和嚴格要求:隨著企業規模的擴充套件,資訊化應用的規範和普及,對企業網電子資料的使用反映出實時、動態、突發、連續、超高負荷等特點,與生產、銷售、供應緊密聯結,不容許服務中斷甚至反應遲緩。因此硬體裝置的效能應體現出較強的先進性、一定的超前性、充分的可靠性及迅捷的反應速度。

    四、行業大資料應用場景分析

    第一個是在設計環節上。縱觀國外能做成百年企業的,都是設計能力超強的公司。設計能力強的企業有個特點,他們會經常到網上去搜使用者的反饋,甚至建立一個網上社群,由粉絲參與到設計環節當中,這個時候可以藉助大資料的分析能力,將這些反饋快速融入到產品設計當中,推出來的產品才會有消費者買單。而在高階製造業上,需要有設計引數的積累。同樣的材料做出來的產品,有的能耐用10年,有的用幾年就壞了,這是為什麼呢?主要就是原料配比、加工、工藝等的差別,這要依靠很多年的資料積累形成的。鼓勵國內製造企業在設計過程中,用大資料的理念,從頭到尾捕捉下來,所有的設計人員用資料的眼光去做設計,而不是說產品做不好是其它部門的事,管理水平決定了資料的意識和應用的水平。

    第二個環節是生產車間。國內的高階製造業其實資訊化程度很高,生產線上的機床基本都是自動化的,從原材料進入車間到成品產生,人甚至都不用幹預。每個數控機床就是一部小電腦,一條生產線下來就有幾十個質量控制點,只要機器一開每分鐘就會產生巨大的資料量。如果在全國有很多工廠,產量比較大的話,這個製造企業本身就是一個標準的大資料應用場景。“大資料對於製造企業來說好像挺高階的,但也不用怕,可以從小的地方開始,先將資料以自己的維度從機器上採集起來,再結合預先建立的模型,就可以逐步形成大資料的應用。透過一個月、半年、一年的積累,就可以分析出質量跟哪些因素相關,以此為依據去改進產品和生產流程。

    五、行業大資料應用價值分析

    基於工業資料倉庫的精準營銷管理,依託工行強大的資料倉庫平臺,建設精準營銷管理系統叢集,充分運用資料探勘以及大資料分析等現代化的資訊科技手段,就能夠透過客戶資訊的全面採集、高度整合、深度挖掘與高效運用等措施建立“以客戶為中心”的精準營銷管理體系。

    大資料使不同的工業企業構建起了客戶營銷統一檢視,打破資訊孤島,深度挖掘客戶需求,實現目標客戶精準定位,推進客戶分層分類服務。此外,透過搭建智慧營銷資訊服務平臺,企業還能實現精準營銷資訊的智慧化、自動化、制度化、流程化管理,推進營銷管理模式再造和制度完善,加強與客戶之間的溝通和良性互動,提升客戶滿意度和忠誠度。

  • 中秋節和大豐收的關聯?
  • 非計算機專業畢業,0基礎可以自學程式設計嗎?