回覆列表
  • 1 # 麥田紀MT

    (1)結構化資料,簡單來說就是資料庫。結合到典型場景中更容易理解,比如企業ERP、財務系統;醫療HIS資料庫;教育一卡通;政府行政審批;其他核心資料庫等。這些應用需要哪些儲存方案呢?基本包括高速儲存應用需求、資料備份需求、資料共享需求以及資料容災需求。

    (2)非結構化資料庫是指其欄位長度可變,並且每個欄位的記錄又可以由可重複或不可重複的子欄位構成的資料庫,用它不僅可以處理結構化資料(如數字、符號等資訊)而且更適合處理非結構化資料(全文文字、圖象、聲音、影視、超媒體等資訊)。

    (3)資料清洗是指發現並糾正資料檔案中可識別的錯誤的最後一道程式,包括檢查資料一致性,處理無效值和缺失值等。與問卷稽核不同,錄入後的資料清理一般是由計算機而不是人工完成。

    資料清洗原理

    資料清洗(data cleaning),簡單地講,就是從資料來源中清除錯誤和不一致,即利用有關技術如數理統計、資料探勘或預定義的清洗規則等,從資料中檢測和消除錯誤資料、不完整資料和重複資料等,從而提高資料的質量。業務知識與清洗規則的制定在相當程度上取決於審計人員的積累與綜合判斷能力。因此,審計人員應按以下標準評價審計資料的質量。

    (一)準確性:資料值與假定正確的值的一致程度。

    (二)完整性:需要值的屬性中無值缺失的程度。

    (三)一致性:資料對一組約束的滿足程度。

    (四)惟一性:資料記錄(及碼值)的惟一性。

    (五)效性:維護的資料足夠嚴格以滿足分類準則的接受要求。

  • 2 # 意暢企業雲盤

    1.結構化資料:以關係資料庫表形式管理的資料,也可以說是指資料庫。比如企業ERP、財務系統、教育一卡通這種資料。

    2.半結構化資料:非關係模型的、有基本固定結構模式的資料,例如日誌檔案、XML文件、JSON文件、Email等。

    3、非結構化資料:沒有固定模式的資料,如WORD、PDF、PPT、EXL,各種格式的圖片、影片等。

    結構化、半結構化、非結構化其實是按照資料格式分類。舉例說明如下:

    結構化資料:公司需要整理員工的資料,將所有員工按照部門、性別、入職年齡等具體屬性的格式記錄,這部分的資料就是結構化的資料。可以根據固定的模板讀取記錄的屬性值,比如我要查詢入職五年以上的員工。

    非結構化資料: 公司給所有員工做了一個評估,用文件來描述這些員工的工作能力,甚至給每個員工做了相應的資訊網頁,這些資料就屬於非結構化的資料,因為很難透過一個具體的屬性來判斷,需要更加複雜的方式來分析。

    半結構化資料:比如公司做了一個業務系統來儲存員工的基本資訊,就會建立一個對應的表,但不是系統中所有資訊都可以這樣簡單的用一個表中的欄位就能對應的。這些就屬於半結構化的資料。

  • 中秋節和大豐收的關聯?
  • 豐巢迴應誘導消費,對於強制打賞這件事情你怎麼看?