導航:首頁 > 方法技巧 > 數據質量管理方法如何設計稽核點

數據質量管理方法如何設計稽核點

發布時間:2022-12-21 17:49:15

❶ 數據質量控制通常做法

數據質量控制通常做法如下:
步驟一:探查數據內容、結構和異常。探查數據以發現和評估數據的內容、結構和異常。通過探查,可以識別數據的優勢和弱勢,幫助企業確定項目計劃。
步驟二:建立數據質量度量並明確目標。Informatica的數據質量解決方案為業務人員和IT人員提供了一個共同的平台建立和完善度量標准,用戶可以在數據質量記分卡中跟蹤度量標準的達標情況,並通過電子郵件發送URL來與相關人員隨時進行共享。
步驟三:設計和實施數據質量業務規則。明確企業的數據質量規則,即,可重復使用的業務邏輯,管理如何清洗數據和解析用於支持目標應用欄位和數據。業務部門和IT部門通過使用基於角色的功能,一同設計、測試、完善和實施數據質量業務規則,以達成最好的結果。
步驟四:將數據質量規則構建到數據集成過程中。
步驟五:檢查異常並完善規則。
步驟六:對照目標,監測數據質量。

❷ 數據質量管理的MTC-DQM 數據質量管理的方法與步驟

熟悉六西格瑪管理的人應該知道,六西格瑪強調以事實驅動管理。但事實是用數據說話。映射到六西格瑪管理方法,MTC-DQM推薦採用十步數據質量管理方法。
1. 定義和商定問題、時機和目標,以指導整個數據質量管理的工作。
2. 收集、匯總、分析有關形式和信息環境。設計設計捕獲和評估的方案。
3. 按照數據質量維度對數據質量進行評估。
4. 使用各種技術評估劣質數據對業務產生的影響。
5. 確定影響數據質量的真實原因,並區分這些原因的影響的數據質量的級別。
6. 最終確定行動的建議,為數據質量改善制定方案,包括數據級和組織級的。
7. 建立數據錯誤預防方案,並改正當前數據問題。
8. 通過改進組織管理流程,最大限度控制由管理上的缺陷造成的數據質量問題。
9. 對數據和管理實施監控,維護已改善的效果。
10.溝通貫穿管理始終,循環的評估組織管理流程,以確保數據質量改善的成果得到有效保持。

❸ 社會保險數據質量稽核主要圍繞哪三方面內容展開

法律分析:社保稽核簡單來說就是社保機構檢查用人單位繳納社會保險的情況。其具有促進社會保險基金的征繳、防止社保基金的流失、促進參保企業公平競爭、提高社保管理質量等作用。其最終目的就是要維護參保人員的合法權益,這樣才能保證社會保險待遇按照國家法律和政策規章順利的執行下去,對於維護社會保險事業穩定和發展有很好的作用。

法律依據:《中華人民共和國基本醫療衛生與健康促進法》 第一百零四條 違反本法規定,以欺詐、偽造證明材料或者其他手段騙取基本醫療保險待遇,或者基本醫療保險經辦機構以及醫療機構、葯品經營單位等以欺詐、偽造證明材料或者其他手段騙取基本醫療保險基金支出的,由縣級以上人民政府醫療保障主管部門依照有關社會保險的法律、行政法規規定給予行政處罰。

❹ 數據質量包括什麼方面

數據質量包括數據質量控制和數據治理。

數據是組織最具價值的資產之一。企業的數據質量與業務績效之間存在著直接聯系,高質量的數據可以使公司保持競爭力並在經濟動盪時期立於不敗之地。有了普遍深入的數據質量,企業在任何時候都可以信任滿足所有需求的所有數據。

一個戰略性和系統性的方法能幫助企業正確研究企業的數據質量項目,業務部門與 IT 部門的相關人員將各自具有明確角色和責任,配備正確的技術和工具,以應對數據質量控制的挑戰。

(4)數據質量管理方法如何設計稽核點擴展閱讀:

控制方法:

1、探查數據內容、結構和異常

第一步是探查數據以發現和評估數據的內容、結構和異常。通過探查,可以識別數據的優勢和弱勢,幫助企業確定項目計劃。一個關鍵目標就是明確指出數據錯誤和問題,例如將會給業務流程帶來威脅的不一致和冗餘。

2、建立數據質量度量並明確目標

Informatica的數據質量解決方案為業務人員和IT人員提供了一個共同的平台建立和完善度量標准,用戶可以在數據質量記分卡中跟蹤度量標準的達標情況,並通過電子郵件發送URL來與相關人員隨時進行共享。

3、設計和實施數據質量業務規則

明確企業的數據質量規則,即,可重復使用的業務邏輯,管理如何清洗數據和解析用於支持目標應用欄位和數據。業務部門和IT部門通過使用基於角色的功能,一同設計、測試、完善和實施數據質量業務規則,以達成最好的結果。

4、將數據質量規則構建到數據集成過程中

Informatica Data Quality支持普遍深入的數據質量控制,使用戶可以從擴展型企業中的任何位置跨任何數量的應用程序、在一個基於服務的架構中作為一項服務來執行業務規則。

數據質量服務由可集中管理、獨立於應用程序並可重復使用的業務規則構成,可用來執行探查、清洗、標准化、名稱與地址匹配以及監測。

5、檢查異常並完善規則

在執行數據質量流程後,大多數記錄將會被清洗和標准化,並達到企業所設定的數據質量目標。然而,無可避免,仍會存在一些沒有被清洗的劣質數據,此時則需要完善控制數據質量的業務規則。Informatica Data Quality可捕獲和突顯數據質量異常和異常值,以便更進一步的探查和分析。

5、對照目標,監測數據質量

數據質量控制不應為一次性的「邊設邊忘」活動。相對目標和在整個業務應用中持續監測和管理數據質量對於保持和改進高水平的數據質量性能而言是至關重要的。

Informatica Data Quality包括一個記分卡工具,而儀錶板和報告選項則具備更為廣泛的功能,可進行動態報告以及以更具可視化的方式呈現。

❺ 提高數據質量的步驟和措施

由於大多數系統和應用程序會持續不斷接收到新數據,數據量也在不斷增加,因此確保數據質量並不是一次就能完成的。所有企業都應該使用一種反復進行的階段性過程來管理數據質量,此過程包括數據質量評估、規劃以及策略的選擇和實施。

第一步對數據質量進行評估。評估當前的數據質量狀態是第一步。對數據質量進行評估能幫助企業准確地了解數據的內容、質量和結構。主管人員參與數據質量評估以及分析在數據檢查過程中發現的問題對於數據質量評估來說都很重要。在最有效的數據質量評估中,所有問題都將按照對業務影響從大到小的順序列出,這將幫助IT機構節省項目成本。

第二步,制訂數據質量計劃。徹底了解企業數據的內容和質量後,接下來的步驟是制訂一個計劃,來修改當前的錯誤並避免未來錯誤的發生。有效的計劃不但可以提高企業當前所有應用程序中數據的質量,還將制定一些方式以確保新應用程序從一開始就遵循數據質量規則。

第三步,選擇和實施數據質量策略。選擇改善企業數據質量的策略,要求決策者權衡每個數據質量計劃的成本以及該策略產生的影響。目前的策略類型有兩種: 在企業輸入數據時提高數據質量的方法稱為“上游”方法,而從運營系統提取數據的應用程序(如數據倉庫)中改善數據質量的方法是“下游”方法。

上游策略研究當前應用程序的邏輯、數據和流程,解決檢查過程中發現的異常情況。此策略可能涉及到更改應用程序邏輯、添加更好的表驗證、改善與數據輸入相關的流程,它致力於企業數據的高准確性。另外,此策略還要求使用應用程序本身附帶的數據質量功能。

下游策略解決目標應用程序或數據倉庫(而非數據源)中的數據質量問題。由於數據可以根據需要隨時進行修改,所以企業能夠在流程(尤其是數據轉換、名稱和地址清洗以及查找驗證)中改善數據質量。下游策略僅為目標應用程序或數據倉庫改善數據質量,但與上游策略相比,它的實施過程更簡單,成本更低。

1. 建立數據的標准,明確數據的定義。

通常,獨立的應用系統會有一個比較模糊的、有時也會有比較清晰的數據標准和數據定義。為了保證系統的正常運行,這些系統的用戶必須在數據的標准和數據的定義上達成一致。不過,這些標准和定義大多數時候與企業中其他系統中的數據標准和定義並不一致。因此,需要從整個企業的角度出發,建立統一的數據標准和數據定義,同時,整個企業必須就這個數據標准和數據定義達成共識。這一句話說起來容易做起來難。因為人通常本能地會拒絕改變,改變數據標准和定義並不是輕而易舉的。為此,強烈建立在企業中除了設立一個高管級別的數據質量管理委員會外,還需要選定一個執行能力強的項目負責人,需要他推動相關人員接受新的`數據標准和定義。

在具體建立新的數據標准和數據定義時,需要仔細權衡,哪些定義和標準是出於企業內部的原因(比如出於方便、習慣等)制訂的,哪些定義和標準是因為要有效反映外部的真實世界而制訂的。相對而言,前者更容易執行一些。

2. 建立一個可重復的數據收集、數據修改和數據維護流程。

數據管理面臨的兩個主要挑戰是企業本身的復雜性和身份信息不斷變化。這兩個客觀原因的存在意味著企業的數據質量保證行動永遠沒有結束之日,因此,企業在制訂數據質量的保證措施和數據質量指標時,必須保證這些措施和指標能夠不斷重復。

3. 在數據轉化流程中設立多個性能監控點。

數據的質量高低可以根據最終用戶的需求來評價,也可以通過與同類數據源的比較來評價,還可以通過與前一階段的數據質量進行比較來評價。但在制訂數據質量的戰略時,比較理想的辦法還是根據最終用戶的需求來進行。不過這里存在一個問題是,等到最終用戶拿到數據時再針對數據的問題進行修正已經太遲了。一個有效的數據質量保證辦法是在每當數據發生轉換後就與前一時期進行比較,從而對數據質量進行評估。如果此前所採用的數據質量改進方法有助於提高最終用戶的滿意度,那麼,這些中間指標的達標也預示著項目的最終成功。

4. 對流程不斷進行改善和優化。

我們常常聽到有人說,他們制訂了很多辦法來迅速而且大幅度提升數據的質量,但很少聽說最後他們能真正得到滿意的結果。其原因就在於數據的質量改進絕非一朝一夕的事情,而是一個持續的過程。正確的辦法是通過一個不斷改進的流程,持續不斷地排除錯誤、對數據進行整合和標准化,最後達到流程的自動化,從而降低數據質量保證計劃的總體開銷。實際上,排除錯誤、數據整合和數據標准化從來就不是一件容易的事情。數據質量管理計劃的負責人將配合公司高管組成的數據質量管理委員會來保證這個流程的順利執行。要注意的是,作為該項目的負責人,不能墨守成規,僅僅因為自己以前一向採用某種方法,就要求別人也必須採用這一方法,特別是當發現這些方法成本高昂的時候,就應該考慮換一種方式了。

5. 把責任落實到人。

通常,我們認為那些與數據的產生、維護相關的人員是負責任的,但是,很有可能,他們有很多其他的工作要做,因此作為數據質量的負責人光有善良的想法是難以提高數據的質量,很有可能一輩子也達不到目標。對於那些負責數據的產生、數據的合理化以及對數據進行清理和維護的人,應該給他們的活動制訂明確的指標,這樣他們才能真正理解人們到底希望他們達到什麼目標。更重要的,他們還需要針對這些指標細化對他們自己的要求,當然,他們會因為達到或者超過這些指標而得到獎勵。其中,一個執行力強的負責人的價值體現出來,他會針對具體情況適時調整數據質量的目標。

最後,再次強調考慮與數據管理和數據質量的改進項目有關的人的因素,他們的行為是非常重要的。從某種程度上說,要比具體選擇什麼軟體要重要得多。上述5點有助於幫助組織規范數據質量管理中與人有關的流程。

❻ 數據質量管理的分析影響數據質量的因素

影響數據質量的因素主要來源於四方面:信息因素、技術因素、流程因素和管理因素。
信息因素:產生這部分數據質量問題的原因主要有:元數據描述及理解錯誤、數據度量的各種性質(如:數據源規格不統一)得不到保證和變化頻度不恰當等。
技術因素:主要是指由於具體數據處理的各技術環節的異常造成的數據質量問題。數據質量問題的產生環節主要包括數據創建、數據獲取、數據傳輸、數據裝載、數據使用、數據維護等方面的內容。
流程因素:是指由於系統作業流程和人工操作流程設置不當造成的數據質量問題,主要來源於系統數據的創建流程、傳遞流程、裝載流程、使用流程、維護流程和稽核流程等各環節。
管理因素:是指由於人員素質及管理機制方面的原因造成的數據質量問題。如人員培訓、人員管理、培訓或者獎懲措施不當導致的管理缺失或者管理缺陷。

❼ 淺談數據質量管理:為了更清醒的數據

戰戰兢兢地寫下標題,得意下「清醒」這個詞用得真是獨樹一幟,跟外面那些妖艷賤貨好不一樣。我們常常說人要時刻保持清醒,這樣才能不被假象所蒙蔽。那數據其實更需要這點,我們需要透過數據挖掘本質,如果數據是不具備完整人格的,缺失完整性、規范性、一致性等維度,那麼我們看到的本質也是偏差的。開篇先鬼扯一下,詳情請往下滑~

數據質量管理是指為了滿足信息利用的需要,對信息系統的各個信息採集點進行規范,包括建立模式化的操作規程、原始信息的校驗、錯誤信息的反饋、矯正等一系列的過程。

為什麼有這么多人強調改善數據質量管理的重要性,用一種很抽象的比喻描述,如果把整個數據應用比作人體的話,那好的數據就相當於新鮮和沸騰的血液,能讓我們的身體充滿活力,高效地工作思考。而質量差的血液攜帶廢物和毒素,隨著毒素越積越多,血液以及血管就會發生病變,血液流經的全身各處器官也會大受影響。如果非要要具體的數據證明,我摘取了一些專家的統計:

那什麼會影響數據質量呢?其實簡單就分為2個因素。

在此附上數據的生命周期圖,包括各環節的數據流轉和數據處理。

怎麼樣才算質量好的數據呢?借用數據質量評估六要素,順便附上自己的一些解析:

如何通過具體工作來貫徹落實數據質量管理呢?由於數據質量管理是貫穿數據整個生命周期的,所以根據數據的各環節進行分點描述:

數據稽核是指實現數據的完整性和一致性檢查,提升數據質量,數據稽核是一個從數據採集,預處理,比對,分析,預警,通知,問題修復的完整數據質量管控鏈條。

1、配置校驗規則,例如欄位映射等。
2、配置調度規則,例如調度頻率等。
3、配置報表模板,例如稽核結果等。

數據清洗是指發現並糾正數據文件中可識別的錯誤的最後一道程序,包括檢查數據一致性,處理無效值和缺失值等。與問卷審核不同,錄入後的數據清理一般是由計算機而不是人工完成。

如何保證數據質量?
數據分析師必修課(1)——數據質量評估
淺談數據質量管理
利用數據質量規則庫推動數據質量管理
主數據-數據質量管理
談數據稽核(3)
中興軟創-數據稽核系統解決方案

❽ 2020-03-16提升現場管理人員能力以及IPQC/IPQA現場稽核效果的思路和方法

TIPS:

認知在行前,知行合一;

事務性的稽核常常被忽視;

沒有檢查就沒有執行力,如何開展檢查也非常重要。

案例:

客戶A投訴一個批次LCD(夾PIN產品)的包裝方法和原有方式不一致。原有方式是最上層為一個空吸塑盤,投訴批次來料最上層為一個紙板。

QE組織調查事實如下:

     整個投訴批次包裝方式錯誤;

     錯誤發生在A客戶產品首次從1車間轉到2車間生產;

     產品規格書有清楚寫明包裝材料和數量;資料里沒有寫要使用紙板;

     紙板是LCD常規包裝方式和使用材料;

QE和相關管理人員分析認為原因如下:

     《規格書》只有數量,沒有具體方法和注意事項,不夠直觀;

     吸塑包裝和泡沫盒包裝差異包裝作業員和OQA均按照常規包裝方式進行打包,沒有認真核對《規格書》;

     1車間和2車間包裝流程上對於OQA的監控點存在差異;需要按照1車間方式;

     包裝資料只有文字描述,沒有包裝圖紙;

改進的對策

     設計開發增加包裝圖紙文件;

     OQA監控點調整;

     對包裝作業員和OQA進行培訓;

這是一個標準的問題處理流程和方法,問題至此關閉。

但是,我們是否還能夠進一步檢討為什麼會出現這樣的問題?

我個人認為,出現此批次包裝錯誤的根本原因是「 包裝作業員和OQA沒有按照作業規范要求查核《規格書》的包裝要求 」。在第一種描述性的包裝要求中,根本沒有出現紙板這個物料,而我們作業員卻使用了,因為他是憑著記憶和其他產品的包裝方式來作業的。根據這個推測就是沒有核查《規格書》。如果不執行核查,那麼資料做的再完善,即使是做成動畫,也沒有任何的意義,因為文I件根本不會被「觸發」(查看)而產生價值。

那麼,為什麼作業員可以不按照按照規范作業呢?因為我們的現場管理人員,或者IPQC/IPQA從來沒有巡查過這些事務性的內容執行情況。

為什麼我們不沒有這樣做呢?因為我們對於事務性的執行巡查/稽核存在思路和方法上的不足。    

IPQC的巡查,主要是針對產品和設備的參數進行點檢或者稽核的。比如LCD貼片首檢,對POL使用的型號、底色、LCD電壓、型號等進行檢查。這些都是對產品的;比如設備的氣壓設定、溫度設定等等參數點檢。

 IPQA巡查,主要是針對流程的執行是否開展。比如IPQC是否進行了首檢檢查,已經首檢檢查OK後才能作業。作業員是否SOP進行巡查,點檢並記錄。

這些都是有明確的檢查對象,他們都是物,指向明確,判定不存在模糊地帶,只有「正確」後者「不正確」兩種狀態,巡查/稽核都有明確的記錄或者表格,已證明相關人員做了這件事情。

一般的體系是這樣要求我們的。

那麼,對於此案例中的「包裝作業員和OQA按照作業規范要求查核《規格書》的包裝要求」這樣的規定,我們的巡查/稽核是忽略的,而且我們的IPQC/IPQA也不知道如何開展巡查/稽核。

     如果我們問作業員,你作業前按照規范查文件了嗎?他一定會回答「按照要求做了」。這樣的稽核效果為零;

     我們不知道作業員什麼時候查文件,因為包裝作業的觸發具有動態性;

     一般來講,這類事務性的工作是沒有要求做記錄的,因此沒有載體來證明他/她是否真的執行了。

通常,我們的現場管理人員遇到這種情況,就是三種選擇:

    1.思維認知還不會觸及這個問題;就是我們案例中的到了前面的措施就結束了,問題得到「關閉」。

我們現在在探討這個問題。

    2.「笨」對策。

當我們在討論這個問題深入的時候,我們經常會想到的對策是「製作一個表格,讓作業員查了文件後做一個記錄」。這個是典型的「笨」對策,因為它增加了作業人員的無價值的工作,而且是為了避免一個錯誤率非常低的事務性工作給出一個持久性的、耗時的事務性作業規定。此類對策我們一般稱為「領導生病了要員工吃葯」的措施。

    3.束手無策;

那麼我們應該如何來改善這個問題呢?還是要採用最基本的核心方法: PDCA!

P(Plan 策劃)

我們已經從思想上認知到了事務性的工作也是要進行稽核以保證被得到執行;

我們已改如何來執行稽核?

     熟悉和掌握包裝作業員和OQA查詢《規格書》的方式和方法。包括通常在什麼時候查《規格書》,如何查核,在臨時插單的情況下如何查詢,在首次量產的情況下如何查詢。

     通過作業的規律和時間定確定稽核的方式;

     在首次量產時稽核(抽查);

     在作業員經常查《規格書》的時間段來稽核;

     「釣魚」稽核方式;

     將稽核的方式、方法編寫到《XXX巡查表》中,並制定稽核時間(比如每周一次或兩周一次等);

     將其他事務性的稽核內容進行整合,使得工作安排合理。

D(Do 執行)

     執行需要足夠的技巧和耐心;

C(Check檢查)

     進行檢討;

A(Act改進)

     改進提高;

因此,對於現場管理人員的工作,IPQC/IPQA等人員,對事務性的稽查的思路更重要,當我們認知到了,執行也要跟上,要做到「知行合一」!同時,我們的質量管理人員要將這些方法、思路分享給我們的其他部門的人員,才能得到他們更多的支持,將大家統一到一個戰線上來。

❾ 數據質量的控制方法

一個戰略性和系統性的方法能幫助企業正確研究企業的數據質量項目,業務部門與 IT 部門的相關人員將各自具有明確角色和責任,配備正確的技術和工具,以應對數據質量控制的挑戰。
Informatica 的六步法為幫助指導數據質量控制而設計,從初始的數據探查到持續監測以及持續進行的數據優化。業務部門與 IT 部門的數據使用者 — 業務分析師、數據管理員、IT 開發人員和管理員,能夠在六個步驟的每一步中協同使用 Informatica 數據質量解決方案;並在整個擴展型企業的所有數據領域和應用程序中嵌入數據質量控制。
步驟一:探查數據內容、結構和異常
第一步是探查數據以發現和評估數據的內容、結構和異常。通過探查,可以識別數據的優勢和弱勢,幫助企業確定項目計劃。一個關鍵目標就是明確指出數據錯誤和問題,例如將會給業務流程帶來威脅的不一致和冗餘。
步驟二:建立數據質量度量並明確目標
Informatica的數據質量解決方案為業務人員和IT人員提供了一個共同的平台建立和完善度量標准,用戶可以在數據質量記分卡中跟蹤度量標準的達標情況,並通過電子郵件發送URL來與相關人員隨時進行共享。
步驟三:設計和實施數據質量業務規則
明確企業的數據質量規則,即,可重復使用的業務邏輯,管理如何清洗數據和解析用於支持目標應用欄位和數據。業務部門和IT部門通過使用基於角色的功能,一同設計、測試、完善和實施數據質量業務規則,以達成最好的結果。
步驟四:將數據質量規則構建到數據集成過程中
Informatica Data Quality支持普遍深入的數據質量控制,使用戶可以從擴展型企業中的任何位置跨任何數量的應用程序、在一個基於服務的架構中作為一項服務來執行業務規則。數據質量服務由可集中管理、獨立於應用程序並可重復使用的業務規則構成,可用來執行探查、清洗、標准化、名稱與地址匹配以及監測。
步驟五:檢查異常並完善規則
在執行數據質量流程後,大多數記錄將會被清洗和標准化,並達到企業所設定的數據質量目標。然而,無可避免,仍會存在一些沒有被清洗的劣質數據,此時則需要完善控制數據質量的業務規則。Informatica Data Quality可捕獲和突顯數據質量異常和異常值,以便更進一步的探查和分析。
步驟六:對照目標,監測數據質量
數據質量控制不應為一次性的「邊設邊忘」活動。相對目標和在整個業務應用中持續監測和管理數據質量對於保持和改進高水平的數據質量性能而言是至關重要的。Informatica Data Quality包括一個記分卡工具,而儀錶板和報告選項則具備更為廣泛的功能,可進行動態報告以及以更具可視化的方式呈現。 上面介紹的Informatica六步法,該方法運用Informatica數據質量解決方案,提供公司所需要的各種數據質量管理能力,並確保其所有數據均是完整的、一致的、准確的、通用的。該解決方案包括幾個針對特定用途優化的組件:
Informatica Data Explorer運用基於角色的工具可促進業務部門與IT部門之間的協作,該數據探查軟體發現和分析任何來源中任何類型數據的內容、結構和缺陷。
Informatica Data Quality軟體執行清洗、解析、標准化和匹配流程並使得可視記分卡和儀表盤上的持續監測得以進行。與Informatica data Explorer類似,它特有基於角色的工具,業務部門和IT部門可以藉此得以協同工作。
Informatica Identity Resolution軟體能使各機構從60多個國家/地區以及各企業和第三方應用程序中搜尋和匹配一致數據。 Informatica數據質量解決方案為業務部門與IT部門間的協作提供基礎。其基於角色的工具特色設計使得業務分析師、數據管理員、IT開發人員和管理員能夠充分利用他們獨特的技能體系,並在流程中與所有相關人員溝通。
Informatica Analyst:適用於業務分析師和數據管理員。通過用語義術語表述數據,該款基於瀏覽器的工具使分析師和數據管理員能夠探查數據、創建和分析質量記分卡、管理異常記錄、開發和使用規則,以及與IT部門展開協作。
Informatica Developer: 適用於IT開發人員。這個基於Eclipse的開發環境允許開發人員發現、訪問、分析、探查和清晰處於任何位置的數據。開發人員可以為邏輯數據對象建模,將數據質量規則與復雜轉換邏輯合並,並在邏輯制定後,進行中游探查以驗證和調試邏輯。
Informatica Administrator: 適用於IT管理員。該工具為IT管理員帶來集中配置和管理的能力。管理員可以監測和管理安全性、用戶訪問、數據服務、網格和高可用性配置。

❿ 如何理解關於數據質量管理系統的整合與優化

1、信息系統數據質量——根據「垃圾進,垃圾出(garbagein,garbageout)」的原理,為了使信息系統建設取得預期效果,達到數據決策的目標,就要求信息系統提供的數據是可靠的,能夠准確反應客觀事實。如果數據質量得不到保證,即使數據分析工具再先進,模型再合理,演算法再優良,在充滿「垃圾」的數據環境中也只能得到毫無意義的垃圾信息,系統運行的結果、作出的分析就可能是錯誤的,甚至影響到後續決策的制定和實行。高質量的數據來源於數據收集,是數據設計以及數據分析、評估、修正等環節的強力保證。因此,信息系統數據質量管理尤為重要,這就需要建立一個有效的數據質量管理體系,盡可能全面發現數據存在的問題並分析原因,以推動數據質量的持續改進。作為信息系統的重要構成部分,數據質量問題是影響信息系統運行的關鍵因素,直接關繫到信息系統建設的成敗。
2、大數據環境下數據質量管理面臨的挑戰,因為大數據的信息系統更容易產生數據質量問題:
(1)在數據收集方面,大數據的多樣性決定了數據來源的復雜性。來源眾多、結構各異、大量不同的數據源之間存在著沖突、不一致或相互矛盾的現象。在數據獲取階段保證數據定義的完整性、數據質量的可靠性尤為必要。
(2)由於規模大,大數據獲取、存儲、傳輸和計算過程中可能產生更多錯誤。採用傳統數據的人工錯誤檢測與修復或簡單的程序匹配處理,遠遠處理不了大數據環境下的數據問題。
(3)由於高速性,數據的大量更新會導致過時數據迅速產生,也更易產生不一致數據。
(4)由於發展迅速,市場龐大,廠商眾多,直接產生的數據或者產品產生的數據標准不完善,使得數據有更大的可能產生不一致和沖突。
(5)由於數據生產源頭激增,產生的數據來源眾多,結構各異,以及系統更新升級加快和應用技術更新換代頻繁,使得不同的數據源之間、相同的數據源之間都可能存在著沖突、不一致或相互矛盾的現象,再加上數據收集與集成往往由多個團隊協作完成,期間增大了數據處理過程中產生問題數據的概率。
3、數據質量管理策略
為了改進和提高數據質量,必須從產生數據的源頭開始抓起,從管理入手,對數據運行的全過程進行監控,密切關注數據質量的發展和變化,深入研究數據質量問題所遵循的客觀規律,分析其產生的機理,探索科學有效的控制方法和改進措施;必須強化全面數據質量管理的思想觀念,把這一觀念滲透到數據生命周期的全過程。
結合大數據的參考框架及數據處理實際需求情況,數據質量管理可以從以下幾個方面著手,以多方協作改進,最終實現系統數據處於持續高效可用的狀態。
3.1建立數據質量評價體系
評估數據質量,可以從如下4個方面來考慮:①完整性:數據的記錄和信息是否完整,是否存在缺失情況;②一致性:數據的記錄是否符合規范,是否與前後及其它數據集保持統一;③准確性:數據中記錄的信息和數據是否准確,是否存在異常或者錯誤信息;④及時性:數據從產生到可以查看的時間間隔,也叫數據的延時時長。
有了評估方向,還需要使用可以量化、程序化識別的指標來衡量。通過量化指標,管理者才可能了解到當前數據質量,以及採取修正措施之後數據質量的改進程度。而對於海量數據,數據量大、處理環節多,獲取質量指標的工作不可能由人工或簡單的程序來完成,而需要程序化的制度和流程來保證,因此,指標的設計、採集與計算必須是程序可識別處理的。
完整性可以通過記錄數和唯一值來衡量。比如某類的交易數據,每天的交易量應該呈現出平穩的特點,平穩增加、平穩增長或保持一定范圍內的周期波動。如果記錄數量出現激增或激減,則需要追溯是在哪個環節出現了變動,最終定位是數據問題還是服務出現了問題。對於屬性的完整性考量,則可以通過空值佔比或無效值佔比來進行檢查。
一致性檢驗主要是檢驗數據和數據定義是否一致,因此可以通過合規記錄的比率來衡量。比如取值范圍是枚舉集合的數據,其實際值超出范圍之外的數據佔比,比如存在特定編碼規則的屬性值不符合其編碼規則的記錄佔比。還有一些存在邏輯關系的屬性之間的校驗,比如屬性A取某定值時,屬性B的值應該在某個特定的數據范圍內,都可以通過合規率來衡量。
准確性可能存在於個別記錄,也可能存在於整個數據集上。准確性和一致性的差別在於一致性關注合規,表示統一,而准確性關注數據錯誤。因此,同樣的數據表現,比如數據實際值不在定義的范圍內,如果定義的范圍准確,值完全沒有意義,那麼這屬於數據錯誤。但如果值是合理且有意義的,那麼可能是范圍定義不夠全面,則不能認定為數據錯誤,而是應該去補充修改數據定義。
通過建立數據質量評價體系,對整個流通鏈條上的數據質量進行量化指標輸出,後續進行問題數據的預警,使得問題一出現就可以暴露出來,便於進行問題的定位和解決,最終可以實現在哪個環節出現就在哪個環節解決,避免了將問題數據帶到後端及其質量問題擴大。
3.2落實數據質量信息的採集、分析與監控
有評價體系作為參照,還需要進行數據的採集、分析和監控,為數據質量提供全面可靠的信息。在數據流轉環節的關鍵點上設置採集點,採集數據質量監控信息,按照評價體系的指標要求,輸出分析報告。
3.3建立數據質量的持續改進工作機制
通過質量評價體系和質量數據採集系統,可以發現問題,之後還需要對發現的問題及時作出反應,追溯問題原因和形成機制,根據問題種類採取相應的改進措施,並持續跟蹤驗證改進之後的數據質量提升效果,形成正反饋,達到數據質量持續改良的效果。在源頭建立數據標准或接入標准,規范數據定義,在數據流轉過程中建立監控數據轉換質量的流程和體系,盡量做到在哪發現問題就在哪解決問題,不把問題數據帶到後端。
導致數據質量產生問題的原因很多。有研究表示,從問題的產生原因和來源,可以分為四大問題域:信息問題域、技術問題域、流程問題域和管理問題域。信息類問題是由於對數據本身的描述、理解及其度量標准偏差而造成的數據質量問題。產生這類數據質量問題的主要原因包括:數據標准不完善、元數據描述及理解錯誤、數據度量得不到保證和變化頻度不恰當等。技術類問題是指由於在數據處理流程中數據流轉的各技術環節異常或缺陷而造成的數據質量問題,它產生的直接原因是技術實現上的某種缺陷。技術類數據質量問題主要產生在數據創建、數據接入、數據抽取、數據轉換、數據裝載、數據使用和數據維護等環節。流程類問題是指由於數據流轉的流程設計不合理、人工操作流程不當造成的數據質量問題。所有涉及到數據流轉流程的各個環節都可能出現問題,比如接入新數據缺乏對數據檢核、元數據變更沒有考慮到歷史數據的處理、數據轉換不充分等各種流程設計錯誤、數據處理邏輯有缺陷等問題。管理類問題是指由於人員素質及管理機制方面的原因造成的數據質量問題。比如數據接入環節由於工期壓力而減少對數據檢核流程的執行和監控、缺乏反饋渠道及處理責任人、相關人員缺乏培訓和過程資產繼承隨之帶來的一系列問題等。
了解問題產生的原因和來源後,就可以對每一類問題建立起識別、反饋、處理、驗證的流程和制度。比如數據標准不完善導致的問題,這就需要有一整套數據標准問題識別、標准修正、現場實施和驗證的流程,確保問題的准確解決,不帶來新的問題。比如缺乏反饋渠道和處理責任人的問題,則屬於管理問題,則需要建立一套數據質量的反饋和響應機制,配合問題識別、問題處理、解決方案的現場實施與驗證、過程和積累等多個環節和流程,保證每一個問題都能得到有效解決並有效積累處理的過程和經驗,形成越來越完善的一個有機運作體。
當然,很多問題是相互影響的,單一地解決某一方面的問題可能暫時解決不了所發現的問題,但是當多方面的持續改進機制協同工作起來之後,互相影響,交錯前進,一點點改進,最終就會達到一個比較好的效果。
3.4完善元數據管理
數據質量的採集規則和檢查規則本身也是一種數據,在元數據中定義。元數據按照官方定義,是描述數據的數據。面對龐大的數據種類和結構,如果沒有元數據來描述這些數據,使用者無法准確地獲取所需信息。正是通過元數據,海量的數據才可以被理解、使用,才會產生價值。
元數據可以按照其用途分為3類:技術元數據、業務元數據和管理元數據。技術元數據:存儲關於信息倉庫系統技術細節的數據,適用於開發和管理數據而使用的數據。主要包括數據倉庫結構的描述,包括對數據結構、數據處理過程的特徵描述,存儲方式和位置覆蓋整個涉及數據的生產和消費環節。業務元數據:從業務角度描述了數據倉庫中的數據,提供了業務使用者和實際系統之間的語義層。主要包括業務術語、指標定義、業務規則等信息。
管理元數據:描述系統中管理領域相關概念、關系和規則的數據,主要包括人員角色、崗位職責、管理流程等信息。由此可見,本文提出的解決思路都需要元數據管理系統的支持。良好的元數據管理系統能為數據質量的採集、分析、監控、改進提供高效、有力的強大保障。同時,良好的數據質量管理系統也能促進元數據管理系統的持續改進,互相促進完善,共同為一個高質量和高效運轉的數據平台提供支持。
4結語
數據質量(DataQuality)管理貫穿數據生命周期的全過程,覆蓋質量評估、數據監控、數據探查、數據清洗、數據診斷等方面。數據源在不斷增多,數據量在不斷加大,新需求推動的新技術也不斷誕生,這些都對大數據下的數據質量管理帶來了困難和挑戰。因此,數據質量管理要形成完善的體系,建立持續改進的流程和良性機制,持續監控各系統數據質量波動情況及數據質量規則分析,適時升級數據質量監控的手段和方法,確保持續掌握系統數據質量狀況,最終達到數據質量的平穩狀態,為業務系統提供良好的數據保障。

閱讀全文

與數據質量管理方法如何設計稽核點相關的資料

熱點內容
蜂巢蜜的正確安裝方法 瀏覽:325
桂圓珍珠粉的食用方法 瀏覽:520
如何保護視力最有效的方法 瀏覽:342
避孕膜的使用方法視頻 瀏覽:976
解讀數學教材研討教學方法 瀏覽:633
妄想性障礙的治療方法 瀏覽:714
截屏的方法手機 瀏覽:303
麵粉做蛋糕發酵方法與步驟 瀏覽:332
華為手機的懸浮窗的便捷方法 瀏覽:694
八年級上冊昆蟲記教學方法 瀏覽:37
直播管理的方法和技巧 瀏覽:51
敏感度比較高的hpv檢測方法 瀏覽:124
太陽能路燈燈頭的連接方法 瀏覽:416
結石用什麼方法最快排出 瀏覽:562
中葯人參的的作用及食用方法 瀏覽:23
三洋使用方法 瀏覽:180
小米5開關機時間設置在哪裡設置方法 瀏覽:765
怎麼讓腿變快的方法 瀏覽:173
易企秀手機版使用方法怎麼保存 瀏覽:696
戒煙自由的最佳方法 瀏覽:440