A. 質量控制方法的常用的質量控制方法
1.分層法
分層法又名層別法,是將不同類型的數據按照同一性質或同一條件進行分類,從而找出其內在的統計規律的統計方法。常用分類方式有按操作人員分、按使用設備分、按工作時間分、按使用原材料分、按工藝方法分、按工作環境分等。這是分析影響產品質量原因及責任的一種基本方法,經常與統計調查表結合使用。
2.調查表
3.因果圖
上圖是對相片沖印效果不理想尋找其原因形成的因果圖。圖中可以看出,原因被歸為工人、機械、方法、材料、環境等六類,每一類下面又有不同的子原因。
4.排列圖
5.散布圖
散布圖又稱相關圖,在質量控制中它是用來顯示兩種質量數據之間關系的一種圖形。質量數據之間的關系多屬相關關系。,一般有三種類型:一是質量特性和影響因素之間的關系;二是質量特性和質量特性之間的關系;三是影響因素和影響因素之間的關系。
可以用Y和x分別表示質量特性值和影響因素,通過繪制散布圖,計算相關系數等,分析研究兩個變數之間是否存在相關關系,以及這種關系密切程度如何,進而對相關程度密切的兩個變數,通過對其中一個變數的觀察控制,去估計控制另一個變數的數值,以達到保證產品質量的目的。
6.直方圖
直方圖法,即頻數分布直方圖法,它是將收集到的質量數據進行分組整理,繪製成頻數分布直方圖,用以描述質量分布狀態的一種分析方法,所以又稱質量分布圖法。
直方圖是用橫坐標標注質量特性值,縱坐標標注頻數或頻率值,各組的頻數或頻率的大小用直方柱的高度表示的圖形。
1)直方圖的繪制步驟
直方圖繪制主要有以下幾個步驟:
(1)收集數據;
(2)找出數據中最大值L、最小值s和極差R;
(3)確定數據的大致分組數K。分組數可以按照經驗公式K=1+3.322lgn確定;
(4)確定分組組距h;
(5)計算各組上下限,首先確定第一組下限值,應注意使最小值s包含在第一組中,且使數據觀測值不落在上、下限上,然後依次加入組距h,便可得各組上下限值;
(6)計算各組中心值b_i、頻數f_i和頻率P_i,b_i=(第i組下限值+第i組上限值)/2,頻數f_i就是n個數據落入第i組的數據個數,而頻數P_i=f_i/n;
(7)繪制直方圖,以頻數(或頻率)為縱坐標,數據觀測值為橫坐標,以組距為底邊,數據觀測值落入各組的頻數f_i(或頻率P_i)為高,畫出一系列矩形,這樣就得到圖形為頻數(或頻率)直方圖。
2)直方圖的觀察與分析
從直方圖可以直觀地看出產品質量特性的分布形態,便於判斷過程是否出於控制狀態,以決定是否採取相應對策措施。直方圖從分布類型上來說,可以分為正常型和異常型。正常型是指整體形狀左右對稱的圖形,此時過程處於穩定(統計控制狀態),如下圖(a)所示。如果是異常型,就要分析原因,加以處理。常見的異常型主要有五種。
(1)雙峰型(下圖(b)):直方圖出現兩個峰。主要原因是觀測值來自兩個總體,兩個分布的數據}昆合在一起造成的,此時數據應加以分層。
(2)鋸齒型(下圖(C)):直方圖呈現凹凸不平現象。這是由於作直方圖時數據分組太多,測量儀器誤差過大或觀測數據不準確等造成的,此時應重新收集和整理數據。
(3)偏態型(下圖(d)):直方圖的頂峰偏向左側或右側。當公差下限受到限制(如單側形位公差)或某種加工習慣(如孔加工往往偏小)容易造成偏左;當公差上限受到限制或軸外圓加工時,直方圖呈現偏右形態。
(4)平台型(下圖(e)):直方圖頂峰不明顯,呈平頂型。主要原因是多個總體和分布混合在一起,或者生產過程中某種緩慢的傾向在起作用(如工具磨損、操作者疲勞等)。
7.控制圖
控制圖又稱管理圖。控制圖是對生產過程中產品質量狀況進行實時控制的統計工具,是質量控制中最重要的方法。控制圖可以說是直方圖的一種變形,其將直方圖順向轉90。反轉,再繪制中心線和上下控制限。中心線為樣本某統計量的均值,上下控制限分別為均值基礎上的正負三倍標准差。控制圖較直方圖最大的特點是引入了時間序列,通過觀察樣本點相關統計值是否在控制限內以判斷過程是否受控,通過觀察樣本點排列是否隨機從而及時發現異常。控制圖較直方圖在質量預防和過程式控制制能力方面大為改進。
控制圖的主要用途有:分析判斷生產過程是否穩定;及時發現生產中異常情況,預防不合格品產生;檢查生產設備和工藝裝備的精度是否滿足生產要求;對產品進行質量評定。
1)控制圖的原理
控制圖的設計是建立在以下的假設理論基礎上的,首先為正態性假設:假定質量特性值在生產過程中的波動服從正態分布;其次是遵從3σ准則:若質量特性值X服從正態分布N(μ,σ^2),根據正態分布概率性質,X的實際取值范圍在(μ一3σ,μ+3σ)之內。據此原理,若對X設計控制圖,則中心線CL=μ,上下控制界限分別為UCL=μ一3σ,LCL=μ+3σ;第三是小概率原理:小概率原理是指小概率的事件一般不會發生。當生產中不存在系統誤差時,產品質量特性(總體)服從正態分布,樣品值出現在均值加減3σ范圍內的概率為0.9973。根據相關統計定理,如果生產處於受控狀態,則認為樣品值一定落在此3σ范圍內,如果超出,則認為生產過程發生異常變化。
2)控制圖的基本種類
(1)按產品質量的特性分類,控制圖可分為計量值控制圖和計數值控制圖。
①計量值控制圖。用於產品質量特性為計量值情形,如長度、質量、時間、強度等連續變數。常用的計量值控制圖有:均值——極差控制圖(X—R圖);中位數——極差控制圖(X—R圖);單值——移動極差控制圖(X一Rs圖);均值——標准差控制圖(X—S圖)。
②計數值控制圖。用於產品質量特性為不合格品數、不合格品率、缺陷數等離散變數。常用的計數值控制圖有:不合格品率控制圖(P圖);不合格品數控制圖(Pn圖);單位缺陷數控制圖(U圖);缺陷數控制圖(C圖)。
(2)按控制圖的用途來分,可以分為分析用控制圖和控制用控制圖。
①分析用控制圖。分析用控制圖用於分析生產過程是否處於統計控制狀態。若經分析後,生產過程處於控制狀態且滿足質量要求,則把分析用控制圖轉化為控制用控制圖;若經分析後,生產過程處於非統計控制狀態,則應查找原因並加以消除。
②控制用控制圖。控制用控制圖由分析控制圖轉化而來,用於對生產過程進行連續監控。生產過程中,按照確定的抽樣間隔和樣本大小抽取樣本,在控制圖上描點,判斷是否處於受控狀態。
3)控制圖的製作
下面以均值一極差控制圖為例說明控制圖的製作與分析方法。均值一極差控制圖是圖(均值控制圖)和尺圖(極差控制圖)聯合使用的一種控制圖,前者用於判斷生產過程是否處於或保持在所要求的受控狀態,後者用於判斷生產過程的標准差是否處於或保持在所要求的受控狀態。在製作時首先收集數據並加以分組;其次計算每組的樣本均值和極差;據此計算總均值和極差平均;計算x圖R圖的控制界限;再次根據各樣本的均值和極差在控制圖上描點,繪制控制圖;最後分析生產過程是否處於控制狀態。
4)控制圖的分析
(1)控制圖的判別規則。生產過程正常情況下,質量特性值遵從正態分布且不會超過控制界限的。當控制圖中的數據點同時滿足下面規則,則認為生產過程處於統計控制狀態。
規則1:每一個數據點均落在控制界限內。
規則2:控制界限內數據點排列無異常情況。
(2)控制圖異常情況類型。點子排列沒有缺陷,是指點子的排列是隨機的,而沒有出現異常現象。這里的異常現象是指點子排列出現了「鏈」、「趨勢」、「周期性變動」、「接近控制界限」等情況。
①鏈:是指點子連續出現在中心線一側的現象。判斷規則:數據點連續7點或更多點在中心線同一側;連續11點中至少有10點在中心線同一側;連續14點中至少有12點在中心線同一側;連續17點中至少有14點在中心線同一側;連續20點中至少有16點在中心線同一側。
②趨勢或傾向:是指點子連續上升或連續下降的現象。判斷規則:連續7點或更多點單調上升或下降。
③周期性變動:即點子的排列顯示周期性變化的現象。
④接近控制界限:即太多的數據點接近中心線。
判斷規則:連續3點中至少有2點落在2σ與3σ界限之間;連續7點中至少有3點落在2σ與3σ界限之間。
B. 數據質量的控制方法
一個戰略性和系統性的方法能幫助企業正確研究企業的數據質量項目,業務部門與 IT 部門的相關人員將各自具有明確角色和責任,配備正確的技術和工具,以應對數據質量控制的挑戰。
Informatica 的六步法為幫助指導數據質量控制而設計,從初始的數據探查到持續監測以及持續進行的數據優化。業務部門與 IT 部門的數據使用者 — 業務分析師、數據管理員、IT 開發人員和管理員,能夠在六個步驟的每一步中協同使用 Informatica 數據質量解決方案;並在整個擴展型企業的所有數據領域和應用程序中嵌入數據質量控制。
步驟一:探查數據內容、結構和異常
第一步是探查數據以發現和評估數據的內容、結構和異常。通過探查,可以識別數據的優勢和弱勢,幫助企業確定項目計劃。一個關鍵目標就是明確指出數據錯誤和問題,例如將會給業務流程帶來威脅的不一致和冗餘。
步驟二:建立數據質量度量並明確目標
Informatica的數據質量解決方案為業務人員和IT人員提供了一個共同的平台建立和完善度量標准,用戶可以在數據質量記分卡中跟蹤度量標準的達標情況,並通過電子郵件發送URL來與相關人員隨時進行共享。
步驟三:設計和實施數據質量業務規則
明確企業的數據質量規則,即,可重復使用的業務邏輯,管理如何清洗數據和解析用於支持目標應用欄位和數據。業務部門和IT部門通過使用基於角色的功能,一同設計、測試、完善和實施數據質量業務規則,以達成最好的結果。
步驟四:將數據質量規則構建到數據集成過程中
Informatica Data Quality支持普遍深入的數據質量控制,使用戶可以從擴展型企業中的任何位置跨任何數量的應用程序、在一個基於服務的架構中作為一項服務來執行業務規則。數據質量服務由可集中管理、獨立於應用程序並可重復使用的業務規則構成,可用來執行探查、清洗、標准化、名稱與地址匹配以及監測。
步驟五:檢查異常並完善規則
在執行數據質量流程後,大多數記錄將會被清洗和標准化,並達到企業所設定的數據質量目標。然而,無可避免,仍會存在一些沒有被清洗的劣質數據,此時則需要完善控制數據質量的業務規則。Informatica Data Quality可捕獲和突顯數據質量異常和異常值,以便更進一步的探查和分析。
步驟六:對照目標,監測數據質量
數據質量控制不應為一次性的「邊設邊忘」活動。相對目標和在整個業務應用中持續監測和管理數據質量對於保持和改進高水平的數據質量性能而言是至關重要的。Informatica Data Quality包括一個記分卡工具,而儀錶板和報告選項則具備更為廣泛的功能,可進行動態報告以及以更具可視化的方式呈現。 上面介紹的Informatica六步法,該方法運用Informatica數據質量解決方案,提供公司所需要的各種數據質量管理能力,並確保其所有數據均是完整的、一致的、准確的、通用的。該解決方案包括幾個針對特定用途優化的組件:
Informatica Data Explorer運用基於角色的工具可促進業務部門與IT部門之間的協作,該數據探查軟體發現和分析任何來源中任何類型數據的內容、結構和缺陷。
Informatica Data Quality軟體執行清洗、解析、標准化和匹配流程並使得可視記分卡和儀表盤上的持續監測得以進行。與Informatica data Explorer類似,它特有基於角色的工具,業務部門和IT部門可以藉此得以協同工作。
Informatica Identity Resolution軟體能使各機構從60多個國家/地區以及各企業和第三方應用程序中搜尋和匹配一致數據。 Informatica數據質量解決方案為業務部門與IT部門間的協作提供基礎。其基於角色的工具特色設計使得業務分析師、數據管理員、IT開發人員和管理員能夠充分利用他們獨特的技能體系,並在流程中與所有相關人員溝通。
Informatica Analyst:適用於業務分析師和數據管理員。通過用語義術語表述數據,該款基於瀏覽器的工具使分析師和數據管理員能夠探查數據、創建和分析質量記分卡、管理異常記錄、開發和使用規則,以及與IT部門展開協作。
Informatica Developer: 適用於IT開發人員。這個基於Eclipse的開發環境允許開發人員發現、訪問、分析、探查和清晰處於任何位置的數據。開發人員可以為邏輯數據對象建模,將數據質量規則與復雜轉換邏輯合並,並在邏輯制定後,進行中游探查以驗證和調試邏輯。
Informatica Administrator: 適用於IT管理員。該工具為IT管理員帶來集中配置和管理的能力。管理員可以監測和管理安全性、用戶訪問、數據服務、網格和高可用性配置。
C. 在地理信息系統中空間數據質量控制中的地理相關法的基本實現策略是什麼
這么專業的問題。。。這。。。
地理相關法在GIS中是空間數據質量控制中的一個很常用的方法,是用空間數據自身的相關性來分析的,實現策略如下:
1. 建立一個知識庫,這個一定要和地理要素相關的;
2.
D. 空間數據質量控制的定義
空間數據的質量控制是針對空間數據的特點來進行的,空間數據的質量主要包括數據完整性 、數據邏輯一致性、數據位置精度、數據屬性精度、數據時間精度以及一些關於數據的說明 。空間數據的質量控制就是通過採用科學的方法,制定出空間數據的生產技術規程,並採取 一系列切實有效的方法在空間數據的生產過程中,針對空間數據質量的關鍵性問題予以精度 控制和錯誤改正,以保證空間數據的質量。
E. GIS數據質量的基本特點及常見的誤差原因
1.數據質量的基本概念
1.1准確性(Accuracy)
1.2精度(Precision)
1.3空間解析度(Spatial Resolution)
1.4比例尺(Scale)
1.5誤差(Error)
1.6不確定性(Uncertainty)
2.空間數據質量問題的來源
2.1空間現象自身存在的不穩定性
2.2空間現象的表達
2.3空間數據處理中的誤差
2.4空間數據使用中的誤差
表1:數據的主要誤差來源
數據處理過程 誤差來源
數據搜集
野外測量誤差:儀器誤差、記錄誤差
遙感數據誤差:輻射和幾何糾正誤差、信息提取誤差
地圖數據誤差:原始數據誤差、坐標轉換、制圖綜合及印刷
數據輸入
數字化誤差:儀器誤差、操作誤差
不同系統格式轉換誤差:柵格-矢量轉換、三角網-等值線轉換
數據存儲
數值精度不夠
空間精度不夠:每個格網點太大、地圖最小制圖單元太大
數據處理
分類間隔不合理
多層數據疊合引起的誤差傳播:插值誤差、多源數據綜合分析誤差
比例尺太小引起的誤差
數據輸出
輸出設備不精確引起的誤差
輸出的媒介不穩定造成的誤差
數據使用
對數據所包含的信息的誤解
對數據信息使用不當
3.空間數據質量控制
數據質量控制是個復雜的過程,要控制數據質量應從數據質量產生和擴散的所有過程和環節入手,分別用一定的方法減少誤差。空間數據質量控制常見的方法有:
3.1傳統的手工方法
質量控制的人工方法主要是將數字化數據與數據源進行比較,圖形部分的檢查包括目視方法、繪制到透明圖上與原圖疊加比較,屬性部分的檢查採用與原屬性逐個對比或其他比較方法。
3.2元數據方法
數據集的元數據中包含了大量的有關數據質量的信息,通過它可以檢查數據質量,同時元數據也記錄了數據處理過程中質量的變化,通過跟蹤元數據可以了解數據質量的狀況和變化。
3.3地理相關法
用空間數據的地理特徵要素自身的相關性來分析數據的質量。如從地表自然特徵的空間分布著手分析,山區河流應位於微地形的最低點,因此,疊加河流和等高線兩層數據時,如河流的位置不在等高線的外凸連線上,則說明兩層數據中必有一層數據有質量問題,如不能確定哪層數據有問題時,可以通過將它們分別與其它質量可靠的數據層疊加來進一步分析。因此,可以建立一個有關地理特徵要素相關關系的知識庫,以備各空間數據層之間地理特徵要素的相關分析之用。
F. 在地理信息系統中,數字化過程中誤差的來源及減小誤差的相關方法
數字化誤差來源:
1、表示坐標的計算機字長有限;
2、所有矢量輸出設備包括繪圖儀在內,盡管解析度比柵格設備高,但也有一定的步長;
3、矢量法輸入時曲線選取的點不可能太多;
4、人工輸圖中不可避免的定位誤差。
減小誤差的方法:
1、傳統的手工方法
質量控制的人工方法主要是將數字化數據與數據源進行比較,圖形部分的檢查包括目視方法、繪制到透明圖上與原圖疊加比較,屬性部分的檢查採用與原屬性逐個對比或其他比較方法,這要求操作人員具有較高水平的專業素質和一定的耐心。例如,在地圖數字化過程中,不可避免地會出現空間點位丟失或重復、線段過長或過短、區域標識點遺漏等問題。幾何數據錯誤如圖所示,其中(a)為區域標識點遺漏,(b)為線段過長。為此,可採用目視檢查邏輯檢驗和圖形檢驗等方法進行檢查與處理。
2、地理相關法
用空間數據的地理特徵要素自身的相關性來分析數據的質量。例如,從地表自然特徵的空間分布著手分析,山區河流應位於微地形的最低點,因此,疊加河流和等高線兩層數據時,若河流的位置不在等高線的外凸連線上,則說明兩層數據中必有一層數據質量有問題,如不能確定哪層數據有問題時,可以通過將它們分別與其他質量可靠的數據層疊加來進一步分析。因此,可以建立一個有關地理特徵要素相關關系的知識庫,以備各空間數據層之間地理特徵要素的相關分析之用。
3、元數據方法
元數據(Metadata)是描述數據的數據.在地理界,最典型的元數據便是各種地圖中的圖例內容,如圖名、比例尺、精度、生產者、出版單位和日期以及其它可以在地圖圖廓上找到的標識信息等。使用元數據的目的就是促進數據集的准確、高效利用,其內容包括對數據集中各數據項、數據來源、數據所有者及數據生產歷史等的說明;對數據質量的描述,如數據精度、數據的邏輯一致性、數據完整性、解析度、比例尺等;對數據處理信息的說明;對數據轉換方法的描述;對資料庫的更新、集成等的說明.通過使用元數據,可以檢查數據質量,跟蹤數據加工處理過程中精度質量的控制情況。例如在數據集成中,不同層次的元數據分別記錄了數據格式、空間坐標、數據類型、數據使用的軟硬體環境、數據使用規范、數據標准等信息,這些信息在數據集成的一系列處理中,如數據空間匹配、屬性一致化處理、數據在各平台之間的轉換使用等是必要的。這些信息能夠使系統有效地控制系統中的數據流。
4、以地圖數字化生成地圖數據過程為例說明空間數據質量控制的方法
地圖數字化是數據採集的重要手段。在地圖數字化過程中,為了控制數字化過程的質量,我們應從數據預處理、數字化設備及軟體的選用、地圖配准、數字化方式以及數據精度檢查等環節加以控制。
4.1數據預處理
首先對原始地圖、表格等進行整理、謄清或清繪。對於質量不高的數據源,如散亂的文檔和圖面不清晰的地圖,通過預處理工作不但可減少數字化誤差,還可提高數字化工作的效率。對於掃描數字化的原始圖形或圖像,還可採用分版掃描的方法,以減少數字化誤差,提高數字化的工作效率。為了減少圖紙在數字化過程中變形對數據精度的影響,保證紙質地圖存放環境有適宜的溫度和濕度,以減小地圖由於環境原因造成的變形,對質量不好的紙質地圖應將其復印到變形小於0.2‰的聚脂薄膜上。另外,對地圖上的封閉曲線或較長的線狀要素應將其進行分段,因為大多數GIS軟體能存貯的線狀實體頂點數有限,而且對線狀要素進行分段處理有利於減少數字化誤差,提高數字化精度。
4.2正確選擇數字化軟體設備
數字化儀的解析度和精度對數字化的質量有著決定性的影響。所以在選用數字化設備時應考慮其解析度和精度等參數不應低於設計的精度要求。一般數字化儀的解析度應達到0.025 mm,精度達到0.2 mm,掃描儀的解析度不低於0.083 mm。此外,軟體誤差也是影響矢量化精度的一個極重要因素。現在通常採用半自動矢量化方式,進行人機交互操作。因此在選擇軟體時不應僅僅關心自動化程度,還要特別注意是否具有以下功能:智能去斑、裁剪、扭曲校正、比例控制、水平校正、光柵編輯和互動式矢量化等。
4.3地圖定向
地圖數字化時數字化跟蹤頭採集地圖上點的坐標是數字化儀平面坐標,這種坐標定義取決於數字化儀的精度和配置,同時這些點還有其地理坐標意義。因此在數字化過程中,還需要將地圖上點的數字化儀平面坐標轉換為該點的實際地理坐標,也就是地圖定向。地圖定向實現了地圖的數學法則及設備坐標到實際地理坐標的轉換,同時它對控制數據採集的精度有重要的意義。實際操作中,在圖面上均勻選取適當的控制點,控制點的選取應不少於4個,標准分幅地圖在內圖廓四角上的4個圖廓點可作為控制點並標有相應的實際地理坐標,圖面上往往還有大地測量控制點可共選擇。當沒有現成可供選擇的控制點或需要增加控制點時,控制點的選取應盡可能選取在明顯地物點上,如線狀地物的交點,最好是正交的點上,並在圖幅上大致均勻分布,這樣有利於提高數字化的精度。例如在Super Map軟體的支持下,導入一幅泰安市政區圖進行矢量化。首先確定投影方式,這是保證數據精度的數學法則;其次進行地圖配准,選取圖廓的4個內角點或政區圖的4個方向的最遠點即四至點為控制點,系統稱之為參考點,其坐標為設備坐標,再輸入控制點實際坐標即大地坐標,確定後就實現了精確的地圖定向。
4.4數字化方式
跟蹤數字化一般有點方式和流方式。所謂點方式是指操作員每按鍵一次,獲取並向計算機發送一個點的坐標數據;流方式是指操作員按下按鍵,沿曲線移動游標時,能自動記錄經過點的坐標。實踐證明,點方式所產生的誤差要比流方式小得多,實際應用中多採用點方式。數字化時,地理要素圖形本身的寬度、密度、復雜程度對數字化結果的質量有顯著影響,如粗線比細線更易引起誤差,復雜曲線比平直線更易引起誤差,密集要素比稀疏要素易引起誤差。這就要求數字化操作者有熟練的技術和豐富的經驗,注意適當的採集密度,兼顧數據量的大小和精度。
4.5數字化的精度檢查
數字化的誤差可以被定義為數字化點、線對原地圖上點、線的偏差,其圖形部分的檢查可通過目視檢查:將數字化的結果列印到透明圖上與原圖疊加,屬性數據與原圖逐個對比。要求直線地物和獨立地物的誤差小於0.2 mm,曲線地物和水系一般小於0.3 mm,邊界模糊的要素小於0.5 mm;接邊誤差小於0.3 mm時可改動其中一個要素,使兩者吻合;當接邊差為0.3~0.6 mm時,兩要素各改一半;當誤差大於0.6 mm時,查找原因並記錄。其中,點狀地物主要檢查其中心位置是否與原圖重合;線狀地物主要檢查其中心線位置是否與原圖重合;面狀地物是由線劃圍成的空間填充而成,其精度的檢查主要是核對其邊界線是否與原地物的邊界線重合。
G. 空間資料庫質量
一、資料庫質量控制
資料庫建設工作進程及質量管理按照新疆地調院ISO9001—2000質量體系的規定運行的,嚴格按中國地質調查局全國地下水資源及其環境問題調查評價技術要求系列一、地下水資源調查數據錄入系統的要求進行資料整理及數據錄入。
為保證建庫數據的質量,項目組制定了一套完善的項目監理制度。建立由項目綜合研究組-項目負責人-項目組長「三級」負責制和與之對應的「三級」質量檢查制度。明確參加項目人員的工作職責,確保參加人員的基本專業素質,加強業務培訓工作。數據錄入過程中建立工作日誌制度,分階段進行數據檢查。以上檢查均進行自檢、互檢、質檢組檢查,檢查結果記錄下來,並進行修改,技術負責簽名認可。地調院信息中心派專家進行了全過程質量跟蹤監控,並組織了兩次全面檢查。最終由項目牽頭單位對空間資料庫建設完成的建庫數據進行檢查、驗收、匯總,完成空間資料庫的數據集成。
二、資料庫綜合質量分析
准噶爾盆地資料庫具體內容包括以原始資料為主體的屬性資料庫和圖形資料庫。屬性資料庫包括資料准備、數據採集、數據錄入及各類數據質量檢查工作。圖形資料庫主要為綜合成果圖完成的單圖層資料庫。最終由水文地質環境地信息應用系統將屬性數據與圖形數據集成。
(一)屬性資料庫質量分析
1.屬性卡片質量
屬性卡片包括本次工作實測資料及收集資料。首先對各類資料進行分類整理,並建立數據卡片。在工作中嚴格執行自檢互檢制度,並分別於2003年11月26日、2004年11月27~28日、2005年10月18日每年度野外工作結束由新疆地質調查院組織新疆地礦局第一水文隊、第二水文隊有關工作人員及專家於2004年11月27~28日對野外工作及收集資料進行檢查驗收,均評為優秀。野外工作全部結束,由中國地質科學院水文地質環境地質研究所及西安地調中心組織有關專家,於2005年10月25~28日對該項目進行了最終野外驗收,專家評分90分,評定為優秀級。項目組成員在每次野外驗收結束後均為對資料中存在的問題和不足之處進行了認真修改完善。
2.屬性資料庫數據質量
屬性數據錄入工作按中國地質調查局水文地質環境地質調查中心研究開發的《水文地質環境地質調查數據錄入系統》及其使用手冊的要求對各類資料進行數據錄入。為保證錄入數據的質量,項目組建立工作日誌,並開展自互檢及抽檢工作,對存在的問題及時修改。最終由新疆地調院組織專家對建庫數據進行最終檢查驗收,項目組對地調院專家組檢查提出的問題,進行了認真的檢查修改。在資料庫建設初步完成階段,由中國地質調查局水環部委託中國地質科學院水文地質環境地質研究所於2006年3月10~13日在石家莊對資料庫成果進行了檢查,檢查結束後,項目組於2006年3月17~4月30日對存在的問題進行了認真修改,對未完成的工作量進行補充。補充完成的數據有:野外照片數據表50張、野外調查路線表27張、農村灌溉用水及生活用水典型井核查表各15張,水源地綜合調查表50張、水源地開采量統計表50張、土地荒漠化野外調查表21張、土地鹽漬化野外調查表20張、物探測深成果匯總表689張、分區地下水開采量統計匯總表24張、古地磁測試綜合成果表517張,地質項目資料整理匯總表34張;並對補充資料進行了自互檢工作,對已錄入完成的鑽孔資料進行了補充。對所有掃描完成的插圖以JPG格式進行了導入,並對最終修改完善的數據進行了匯總。
(二)圖形資料庫質量分析
圖形數據按照全國地下水資源及其環境問題調查評價技術要(二)、(三)進行編制,並由新疆地質調查院組織專家對完成的各類圖件進行檢查驗收,驗收通過後的圖件按《地下水資源調查評價資料庫標准》進行圖紙掃描—分層矢量化—對照原圖校對(修改、補充)—誤差校正,採集校正控制點不低於13個點(由掃描圖紙變形帶來的誤差、設備誤差、採集誤差)—投影轉換—節點平差(設定容差)—線拓撲錯誤檢查—線轉弧段—拓撲重建—區拓撲錯誤檢查。
圖形屬性數據(內部屬性)的錄入是通過MAPGIS屬性庫管理系統輸入完成,完全遵照《地下水資源調查評價資料庫標准》的要求,按照不同圖層所反映的專業內容涉及的屬性欄位進行逐項填寫,此項工作由專題組統一組織項目組人員進行匯總完成。
H. 在收集數據時,對數據質量進行控制的主要辦法包括
摘要 (1)統計調查表法。是利用專門設計的統計表對質量數據進行收集、整理和粗略分析質量狀態的一種方法。
I. 數據質量控制
在資料庫建設過程中,數據的質量問題直接影響系統的運行和將來資料庫的實際應用。使用空間數據質量檢查軟體和人工抽檢作為數據質量數據控制體系的重要手段。
數據質量檢查主要是對空間、非空間資料庫的入庫數據進行質量檢查,其中空間數據主要是逐項檢查數據圖層(包括MapGIS 與Arc/Info格式)的圖形和屬性(胡大國,2004),檢查的重點是掃描原圖精度(圖廓點點位、圖廓邊邊長、圖廓對角線長度、坐標網線間距)、柵格圖像精度、數據採集精度、圖層套合精度、拓撲一致性(重點是公共界線的重合性,如斷層與地層、地層與侵入體等)、TIC點精度、命名的標准化程度、分層的正確性、數據的完整性、水系方向、圖元與屬性的對應性、屬性代碼的准確性等(表8-3、表8-4)。而非空間數據主要是檢查浙江省農業地質環境調查的設計、實施、成果等階段的文檔、圖片、多媒體資料是否齊全、正確。
表8-3 空間圖形控制
另外,還要對數據字典、元數據進行質量檢查,特別是用於系統的解釋資料庫內容的數據字典,檢查的重點是圖層名稱描述的正確性、數據項、代碼的完整性和正確性、非空間數據名稱描述的正確性等,最後所有的數據還要導入到AGEI S 系統中進行軟體調試和數據檢查。