『壹』 QA問句解析的七種方法及優化思路
在 《淺談智能搜索和對話式OS》 中,提到過,人機對話系統的常見場景有三種,分別為: 閑聊型(Chatbot) 、 問答型(QA) 、 任務型(VPA) 。本篇文章所關注的解析方式主要適用於QA系統中的封閉域問答,也即: 將用戶問句解析為庫中存在的標准問句 。
這里講的七種方法均為我個人閱讀文獻後歸納整理而來,並不都是成熟穩定可以商業化的做法,目的只是提出思路以作參考。
基於規則的方法通常在缺乏訓練數據的情況下採用,由於與後面的基於統計的方法區別較大,所以記為第零種方法。
基於規則的解析系統通常由兩部分構成:一個是『規則庫』,解析規則通常為 CFG 上下文無關文法;另一個是『同義詞庫』,記錄了一些標准詞的常見同義詞。
整個解析就是一個上下文無關文法歸約的過程。首先進行自動分詞,接著將用戶問句中的詞依照『同義詞庫』歸約為標准詞,然後再將詞歸約後的問句與『規則庫』中的解析規則比對,一旦比對成功,即該條用戶問句被成功歸約到該條解析規則所對應的標准問句上。
舉個例子,同義詞庫中有這樣兩條記錄:『失敗:不上去、不進去、不成功、錯誤』『登錄:登陸、登錄』,規則庫中有這樣一條規則:『賬號登錄失敗:[賬號][登錄][失敗]』。
有一條用戶問句是這樣的『我賬號怎麼登陸不上去了』。首先假定分詞正確,分詞結果為『我|賬號|怎麼|登陸|不上去|了』;之後進行詞歸約,歸約結果為『我賬號怎麼登錄失敗了』;接著與規則『賬號登錄失敗:[賬號][登錄][失敗]』比對,發現比對成功。該條用戶問句被成功歸約為標准問句『賬號登錄失敗』,我們將系統中『賬號登錄失敗』所對應的標准答案提供給用戶,完成交互流程。
這樣做在一定程度上能夠解決問題,但缺點也特別嚴重。首先『規則庫』與『同義詞庫』需要人工構建,這需要巨大且長期的人力資源投入。因為語言的表達方式理論上是無限的,而能想到的規則和同義詞總是有限的;且隨著語言的發展,或是業務的變動,整個規則庫和同義詞庫的維護也需要持續的人力資源投入。
其次,編寫規則庫需要豐富的經驗,對於人員素質的要求極高。因為解析規則的抽象程度相當高,在這樣高的抽象程度上,即便編寫者具有較豐富的經驗(如果沒經驗會更糟),不同解析規則之間的沖突也是不可避免的,也即同一條用戶問句會與多條標准問句的解析規則比對成功,這種情況下的標准問句選擇/評分問題,又需要另一套系統來解決。
換個角度,我們可以將依照用戶問句找到標准問句的過程看做是輸入 Query 得到 Document 的搜索過程。
我們可以嘗試採用傳統搜索引擎中使用的檢索模型來進行用戶問句解析。 《淺談搜索引擎基礎(上)》 中提到,BM25 是目前效果最好的檢索模型,我們就以 BM25 模型為例來分析。
BM25 模型的計算公式如下:
BM25 模型計算公式融合了 4 個考慮因素: IDF 因子 、 文檔詞頻 、 文檔長度因子 和 查詢詞頻 ,並利用 3 個自由調節因子(k1、k2 和 b)對各種因子的權值進行調整組合。
其中,N 代表文檔總數,n 代表出現對應單詞的文檔個數,f 指文檔中出現對應單詞的詞頻,qf 是查詢語句中對應單詞的詞頻,dl 是文檔長度。
利用 BM25 模型可以有三種思路,分別把標准問句、標准問句及標准答案、歷史中曾經正確匹配過該標准問句的用戶問句集作為 Document,利用公式計算其與用戶問句的相似度,然後利用相似度進行排序,取出評分最高的標准問句作為解析結果。
對於這個思路我沒有做過實驗,不過我推測,這種方法雖然節省了大量的人力,但在這種封閉域的 QA 系統中,其表現應當是不如上一種基於規則的方法,基於檢索模型的方法在開放域中的表現會更好。
此外,基於傳統檢索模型的方法會存在一個固有缺陷,就是檢索模型只能處理 Query 與 Document 有重合詞的情況,傳統檢索模型無法處理詞語的語義相關性。在上一種方法中,通過人工搭建的同義詞庫,一定程度上解決了語義相關性的問題。
上文提到,完全基於檢索模型的方法無法處理詞語的語義相關性。
為了在一定程度上解決這個問題,我們可以利用 LDA/SMT 等方法通過語料挖掘詞之間的同義關系,為每個詞自動構建一個同義度高於閾值且大小合適的同義詞表。在代入檢索模型公式進行計算的過程中,若文檔中發現所查找關鍵詞的同義詞,可以依據同義程度乘以一定權重後納入到關鍵詞的詞頻計算之中。
《淺談智能搜索和對話式OS》 中有對 LDA/SMT 的介紹。
簡單的說,LDA 可以合理的將單詞歸類到不同的隱含主題之中;並且通過計算兩篇文章主題向量 θ 的 KL 散度(相對熵),可以得到兩篇文章的相似性。SMT 模型出自微軟之手,目的即是將翻譯模型引入傳統檢索模型,提高檢索模型對語義相關詞對的處理能力,該模型也曾被網路採用過以提高搜索引擎返回結果的質量。
word embedding 將詞表示為 Distributed Representation,也即低維向量空間中的一個詞向量,Distributed Representation 下的詞可以利用餘弦距離來計算詞之間語義的相關關系。與 one-hot Representation 相對應,one-hot Representation 下的詞向量的維數與單詞表的維數相同,不同詞的詞向量之間均正交。傳統的詞集模型(SOW)和詞袋模型(BOW)採用的即是 one-hot Representation。
我們可以採用深度學習的方法來得到詞 Distributed Representation 的詞向量。比如訓練一個普通的神經概率語言模型,就可以得到詞的詞向量,或者參考 word2vec 中的方式,訓練 CBOW 或者 Skip-gram 模型。神經概率語言模型、CBOW 以及 Skip-gram 的介紹在 《淺談智能搜索和對話式OS》 均有提及。
藉助網路這張圖來講,利用 DNN 建模的思路如下:
我們需要使用一批 用戶問句-標准問句對 的正例和反例作為訓練語料,藉助上面的方式,同時將正例和反例進行 word embedding 後送入 DNN 中,並採用 Pairwise ranking loss 的方式來建模正例和反例之間的語義差別。
上一種基於 DNN 的方法,在一定程度上已經可以解決詞的語義相關性的問題,但對句子中的短距離依賴關系並沒有做恰當的處理,比如無法區分『甲到乙』和『乙到甲』。
根據網路的評測結果,CNN 在處理短距離依賴關繫上擁有更好的表現。
該圖出自李航博士 Convolutional Neural Network Architectures for Matching Natural Language Sentences 中的 ARC-1:
其做法的基本思路是:將問句中的每個詞,都做 word embedding,得到每個詞所對應的固定長度的詞向量,我們將問句表示成一個二維矩陣,每一行代表問句中相應詞所對應的詞向量。將這個二維矩陣進行多次卷積池化(卷積核的寬度與詞向量維數相同,高度多為 2-5),最後得到一個一維特徵向量,我們用 CNN 同時處理用戶問句和標准問句,得到用戶問句和庫中標准問句所對應的特徵向量。之後將這兩個向量拼接起來送入多層感知機,由它來計算兩個問句之間的匹配程度。
另外,有人指出,直接將兩個特徵向量拼接起來送入 MLP 會丟失邊界信息,所以我們同時將特徵向量 a、特徵向量 b 和 aTb 同時送入 MLP 來計算相似度。
ARC-2 結構同樣出自李航博士的上述論文:
ARC-2 相較於 ARC-1 的改進在於,ARC-2 嘗試讓兩個句子在得到像 ARC-1 結果那樣的高層抽象表示之前就進行相互作用,不再先分別通過 CNN 結構得到各自高層抽象表示。
在 ARC-1 模型中,一張 feature map 僅僅是一個列向量,或者說是一個一維矩陣,若干個列向量並在一起形成了 ARC-1 示意圖中的模樣(二維),而在 ARC-2 中,一張 feature map 成為了一個二維矩陣,若干個二維矩陣疊在一起形成了 ARC-2 示意圖中的模樣(三維)。
再之後的卷積、池化過程就與 CV 中 CNN 的卷積、池化過程類似了。與上一種方法類似的,在進行 1D convolution 時,涉及到兩個詞向量的連接,同樣可以採用之前提到的做法來避免邊界信息的丟失。
同樣有人提出,在 ARC-2 結構中,直接採用傳統的 word embedding 方法得到的詞向量組成句子作為輸入並不是最佳方案,最佳方案是採用已經過了 LSTM 的 hidden state。
我們可以採用 LSTM 結構訓練一個 RNN 語言模型,如下圖(以普通 RNN 為例):
從圖中可以發現,當輸出為『e』時,hidden layer 向量中第三分量最大,而輸出為『l』時,第一分量最大,輸出『o』時,第二分量最大。我們可以將 RNN 的 hidden state 當做 Distributed Representation 的詞向量來使用,將其作為 CNN(ARC-2)的輸入,經測試可以得到更好的結果。
一個可信度高的分詞結果是進行後續解析步驟的基本前提。
在 《淺談自然語言處理基礎(中)》 中,我介紹了一些經典的分詞方法,不過都是些較早的研究成果。CRF方法是目前公認的效果最好的分詞演算法。
CRF 方法的思想非常直接,就是將分詞問題看作一個序列標注問題,為句子中的每個字標注詞位:
CRF 分詞的過程就是對詞位標注後,將 B 和 E 之間的字,以及 S 單字構成分詞。網上有很多公開的基於 CRF 的分詞工具。
至少存在四個角度可以在已有模型的基礎上進一步提高解析質量,包括:問句歸一化、用戶狀態、強化學習、多輪對話。
問句歸一化的目的是對用戶的輸入具有較好的容錯性。
簡單的一些比如:簡繁體歸一化、全形半形歸一化、標點符號處理和大小寫歸一化。復雜一些的比如漢語錯別字的糾正。錯別字自動糾正技術的應用非常廣泛,而且在提高系統用戶體驗上能夠發揮很大的作用,可以說性價比極高。
錯別字糾正通常的做法是訓練雜訊信道模型。
我們可以對用戶狀態提取特徵,在訓練和解析時將其作為附加信息一並作為神經網路的輸入。
可以被考慮的用戶狀態至少包含:
其次可以採用強化學習的方法,通過設計合理的獎賞機制,讓解析系統在與環境互動的過程中自主進行策略更新。
強化學習與普通的監督學習方法相比存在兩個明顯的優點:一個是強化學習策略更新所需要的數據主要來源於與環境的交互/采樣,而不是昂貴的人工標記數據;另一個是強化學習所產生的策略是根據獎賞機制自主迭代更新的,會有一些創新的做法,而不僅僅是模仿人類提供的『標准』做法。
QA 問句解析中雖然不像游戲一樣擁有『策略創新玩法』這樣的概念,但仍然可以在解析優化中幫助大量節省數據的人工標記開銷。
應用強化學習方法的核心問題之一就是獎賞機制的設計,在 QA 的場景下設計獎賞機制,至少可以考慮以下幾個角度:
多輪對話技術可以進一步提高與用戶對話的連貫性。
我傾向於將多輪對話劃分為『封閉域』和『開放域』兩個場景,不同場景的實現思路也應該不同。
封閉域場景多輪對話的特點是:系統能解決的問題是一個有限集,多輪對話的目的是將用戶引導到我們可以解決的問題上。
而開放域場景多輪對話的特點是:系統需要解決的問題是一個無限集,多輪對話的目的是依照上下文更准確的理解用戶的需求。
在這樣的指導思想下,封閉域多輪對話的核心思路應該是『填槽』,而開放域多輪對話的核心思路是『上下文替換』和『主體補全』。
《淺談智能搜索和對話式OS》 中介紹了網路利用 slot filling 技術來做 NLU,並利用『上下文替換』和『主體補全』來提高其 DuerOS 的對話能力的。
而更進一步的,填槽、上下文替換和主體補全的技術基礎都是『序列標注』,這里給出網路的兩張 PPT:
根據網路的 PPT,採用雙向 LSTM + CRF 做序列標注,是一個商業上可行的方法。
選擇合適的人工接入時機同樣是提高 QA 系統整體表現的方法之一,其核心問題在於平衡用戶體驗與投入成本。人工接入的越早,用戶體驗越好,但成本也越高。
這里簡單提供螞蟻金服小螞答的做法:若系統連續提供給用戶三次相同的回答,顯示人工接入按鈕;若用戶連續詢問兩次客服類問題(比如『我要人工』、『你們客服電話多少』),顯示人工接入按鈕。
QA 系統的另一個重要組成部分是答案庫。
答案錄入的優化至少可以從三個角度來思考:
答案形式的多樣性非常容易理解,比如小螞答就支持包括文本、鏈接、圖片、視頻在內的多種答案形式。
個性化問題在上文解析優化中已有涉及(考慮用戶狀態的解析優化),上文的分析思路同樣可以應用於答案錄入,我們可以對不同注冊時長、付費金額不同、進入路徑不同等等的用戶提供不同的個性化答案。
答案對用戶的幫助看起來比較抽象,但也很容易理解。通俗的,我個人以『地圖級』、『導航級』、『專車級』來為 QA 系統的答案進行分級:
依照文章最初的人機對話系統場景分類,提供『專車級』答案的 QA 系統,可以被稱為 VPA 了。
對於答案庫的優化,在答案完備錄入(答案形式足夠豐富、針對不同用戶提供個性化的回答)的前提下,至少存在兩個優化點:
上文解析優化中強化學習方法獎賞機制的設計思路也可以被用來發現答案庫中存在的問題,因為大多數時候我們還很難明確的區分用戶的負面反饋是針對解析系統還是答案本身。
除了從用戶負面反饋中發現問題,針對上面的兩個優化點,我們還應該有一些預防機制來提前避免這些問題的發生。
比如第一點『答案庫中標准答案存在錯誤』,如果不是錄入人員的素質問題,最大的可能性就來源於答案的時效性,也即我們提供給了用戶過期的答案。針對這個問題,我們可以在錄入答案時特別添加『臨時』標簽,以標明該答案具有較強的時效性,需要及時更新。
而針對第二點『答案庫中缺失某些問題的答案』,最大的可能性來源於突發事件以及業務的變動。比如系統服務宕機、系統上了新版本或者組織了一些運營活動,我們都應該針對這些可能引發用戶疑惑的變動,提前准備一些 FAQ 並錄入到答案庫之中。
此外,當我們錄入新問題及其標准答案的時候,需要注意新錄入問題與原解析系統的適配性,以避免出現新錄入的問題較難被解析系統解析到的情況。可採用的方法比如在錄入新問題的同時,主動錄入一些不同的問法作為初始訓練語料(網易七魚雲客服的做法)。
『貳』 QA七大手法是哪些
您要問的是不是品管七大手法?好像應該是QC七大手法,不是QA七大手法。
品管七大手法是常用的統計管理方法,又稱為初級統計管理方法。它主要包括控制因果圖、相關圖、排列圖、統計分析表、資料分層法、散布圖等所謂的QC七工具其實,品質管制的方法可以分為兩大類:一是建立在全面品質管制思想之上的品質管制;二是以數理統計方法為基礎的質量控制。組織性的品質管制方法是指從組織結構,業務流程和人員工作方式的角度的方法,它建立在全員品質管制的思想之上,主要內容有制定質量方針,建立體系,開展QC小組活動,各部門質量責任的分擔,進行質量診斷等。
統計質量控制是美國的貝爾電話實驗所的休哈特(W.A.Shewhart)博士在1924出的控制圖為起點,半個多世紀以來有了很大發展,現在這些方法可大致分為幾類。
(1) 初級統計管理方法:又稱為常用的統計管理方法。它主要包括控制圖相關圖、排列圖、統計分析表、資料分層法、散布圖等所謂的QC七工具(或叫品管七大手法)。運用這些工具,可以從經常變化的生產過程中,系統地收集與產品各種資料,並用統計方法對資料進行整理,加工和分析,進而畫出各種圖表資料指標,從中找出質量變化的規律,實現對質量的控制。日本著名的品質川馨曾說過:企業內95%的品質管制問題,可通過企業上上下下全體人員活用而得到解決。全面品質管制的推行,也離不開企業各級、各部門人員對這些工具的掌握與靈活應用。
(2) 中級統計管理方法:包括抽樣調查方法、抽樣檢驗方法、功能檢查畫法、方法研究等。這些方法不一定要企業全體人員都掌握,主要是有關技質管制部門的人使用。
(3) 高級統計管理方法:包括高級實驗計畫法、多變數解析法。這些方法主要用於雜的工程解析和質量解析,而且要藉助於電腦手段,通常只是專業人員使用這就概要介紹常用的初級統計品質管制七大手法即所謂的「QC七工具」。
(一) 統計分析表
統計分析表是利用統計表對資料進行整理和初步分析原因的一種工具,其格式可多樣,這種方法雖然較單,但實用有效。
(二) 數據分層法
資料分層法就是性質相同的,在同一條件下收集的資料歸納在一起,以便進析。因為在實際生產中,影響質量變動的因素很多如果不把這些困素區別開出變化的規律。資料分層可根據實際情況按多種方式進行。例如,按不同時間次進行分層,按使用設備的種類進行分層,按原材料的進料時間,原材料成分層,按檢查手段,使用條件進行分層,按不同缺陷項目進行分層,等等。資常與上述的統計分析表結合使用。資料分層法的應用,主要是一種系統概念,即在於要想把相當復雜的資料進得懂得如何把這些資料加以有系統有目的加以分門別類的歸納及統計。科學管理強調的是以管理的技法來弭補以往靠經驗靠視覺判斷的管理的不足技法,除了建立正確的理念外,更需要有資料的運用,才有辦法進行工作解析及採取正確的措施。如何建立原始的資料及將這些資料依據所需要的目的進行集計,也是諸多品管手法的最基礎工作。
舉個例子:我國航空市場近幾年隨著開放而競爭日趨激烈,航空公司為了爭加強各種措施外,也在服務品質方面下功夫。我們也可以經常在航機上看到客的調查。此調查是通過調查表來進行的。調查表的設計通常分為地面的服務上的服務品質。地面又分為訂票,候機;航機又分為空服態度,餐飲,衛生等些調查,將這些資料予以集計,就可得到從何處加強服務品質了。
(三)排列圖(柏拉圖)
排列圖又稱為柏拉圖,由此圖的發明者19世紀義大利經濟學家柏拉圖(Pareto)而得名。柏拉圖最早用排列圖分析社會財富分布的狀況,他發現當時義大利在20%的人手,後來人們發現很多場合都服從這一規律,於是稱之為Pareto。美國品質管制專家朱蘭博士運用柏拉圖的統計圖加以延伸將其用於品質管制分析和尋找影響質量主原因素的一種工具,其形式用雙直角坐標圖,左邊縱數(如件數金額等),右邊縱坐標表示頻率(如百分比表示)。分折線表示累橫坐標表示影響質量的各項因素,按影響程度的大小(即出現頻數多少)從列。通過對排列圖的觀察分析可抓住影響質量的主要因素。這種方法實際上不管制中,在其他許多管理工作中,例如在庫存管理中,都有是十分有用的。在品質管制過程中,要解決的問題很多,但往往不知從哪裡著手,但事實上大部分的問題,只要能找出幾個影響較大的原因,並加以處置及控制,就可解決問題的。柏拉圖是根據歸集的資料,以不良原因,不良狀況發生的現象,有系統地加以識別分類,計算出各專案別所產生的資料(如不良率,損失金額)及所佔的比例,按照大小順序排列,再加上累積值的圖形。在工廠或辦公室,把低效率,缺損,製品不良等損失按其原因別或現象損失金額的80%以上的專案加以追究處理,這就是所謂的柏拉圖分析。柏拉圖的使用要以層別法的專案別(現象別)為前提,依經順位調整過後的畫製成柏拉圖。
柏拉圖分析的步驟;
(1) 將要處置的事,以狀況(現象)或原因加以層別。
(2) 縱軸雖可以表示件數,但最好以金額表示比較強烈。
(3) 決定搜集資料的期間,自何時至何時,作為柏拉圖資料的依據,期限期。
(4) 各專案依照合半之大小順位左至右排列在橫軸上。
(5) 繪上柱狀圖。
(6) 連接累積曲線。
柏拉圖法(重點管製法),提供了我們在沒法面面俱到的狀況下,去抓重要的事情鍵的事情,而這些重要的事情又不是靠直覺判斷得來的,而是有資料依據的來加強表示。也就是層別法提供了統計的基礎,柏拉圖法則可幫助我們抓住重要事情。
(四)因果分析圖
因果分析圖是以結果作為特性,以原因作為因素,在它們之間用箭頭聯系表示因果關系。因果分析圖是一種充分發動員工動腦筋,查原因,集思廣益的好辦法,於工作小組中實行質量的民主管理。當出現了某種質量問題,未搞清楚原因問題。發動大家尋找可能的原因,使每個人都暢所欲言,把所有可能的原因都列出稱所謂因果分析圖,就是將造成某項結果的眾多原因,以系統的方式圖解,即以結果(特性)與原因(因素)之間的關系。其形狀像魚骨,又稱魚骨圖。某項結果之形成,必定有原因,應設法利用圖解法找出其因。首先提出了這個方法的是日本品管權威石川馨博士,所以特性原因圖又稱[石川圖]。因果分析圖,可使用在一般管理及工作改善的各種階段,特別是樹立意識的初期,易於使問題的原因明朗化設計步驟解決問題。
(1) 果分析圖使用步驟
步驟1:集合有關人員。召集與此問題相關的,有經驗的人員,人數最好4-10人。
步驟2:掛一張大白紙,准備2-3支色筆。
步驟3:由集合的人員就影響問題的原因發言,發言內容記入圖上,中途不可批問。(腦力激盪法)
步驟4:時間大約1個小時,搜集20-30個原因則可結束。
步驟5:就所搜集的原因,何者影響最大,再由大輪流發言,經大家磋商後大予圈上紅色圈。
步驟6:與步驟5一樣,針對已圈上一個紅圈的,若認為最重要的可以再圈上圈。
步驟7:重新畫一張原因圖,未上圈的予於去除,圈數愈多的列為最優先處。因果分析圖提供的是抓取重要原因的工具,所以參加的人員應包含對此項工作具有者,才易秦效。
(2)因果分析圖與柏拉圖之使用
建立柏拉圖須先以層別建立要求目的之統計表。建立柏拉圖之目的,在於掌握影
較大的重要少數項目。再利用特性原因圖針對這些項目形成的原因逐予於探
改善對策。所以因果分析圖可以單獨使用,也可連接柏拉圖使用。
(3) 因果分析圖再分析
要對問題形成的原因追根究底,才能從根本上解決問題。形成問題之主要原因找出後,再以實驗設計的方法進行實驗分析,擬具體實驗方法,找出最佳工作方法或許能得以徹底解決,這是解決問題,更是預防問題。任何一個人,任何一個企業均有它追求的目標,但在追求目標的過程中,總多有形與無形的障礙,而這些障礙是什麽,這些障礙何於形成,這些障礙如何破解等,就是原因分析圖法主要的概念。一個管理人員,在他的管理工作范圍內所追求的目標,假如加以具體的歸納知從項目來說不是很多。然而就每個追求的項目來說,都有會有影響其達成目的的主要原因及次要原因,這些原因就是阻礙你達成工作的變數。如何將追求的項目一一地羅列出來,並將影響每個項目達成的主要原因及次要原因也整理出來,並使用因果分析圖來表示,並針對這些原因有計劃地加以強化,將會使工作更加得心應手。同樣地,有了這些原因分析圖,即使發生問題,在解析問題的過程中,也能更快速可靠。
(五)直方圖
直方圖又稱柱狀圖,它是表示資料變化情況的一種主要工具。用直方圖可以的資料,解析出規則性,比較直觀地看出產品質量特性的分布狀態,對於資分布狀況一目瞭然,便於判斷其總體質量分布情況。在製作直方圖時,牽涉科學的概念,首先要對資料進行分組,因此如何合理分組是其中的關鍵問題。按組距相等的原則進行的兩個關鍵數位是分組數和組距。
(六)散布圖
散布圖又叫相關圖,它是將兩個可能相關的變數資料用點畫在座標圖上,用成對的資料之間是否有相關性。這種成對的資料或許是特性一原因,特性一特性一原因的關系。通過對其觀察分析,來判斷兩個變數之間的相關關系。這種生產中也是常見的,例如熱處理時淬火溫度與工件硬度之間的關系,某種元素在材料中的含量與材料強度的關系等。這種關系雖然存在,但又難以用精確的公式或函示,在這種情況下用相關圖來分析就是很方便的。假定有一對變數x 和y,x影響因素,y 表示某一質量特徵值,通過實驗或收集到的x 和y 的資料,上用點表示出來,根據點的分布特點,就可以判斷x和y 的相關情況。在我們的生活及工作中,許多現象和原因,有些呈規則的關連,有些呈不規則連。我們要了解它,就可藉助散布圖統計手法來判斷它們之間的相關關系。
(七)控制圖
控制圖又稱為管制圖。由美國的貝爾電話實驗所的休哈特(W.A.Shewhart)博士在首先提出管制圖使用後,管制圖就一直成為科學管理的一個重要工具,特別方面成了一個不可或缺的管理工具。它是一種有控制界限的圖,用來區分引起的原因是偶然的還是系統的,可以提供系統原因存在的資訊,從而判斷生產過於受控狀態。控制圖按其用途可分為兩類,一類是供分析用的控制圖,用控制生產過程中有關質量特性值的變化情況,看工序是否處於穩定受控狀;再一類的控制圖,主要用於發現生產過程是否出現了異常情況,以預防產生不合格品。統計管理方法是進行質量控制的有效工具,但在應用中必須注意以下幾個問題,否則就得不到應有的效果。
這些問題主要是:
1 )數據有誤。資料有誤可能是成的,一是人為的使用有誤資料,二是由於未真正掌握統計方法;2 )資料的採集方法不正確。如果抽樣方法本身有誤則其後的分析方法再正確也是無用的;
3 )記錄抄寫有誤;
4 )異常值的處理。通常在生產過程取得的資料中總是含有一些的,它們會導致分析結果有誤。
以上概要介紹了七種常用初級統計品質管制七大手法即所謂的「QC七工具」,集中體現了品質管制的「以事實和資料為基礎進行判斷和管理」的特點。最後要說明的是,這些方法看起來都比較簡單,但能夠在實際工作中正確靈活地應用並不是簡單的事。