『壹』 統計概率樣本偏差relevant/irrelevant features in sample selection bias
這是feature selection bias,可以通過random decision tree來優化
『貳』 簡述病因研究中的偏倚的種類及控制措施有哪些
定義及種類:
偏倚是在研究中(從設計到執行的各環節)的系統誤差及解釋結果的片面性而造成的,使研究結果與其真值出現了某些差值。因為它是由系統誤差所造成,加大樣本並不能使之減少。一旦造成事實,則無法消除其影響。因此,必須認識偏倚,從設計起直到整個研究過程均要加以控制。病因研究中的偏倚有10種以上,它們可以歸納為選擇性偏倚、信息(測量、觀察)性偏倚及混雜(混淆)性偏倚。
(一)選擇性偏倚(selection bias)
在選擇研究對象時,試驗組和對照組的設立(納入標准)不正確,使得這兩組人在開始時即存在處理因素以外的重大差異,從而產生偏倚。常見的主要有:
1.就診機會偏倚(入院率偏倚,admissionrate bias)由於疾病嚴重程度不同、就醫條件不同、人群對某一疾病的了解和認識程度不同等原因而使患不同種類疾病的人(或有某種特性者)的住院率不同。從醫院選取對照時,如果沒有注意到此點,則可引起偏倚。此種偏倚首先由Berkson發現並記述,因此,將此種偏倚又稱為Berkson偏倚或Berkson謬誤(fallacy)。
2.現患病例及新發病例偏倚(prevalence-incidencebias,又叫Neyman bias)此種偏倚易出現在病程較短的嚴重致死性疾病,如心肌梗死,部分病例在送到醫院前已死亡,如果只以存活的現患病例為對象,研究某因素的作用,必然產生偏倚。這些死亡病例通常未計入心肌梗死總發病人數中,以至於所報道的患病數少於實際的發病數。又如,在病例對照研究中有意或無意排除(或加入)某些病例,也可出現偏倚,如研究吸煙與肺癌的關系時,對照組包括了慢性支氣管炎和冠心病,由於此二病均與吸煙有關,所以吸煙與肺癌的OR減低,甚至於看不出吸煙作為肺癌的病因作用。患病後改變生活習慣也可以使用病例對照方法探討病因出現偏倚,如患肺癌後戒煙,患高血壓後將飲食口味調淡、不吃動物脂肪(肥肉)、適當增加體力活動等等,都可在病例對照研究中使這些因素的病因作用被抵消。又如,乳腺癌與利血平關系的病例對照研究,在對照組中排除了心血管病人(其中有相當多的高血壓病人,他們服用利血平),所以得出利血平是乳腺癌的危險因素的結論。另一個研究將全部病例均納入,則未發現此相關。
3.檢出信號偏倚(detectionsignal bias,unmasking bias)某因素如能引起或促進某癥候(與所研究疾病的體征或症狀類似)的出現,使患者因此而去就醫,這就提高了該病的檢出機會,使人誤以為某因素與該病有因果聯系。這種虛假聯系造成的偏倚稱為檢出信號(或檢出癥候)偏倚。如,曾有研究發現子宮內膜癌與絕經期服用雌激素有關。這個研究結果是因為絕經期婦女服用雌激素會引起不規則子宮出血,因此而就醫,得到檢查子宮內膜的機會較多,從而增加了發現子宮內膜癌的機會。不服用雌激素的子宮內膜癌常無明顯症狀,發現機會較少。以刮宮或子宮切除作為診斷子宮內膜癌的診斷時,絕經期服用雌激素的OR為1.7,而以子宮出血就診者的OR為9.8,二者相差懸殊。顯然,以子宮出血就診增高了OR。此類偏倚即檢出信號偏倚。
4.無應答偏倚(non-responsebias)即研究對象對研究內容產生不同的反應而造成的偏倚。如用通信方式調查吸煙情況,不吸煙者與吸煙者的應答率可以相差懸殊。無應答者的暴露或患病狀況與應答者可能不同。如果無應答者比例較高,則使以有應答者為對象的研究結果可能存在嚴重偏倚。所以在研究報告中必須如實說明應答率,並評價其對結果可能造成的影響。與一部分人無應答相反的情況是有一部分人特別樂意或自願接受調查或測試。這些人往往是比較關心自身健康或自覺有某種疾病,而想得到檢查機會的人。他們的特徵或經歷不能代表目標人群。由此造成的偏倚稱為志願者偏倚(volunteer bias)。
總之,無論什麼原因使觀察組與對照組成員不是來自同一總體,即可造成除研究因素以外的有關因素在兩組分布不均衡,從而造成選擇偏倚。
(二)衡量偏倚(measurement bias)或信息偏倚(information bias)
對觀察組和對照組進行觀察或測量時存在頻度和(或)強度的差異,而使最終判斷結果時出現偏倚。在非盲法觀察時,由於觀察者知道誰在觀察組,、誰在對照組,更易出現此種偏倚。
1.回憶偏倚(recall bias)特別是在病例對照研究中,需要被觀察者回憶過去的情況(甚至久遠的情況,如癌的病因學研究),回憶的准確性會受到影響。病例組可能回憶仔細(特別是當懷疑某因素與某病有關時,如吸煙、被動吸煙與某些癌的關系,口服避孕葯與下肢血栓性靜脈炎、服雌激素與子宮內膜癌等),而對照組回憶則可能不那麼仔細,尤其當研究者屢次提醒病例組有否這些因素時(誘導其回答,更容易出現偏倚-尋因性偏倚)。有時某種症狀或狀態的存在會誘導產生或加強其與某種因素的聯系,如前段所舉子宮內膜癌,得出與口服雌激素有聯系的結論即屬此,稱為疑因性偏倚(exposure suspicion bias)。
2.疑診偏倚當觀察者已知被觀察者的某些情況時,在研究時會自覺不自覺地側重詢問、檢查有關情況(如對服口服避孕葯的婦女,仔細檢查其有無下肢血栓性靜脈炎,而對有下肢血栓性靜脈炎的婦女仔細詢問其口服避孕葯的歷史)就可能得出二者有聯系的結論。但實際上可能是偏倚所致。
3.沾染偏倚(contaminationbias)對照組成員有意或無意應用了試驗組的措施。如用低鈉鹽減少鈉攝入與高血壓關系的研究時,對照組成員同樣可以購得低鈉鹽(因接受宣傳後認為低鈉鹽可以防止高血壓),從而使判斷結果時出現偏倚(沾染性偏倚)。試驗組成員有意或無意接受了研究因素以外的措施,而使結果有利於試驗組,稱為干擾。干擾與沾染最容易在非盲法觀察的條件下發生。
(三)混雜(混淆)偏倚(confounding bias)
混雜(淆)因子存在時,在分析結果時可能錯誤地把某一因素當成某一結果的原因。即是存在混雜偏倚。前節曾談到混雜因子。
混雜偏倚使研究結論不能反映真實的因果聯系。這種偏倚的產生常常是研究者專業知識局限,不了解混雜的存在,或者雖然知道,但忽略了其存在。混雜偏倚常常在資料分析階段顯露出來。因而一旦認識後是可以設法糾正的。
混雜因素:①不是要研究的暴露因素,而是研究過程中常規地被收集起來的(如年齡、性別、吸煙、飲酒等生活習慣),是一個外部變數(extraneous variable);②是對研究的疾病的危險因素,或通過其他危險因素而間接起病因作用;③它與所研究的暴露因素之間有統計學的聯系,但二者又是獨立存在的。
應結合專業知識去考慮本次研究的結果,可能有什麼混雜因素誇大或縮小了其效應指標(RR或OR)。根據可能的混雜因素分析校正的(adjusted)RR或OR(記為aRR或aOR),以與最初所得到的粗的(crude)RR或OR(記為cRR或cOR)比較。如果aRR與cRR或aOR與cOR相近似,則此因素非混雜因素,如相差大則為混雜因素。最常用的方法為按可疑的混雜因素進行分層分析。即是將有此因素的作為一層來比較其RR或OR,而將無此因素的作為另外一層來分析。也可以比較分層前後x2值,此時用Mantel-Haen-szel法比較。如分層前後無差別,則表示分層因素非混雜因素。還可比較分層校正前OR(cOR)與校正後OR(aOR),如有差異說明分層因素為混雜因素。
控制措施:
(一)混雜偏倚
根據專業知識事先找出可能存在的混雜因素,在設計時注意去掉這些混雜因素。混雜出現在兩組分配不均勻的情況,因此,盡量做到齊同對比以防止混雜因素的作用。
在資料分析階段顯現出來的混雜偏倚,可以按前節所述的方法加以糾正,如分層分析,也可用多元回歸分析及標准化等方法加以處理,以識別混雜因素的影響。
(二)選擇偏倚及衡量(測量)偏倚
這些偏倚是在科研設計及觀察階段所產生,主要因為設計不周及(或)測量帶有傾向性而造成。帶有方向性,不能以加大樣本量加以減少,一旦形成之後即無法彌補,很可能需要重新進行。因此,從設計之初就要考慮到各個環節可能出現的偏倚,而加以防止,一般應注意以下幾點:
1.設計方案及研究方法的選擇應當選擇論證強度大的設計方案。
為避免選擇性偏倚,首先的設計方案應是隨機對照設計方案。有嚴格的診斷標准和納入標準的隊列研究方案也較好。由於病例對照研究在臨床較易執行,因此,較多使用。此時必須注意嚴格選定有代表性的研究對象(病例及對照),使病例與對照均衡,資料可靠、分析正確,或應用多因素分析方法。
2.嚴格限定納入標准規定納入與排除的標准。病例與對照的診斷應有「金標准」。盡可能採取隨機分組法。病例對照研究使用配比法,可使病例與對照組有良好的可比性。測量和判定結果時實行盲法,盡量應用客觀指標。分析時採用分層分析法及對率進行標准化等等。要有良好的科研作風及嚴謹的科學態度,爭取病人良好的依從性及減少失訪率。
『叄』 處理selection bias,怎麼用stata做
處理選擇性問題時,有一部分選擇性問題:在可觀測變數上的選擇性問題可以用Heckman兩步法來做,
『肆』 propensity score原理是什麼
一、一種統計方法,即propensity score (PS)傾向指數。在統計分析中,是一種無偏估計的方法。
二、三種傾向分數的應用方法:匹配法(matching )、 分層法( st ratif icat ion or subclassificat ion)以及回歸調整法( reg ression adjustment )。
三、其中,匹配法和分層法是在觀察研究中長期被用於消除選擇性偏差( selection bias)的有效方法。
四、匹配法是從控制組中挑選出個體以匹配處理組被試的方法。從處理組逐次挑選被試,在控制組中尋找與此被試的傾向分數最為接近的全部被試。
五、再隨機從抽取出的全部被試中抽取一個或多個作為處理組被試的對照被試。這種方法常用於處理組被試數量較少而控制組被試數量較大的情況。
六、分層法是將被試按照傾向分數的一定標准區分為若干層, 在不同層次的傾向分數上,均衡其他特徵變數從而實現處理組和控制組之間的比較。
七、研究發現,採用五等分的分層法可以有效的消除傾向分數模型中所有特徵變數 95%的偏差。
八、回歸調整法是將傾向分數作為一個協變數,引入回歸方程,再來探討分組變數與因變數之間的關系。
(4)selectionbias解決方法擴展閱讀:
傾向評分匹配(Propensity Score Matching,簡稱PSM)是一種統計學方法,用於處理觀察研究(Observational Study)的數據。在觀察研究中。
由於種種原因,數據偏差(bias)和混雜變數(confounding
variable)較多,傾向評分匹配的方法正是為了減少這些偏差和混雜變數的影響,以便對實驗組和對照組進行更合理的比較。
這種方法最早由Paul
Rosenbaum和Donald Rubin在1983年提出,一般常用於醫學、公共衛生、經濟學等領域。
以公共衛生學為例,假設研究問題是吸煙對於大眾健康的影響,研究人員常常得到的數據是觀察研究數據,而不是隨機對照實驗數據(Randomized
Controlled Trial
data),因為吸煙者的行為和結果,以及不吸煙者的行為和結果,是很容易觀察到的。
但如果要進行隨機對照實驗,招收大量被試,然後隨機分配到吸煙組和不吸煙組,這種實驗設計不太容易實現,也並不符合科研倫理。
『伍』 政治問題
本文先從一個比較宏觀的角度,討論民意調查的科學基礎、民意匯集功能與限制,爾後再循序導入我國政府首長施政滿意度調查的個案分析,進而從方法學和民意調查的政治功能兩個面向,來反思當前政治民意調查或施政滿意度調查所引發的爭議問題。本研究發現目前的政府首長施政滿意度調查,仍舊面臨許多技術面的難題,例如施政滿意度的概念製作與問卷設計、電話簿的編制架構與行政區不一致、電話調查系統的抽樣架構涵蓋率偏低及其衍生的問題等,這些因素相當程度限制了政治民意調查的科學描述、解釋及預測能力。更有甚者,在調查技術尚待精益求精、尋求本土化突破之際,國內對於民意調查的操作與解讀經常偏向政治上的考量,充斥著結果論、簡化論、信賴敘述推論和至上論等迷思。本文最後提出重建政治民意調查的公信力,首要在於還給施政滿意度調查一個獨立自主的運作空間,避免政治力量或商業利益的不當侵擾,並將其制度化為政府例行業務的一部份,定期實施各種民意調查來昭信於社會大眾。
政治民意調查與商業領域的市場調查不同,這類調查旨在探求民眾對於公職選舉的候選人、重要政策議題或者政府首長施政滿意度的看法。除了各類型的選舉調查之外,首長施政滿意度是目前最常見的政治民意調查主題。民意調查基金會在民國七十六年公布總統和行政院長的施政滿意度調查,開啟國內有關政府首長聲望調查的風氣之先,稍後也陸續引起其它民意調查機構的注意與跟進。歸納言之,目前常見的政府首長施政滿意度調查,是近似於英美西方國家對政治人物所實施的一種聲望調查(popularity polling)。這類民意調查通常以行政首長的整體施政表現, 或者民眾對於重大政策的反應為觀察焦點,但部份的調查也會伴隨中央各部會首長的職務表現評估。
相較於西方的施政滿意度調查一般只限於最高行政首長,我國也針對各部會首長進行職務表現的評比,這是英美國家相關的民意調查較為罕見的現象。就落實主權在民所揭示「民之所欲,常在我心」的理想而言,本文認為施政滿意度調查不僅是一種具有科學及專業性的民意反映途徑,同時也是衡量政府首長民意支持度或認同感的重要工具。然而,就民意調查的設計與執行而言,政府首長施政表現的評估,本質上是一個相當抽象而且復雜的議題;常見的問題包括:首長的知名度經常與其施政表現的評價相互糾纏不清,受訪者對政府首長的施政評價,也經常與其個人的感覺或印象相互混雜(傅恆德,民88 年)。若是如此,首長的施政滿意度評估是否即等同於個人的知名度或印象調查?施政滿意度調查的結果又能否客觀地反應政府首長實際的施政績效?把不同性質或功能定位的政府首長一起做調查,並將評比結果加以排序比較是否具有意義呢?隨著政府首長施政滿意度調查日益普遍化之後,這些爭議將更值得學術社群與實務界的民調工作者加以正視。
本文以國內近兩年來主要學術機構和傳播媒體的民意調查中心, 針對各級政府首長所進行的施政滿意度調查為觀察對象,透過次級數據(secondary data)的比較分析,來探討相關的民意調查在研究設計與調查執行上的優缺點。在一個多元、開放競爭的社會,民意調查已逐步建立影響政府決策的地位;不僅是許多從政人物搜尋和掌握民意脈動的重要途徑,同時也由於探討主題的敏感性和希望調查結果能具有統計上推論的價值,這類民意調查的爭議性通常遠高於那些以探求消費者購買意願為宗旨的市場調查。基於此,本文以下先從一個比較宏觀的角度,討論民意調查的科學基礎、政治功能與限制,希望為當前的施政滿度度調查提供一個評估與對話的基礎。爾後再循序導入我國政府首長施政滿意度調查的個案分析,探討這類民意調查在研究設計上的優缺點。最後,從方法學和民意調查的政治功能兩個面向,來反思我國政府首長施政滿意度調查所引發的各種爭議。
貳、民意調查的科學基礎
政治學者指出民意(public opinion)是所有個人意見的總和, 政府對於這些意見有必要慎重留意並納入決策時的參考(Key, 1961; Ranney, 1993: 123)。難怪許多民主國家和政治人物,都將民意視為一股強勁的政治力量,深深左右該國的政治運作。雖然民意經常是分散、游移不定、甚至於相互沖突,但是拜信息科技快速發展與統計抽樣原理之賜,計算機輔助電話訪問系統(Computer-Assisted Telephone Interviewing System, 以下簡稱CATI)大量被運用於民意調查(public opinion polls)的領域,使得掌握民意脈動的夢想愈來愈有實現的可能性。
在媒體和學術機構廣泛涉入下,民意調查似乎已成為當代政治生活的一部份,特別是選舉前夕接踵而來的電話調查詢問民眾:假如明天投票,你(你)會支持那位候選人?百家爭鳴的民意調查不僅引起社會各界許多的爭議和討論,同時也更令民眾困惑於各項調查結果的參考價值。常見的疑惑包括:受訪的民眾是否具有代表性?主持調查的機構是否公正客觀?有些民眾無法聯絡上或者拒絕合作所顯示的無響應問題(non-response problem),是否會造成抽樣調查結果的偏差?民意調查是否會淪為候選人文宣造勢的工具, 企圖來影響一般選民的投票行為?以及為什麼民意調查的預測,似乎總是與選舉結果有相當的出入?
目前流行的政治類民意調查,是否稱得上具有科學的基礎呢? 從統計學原理和調查方法的角度來說, 答案應該是肯定的。當代的民意調查經常是利用抽樣程序,從母體(population)隨機選取樣本(samples)來征詢民眾對某些公共議題的意見;相較於志願響應的樣本時常存在偏差,隨機樣本最大的優點是具有公正不偏性(鄭惟厚,民87 年:10)。一般而言,嚴謹的隨機抽樣設計可以產生具有代表性的樣本,使得意見調查的分析結果能夠進一步推論到母體的整體實況。
採取抽樣調查的原因,不僅在於普查(census)的程序既費時又太昂貴,同時也由於實地進行測量時,抽樣調查的總和誤差(total errors)一般較普查來得低(Singleton and Straits, 1998:137 )。再者,問卷設計上必須符合調查研究的專業要求,也在在反映出民意調查的科學性;例如問卷題目的用字遣詞應避免過於艱澀難懂、籠統模糊,甚至使用一肩兩擔式問題(double barreled questions)或者掉入引導性或負載式問題(leading or loaded questions)的陷阱,同時也應注意問題選項的窮盡性和互斥性(exhaustive and mutually exclusive) (楊國樞等,民78 年;賴世培,民85 年)。換言之,唯有遵從問卷設計的各項要領與原則,才能確保民意調查工具的信度(reliability)與效度(validity)。1
其次,根據Singleton and Straits(1998)科學性質(nature of science) 的觀點, 民意調查的科學基礎可以分別從產品面(science as proct)和過程面(science as process)來加以評估。就產品面的特徵而言,民意調查所提供的信息應該具備某種程度的描述(description)、解釋和預測(explanation and prediction)以及理解(understanding)等功能(1998: 21-28)。然而,在實務上,不同學科所展現的理論功能具有一定的高低層次性,可以達到較高層次功能的科學知識,其理論建構的嚴謹程度也就愈高。
當中描述的功能要求民意調查能夠使用自己獨特的概念,來敘述一般民眾對於特定議題的認知或態度;例如,美國總統的聲望調查可以用來反映最高行政首長施政表現的民意支持度(approval rating)。解釋或預測的功能則表現於某些經驗法則(empricial rule) 是可以成立的前提之上, 亦即某一個變數(variable)的變化, 將會影響另一個變數狀態的改變(Babbie, 1998)。根據過去的選舉經驗法則,在民調獲得高支持度的候選人,通常會有較大的當選機率。基於此,台灣選舉所謂的「西瓜效應」建議,為避免將選票虛擲在當選希望渺茫的參選人身上,選情被看好的候選人往往在投票日前,較容易獲得游離或未決定選民的青睞。
理解功能的實現, 則建構在確定的因果關系(causal relationship)基礎之上,這種因果關系必須同時兼顧統計上的關連性、影響方向確定以及可以祛除假性關系(non-spuriousness)等三項條件才能達成(Nachmias and Nachmias, 1995)。由於成就因果關系的條件過於嚴苛,一般的調查研究通常無法同時滿足前述的要求。英美國家的投票行為研究雖然常假設,現任者的施政滿意度與其當選機率是呈現統計上的正相關,但由於影響選民投票取向的因素眾多,欲期建立一個選民投票行為的因果關系模式,事實上相當不容易。具體的事例如,陳水扁先生在民國八十七年尋求連任台北市長的選舉,雖然他在歷次的選舉民意調查一直享有高度的市政建設滿意度和選民支持率,但可能出於省籍情結的因素和恐獨選民的危機意識作祟,終究不敵國新兩黨支持者合流所產生的圍堵效果, 以致於不幸高票落選。顯示了突出的施政滿意度本身,並不必然可以保證當選連任。
就過程面而言,一項民意調查的執行必須妥善響應經驗主義(empiricism)、客觀性(objectivity)以及控制(control)等重要原則(Singleton and Straits, 1998: 28-34)。延續六0年代邏輯實證論者的觀點,經驗主義強調應該經由人的感官直接或間接加以觀察,來理解周遭世界現象的一種研究途徑;相對的,訴諸於直覺或權威所獲得的信息並不是科學的證據,經驗主義認為只有可以觀察的(observable)事物,才能成為科學研究的題材,觀察結果同時也必須具有測量上的意義(胡佛,民87 年;楊國樞等,民78 年)。由於政治類民意調查經常以選舉、公共議題以及首長聲望為研究對象,透過抽樣設計和電話訪問程序來測知民意的動向,顯然是符合上述經驗主義所謂可以觀察、並具有測量意義的原則。
其次,就專業倫理的規范而言,政治民意調查本來應以探求民眾真實的態度取向為最高鵠的,希望公共政策的制定能有助於實踐多數人共享的公共利益;然而,政治過程卻經常涉及各種社會價值的權威性分配, 政策利害關系人(policy stakeholders)又難免從本位主義的立場,來操作及解讀相關的民意調查結果,以實現個人的信念或政治利益極大化為職志,致使民意調查的工具價值(instrumental value)可能凌駕於前述實質理性的目標之上。因此,客觀性的原則著重調查過程中,研究者必須盡量維持公正客觀,避免個人的認知、情緒、利益或價值不當介入民意調查的設計與執行,並且透過交互主觀驗證(inter-subjective testability) 的程序來獲得相對客觀(relatively objective)的結論,以代替絕對客觀(absolutely objective)事實的追求(Babbie, 1998)。交互主觀驗證的程序是以多數的意見趨勢為基礎,這與民主多數決的原理也相互吻合。
最後,控制的原則在於偵察民意調查過程各種可能的誤差或偏差(errors or bias),並且採取有效的作為來降低這些干擾因素(confounding factors)的不當影響。一個劣質的調查研究設計可能受到選擇性偏差(selection bias)的干擾,不管它是來自一種自我選擇的偏差(self-selection bias) 或者是萃取精華的偏差(creaming bias);2 例如許多叩應(CALL-IN)民意調查偏向於是自願響應的樣本,響應意見的民眾代表性令人懷疑,調查結果的參考價值自然不高。
其次,從事問卷設計時應注意問題的措詞須盡量清楚明確,不可以一題兩問或者使用引導性及負載式的問題敘述,題目或選項的排列順序是否會對調查結果造成不同的影響。這些屬於測量工具方面的偏差因素必須積極處理,才能維護民意調查結果的准確度及可靠性。
綜合言之,民意調查是屬於社會科學研究常用的一種調查研究法(survey research),這種方法系針對特定的公共議題,通常以隨機抽樣程序選取具有代表性的樣本,再藉由預擬的問卷題目來征詢民眾對於某些議題的認知或看法。根據統計推論的原理,一項嚴謹設計並加以執行的民意調查通常具有「鑒微知著」的功能,所提供的信息可以作為描述、解釋和預測特定事件結果的水晶球。然而,民意調查的實施過程存在相當大的模糊地帶和不確定性,任何無心的疏忽或者有意的操縱都可能帶來嚴重的偏差,使得預測結果與事實之間充斥「差以毫釐、失之千里」的現象,也因此一項科學的民意調查必須妥善響應經驗主義、客觀性以及控制等原則。
參、民意調查的意見匯集功能與限制
以下先敘述民意調查在匯集和反映民意所擔負的政治功能,然後再談民意調查在政治過程中運作的限制。
一、民意調查的意見匯集功能
隨著民意左右當代政府運作的程度日益深化,民意調查在政府與人民之間扮演的橋梁角色也就愈來愈重要;尤其是面對民意如流水的多變與復雜特質,具有科學基礎的民意調查理想上是探求人民希望政府採取那些行動,使政府能夠迅速響應民眾偏好的一種工具。相較於其它的民意表達或利益匯集的途徑,如定期選舉、議會制度、大眾傳播媒體、政黨和利益團體各自擁有不同的缺憾,民意調查所具備的科學性、時效性、代表性和客觀性,幾乎使它成為現代民主社會生活的一部份(周祖誠,民87 年:74)。根據相關文獻的分析,民意調查的政治功能至少表現在對於選舉、政策議題以及政治人物的聲望調查等三方面,分別說明如下。
民意調查在一九三○年代發源自美國,直到五○和六○年代才開始與美國總統選舉結下不解之緣。許多總統候選人發現,民意調查的信息在協助掌握選情動態、區隔選民市場以及擬定競選策略上具有很高的參考價值。約翰甘乃迪 (John Kennedy)是將民意調查應用在總統選舉的個中翹楚,他當選之後並讓民意調查專家(pollster)成為白宮的正式職位(Jacobs and Shapiro, 1994: 528)。台灣地區的選舉調查是在政治解嚴之後才逐次發展出來,成為部分候選人或政黨從事選情研判的重要工具;民國八十五年首次公民直選總統的過程中,民意調查在反映選情的角色著力日深;公元兩千年總統大選前夕,白熱化的總統選情調查,更是社會各界掌握各組參選人民意支持度的主要訊息來源。
選舉調查的政治效果主要取決於,民意調查結果是否會對選民的投票行為產生關鍵的影響。例如未決定選民(undecided voters)是否會因民意調查轉而支持較可能當選的候選人,或者逆向操作去支持聲勢落後的參選人。以美國的總統選舉為例,目前並沒有確實的證據顯示前述的勝選列車效應(bandwagon effect) 或者同情效應(sympathy effect) 會出現(Ranney, 1993:130)。至於美國西岸的選民因與東岸時間差距三個小時,晚些結束投票是否會因東岸和中南部的選舉結果,先經媒體揭曉而降低投票意願呢?雖然目前沒有充分的證據支持,但跡象顯示部分投票意願不高的選民可能會受到影響(Ranney, ibid.)。
就台灣選民的投票行為觀察,有趣的是未決定選民最後選擇偎大邊的「西瓜效應」現象似乎存在,使得選舉調查在激烈選戰中的策略性角色愈趨於白熱化,部分參選人可能藉由操縱「假民調」的方式,來干擾選民投票取向的疑慮經常涌現。現行公職人員選舉罷免法,明文禁止在選前十天內公布選舉民意調查結果,雖不免有剝奪民眾意見表述自由或藉由民意調查來了解選情變化的缺憾,但是在目前民意調查機構良莠不齊、社群成員又缺乏自清自律的專業倫理規范下,訴諸於法律禁止規定的外控途徑,似乎也是沈澱劣質民意調查在激昂選情中喧囂的必要措施。
其次,民意調查也經常扮演征詢民眾對於特定公共議題的看法,以作為政府決策參考的角色。許多位美國總統與民意調查的關系至為密切,他們素來相當倚重民意調查專家的操盤來進行重大的決策;例如甘乃迪藉助於哈利斯(Louis Harris)的民意調查來決定他的民權和外交政策(Reeves, 1993);尼克松在七0年初經由一系列民意調查最後才做成他的經濟政策,還有工資與價格管制的政策決定(Jacobs and Shapiro, 1995);布希更是一位非常敏感於民意調查結果的總統,他的掃毒政策由原來的減少毒品需求轉變為強力掃盪販毒的措施,只因為提特(Robert
Teeter)的調查顯示民眾是支持鐵腕的政策(Duffy and Goodgame, 1992);柯林頓總統則仰賴格林堡(Stanley Greenberg)所設定的電話調查系統,來探求民眾對總統經濟政策的看法,使得修正後
的經濟政策能夠在國會獲得高度的支持(Woodward, 1995)。總統在作決策時為何如此重視民意的動向呢?這可能與總統需要民意的強力支持來推動政策有些關連。學者郭漢即指出:總統若愈需要大眾的支持,就愈有必要注意民心的向背(Cohen, 1997:14)。直言之,總統重視民意的反應不僅有助於提升他的政治聲望,同時也可以增強與國會議價協商的地位,進而促使總統在
推動政策的合法化,以及實踐政治目標的能力大為提升。
最後, 民意調查也好比是一支政治溫度計(political thermometer),可以用來衡量行政首長的政治聲望甚至於民意支持的高低。以美國民意調查的運作為例,總統聲望的上下起伏一直被主要民意調查機構嚴密追蹤,並且在一個長期觀察的基礎上被用來評估總統的職務表現,使得民意調查浸染成為華盛頓政治文化的重要內涵。約翰遜即是一位相當嫻熟於民意調查事務的總統,據說他會把近期的聲望調查數字隨身放在口袋作參考(Altschuler, 1990)。不過各國公職人員聲望調查的作法,可能跟隨政府體制的特性而有所差異。在美式的總統制之下,許多民意調查一般只是針對總統的施政表現而來,卻不對閣員進行個別的聲望調查; 英國的民意調查機構對政黨聲望的重視程度,通常遠高於行政首長的聲望調查;法國屬於雙重首長制的國家,因此聲望調查的對象同時包含總統和內閣總理兩位重量級人物;我國的施政滿意度調查經常一並兼顧總統、副總統及各部會首長等三種對象,是屬於較為少見的例子(周祖誠,民87年:75-76)。
二、民意調查在實務運作上的限制
理想上民意調查在政府與人民之間可以擔負重要的溝通功能;然而,值得注意的民意調查的運作卻也經常面臨許多內外在的限制因素。內在限制(intrinsic constraints)泛指,執行民意調查過程所涉及的各種概念製作、問卷設計、抽樣以及調查實施上的技術面問題,這些問題大致屬於民意測量工具本身未臻成熟而衍生的誤差或偏差; 外在限制(extrinsic constraints)指稱,民意調查在與政治過程從事互動之後所產生的各種問題,例如機構特性的影響、政治因素不當介入的干擾、選舉調查的政治化傾向、民意調查對公共政策影響的局限性等。由於政治民意調查旨在透過探求選情、了解民眾的政策偏好和政府首長的聲望試圖來左右政治過程,因此在多元利益交織的政治場域中,勢必難以維持其原有的中立客觀立場,這是社會各界在解讀與運用政治民意調查時需要深思的課題。
就內在限制的因素而言,目前各家民意調查機構CATI 系統所使用的住宅電話號碼簿, 普遍面臨抽樣架構(samplingframe)的涵蓋度偏低問題,約只包含近六成的住宅電話用戶。雖然完美的抽樣架構極其少見, 通常都會有未登錄(non-coverage)、空白或重復登錄(blank or plicated coding)等缺失(陳膺強,民83 年:62-65),但那些被遺漏的住宅電話用戶是否存在某種系統性的偏差(systematic bias),並足以干擾到調查結果是吾人所應關切的重點。其次,問卷設計上題目的敘述方式也可能影響到調查結果。曾經有一個民意調查詢問美國人民:政府是否應該在社會救助政策上投入更多?若問題的措辭使用」窮人」而非」依靠福利過日的人」,贊成增加投入的比例明顯高出甚多(Ranney, 1993: 129)。無響應(non-response)問題是目前抽樣調查所面臨的最大挑戰,因為無響應問題造成的偏差很容易就超越信賴敘述(confidence statement)所談的隨機抽樣誤差的范圍(鄭惟厚,民87 年:39)。最常發生無響應的原因是聯絡不上受訪者或受訪者拒絕合作,這種情況下的電話調查是否會引入選擇性偏差(selection bias),有系統地排除某些預定受訪對象如窮人、攤販、夜間或流動工作者等不容易聯絡上的族群,或者遺漏主觀上較傾向於拒答者的意見,進而影響隨機抽樣程序的嚴謹性及樣本結構的代表性,都是日後從事民意調查時值得密切觀察的議題。
再就外在限制的因素而言,機構的特性可能會左右民意調查的處理方式,致使民意調查的科學性或實用價值隨著情勢的變遷而衰減。以政府部門、學術機構和新聞媒體三者來說,政府部門的民意調查通常關心訪問主題的相關性與政治含意,強調民意調查結果的政治可欲性(political desirability)遠高於對調查過程科學規范的堅持;學術機構的調查一般重視技術的完整性(technical integerity)和學術研究的價值,因此難免與政治圈內利害關系人的信息需求無法相契合; 新聞媒體從事的民意調查,傾向於強調新聞價值與時效的重要性,因此在題材的選擇上經常是事件取向,對於調查方式與結果的處理也會考量時間的因素。基於訪問的便利性,雖然CATI 已成為國內媒體最常採用的民意調查工具,但在爭取時效和針對特定新聞事件做出及時的反應等期望下,調查訪問的對象、完成的有效樣本數和品質有時難免會受到牽累。
其次,雖然民意調查本意想藉由提供相關的信息,來影響政治過程的運作,但是這項科學工具也可能因政治因素不當介入而遭受反向的操控,進而提供一些偽劣假冒的訊息來干擾社會大眾的判斷。以近年來台灣選舉中常被討論的西瓜效應和棄保效應為例,假若候選人對西瓜效應發酵的危機感愈趨強烈,選舉調查的政治化傾向即可能升高,聲勢落後的參選人往往亟欲由操縱民意調查或散播耳語等途徑來擺脫邊陲化的印象,以避免選民偎大邊的西瓜效應涌現而使自己提早出局。另外,棄保效應指稱當所支持的對象勝選希望渺茫時,有些選民會放棄最愛改投當選機會較濃的候選人,來預防最不喜歡的競爭者最後奪魁的一種策略投票行為(strategic voting)。族群之間的省籍情結或者懼怕台獨引發戰爭的心理因素,經常是激烈選戰中棄保效應滋生的溫床,在選情信息不完全、有棄保傾向的選民渴求參考訊息的情況下,各競選陣營越可能順勢操縱民意調查的數據,來誘使有利於己的棄保效應發酵。公元兩千年的總統大選過程,「宋出局」或「連老三」盈篇累牘的文宣廣告,即是為了發動棄保效應戰略的顯例;換言之,選舉調查被視為競選策略或政治工具的誘因大幅增強,民意調查已不再是反映民意脈動的中性調查工具。
最後,民意雖然對政治過程具有一定程度的影響力,但過度誇大民意調查在決策制定過程的主宰地位, 則可能失之偏頗。部分的原因來自於吾人不能將「民調」等同視為「民意」;由於任何的民意調查都會面臨不表態或拒答者的威脅,因此無論民意調查技術再怎樣的精進突破,都很難精確掌握尚未表示意見者的態度意向,使得調查結果在表彰整體民意的功能受到限制。其次,民主國家的行政首長即使經常閱讀各種民意調查的數據;然而,這些訊息所反應的民意畢竟只是影響政府決策的因素之一,而非全部分(Ranney, 1993: 130)。以美國政府為例,總統作決策時可能受到他的治國理念、世界觀以及尋求歷史上的地位等因素所左右;在另一方面,總統也可能相當關心公共政策的作為與實際績效;總統甚至於可能透過演說或其它的策略行為,來引導和塑造民意的走向(Cohen, 1997: 164)。換言之, 政府首長的決策動機與目標事實上涵蓋相當廣泛的因素,無法單獨以民意化約主義的觀點來加以詮釋;同時民意對公共政策的象徵性影響可能多過於實質上的意義,總統雖然不見得會真正依循輿情的動向來行事,但行政首長至少希望能贏取重視民意的名聲。
肆、政府首長施政滿意度調查的個案分析
近兩年來許多新聞媒體或學術機構附設的民意調查中心,曾分別針對蕭內閣或者地方政府縣市首長進行一系列的施政滿意度調查,為國內的政治民意調查開拓另一番新氣象。根據本研究訪查結果,聯合報和TVBS 的民意調查中心在這方面的投入較為積極,約每季對蕭萬長院長及各部會首長進行一次施政表現的總體評估,其它如中央通訊社或世新大學的民意調查部門,也曾數度舉行蕭內閣的施政滿意度調查。此外,施政滿意度調查的對象也逐漸擴及到地方縣市政府及其行政首長,例如遠見雜志和TVBS 民意調查中心所執行的各縣市首長施政表現的評價,東海大學和傳訊電視分別針對中部五縣市政府首長和桃園縣府團隊,曾實施不同型態的施政滿意度調查較具有代表性。3 部分政府機關如行政院研考會或新聞局,雖然也相當重視政府首長施政滿意度調查的議題,但這些機構通常根據媒體報導和輿情數據分析來了解民意的動向,只有少數個案才會以委外研究的方式進行大規模調查,調查結果也僅供內部參考並不對外公布。
『陸』 Excel中如何使用VBA的選擇語句Select但卻不觸發SelectionChange事件
在代碼最開始增加一句:
Application.EnableEvents = False
代碼結束前增加
Application.EnableEvents = True
關於此處用到的EnableEvents的相關知識:
Application.EnableEvents=False
操作代碼
Application.EnableEvents=True
這樣可以屏蔽事件程序的暫時運行,以達到不會反復觸發事件程序,造成死循環
『柒』 論文的局限性怎麼寫
在研究的過程中,有各種原因可能會導致研究產生局限性,這些原因主要可以分為兩個部分: 由於研究方法論或是由於研究人員本身。若論文中發生方法論相關的研究局限性,可以直接清楚的指出潛在的問題,並提出建議改善的方法,這部分必須在」future studies」中更進一步討論。
以下是關於方法論可能會產生的問題,以及這些問題對研究結果可能造成的影響:
當使用概率抽樣/隨機抽樣(probability sampling)時,有可能所抽樣的樣本無法代表所研究的母體(population),這時研究則會產生與統計「sample bias」 或 「selection bias」(選擇性偏差)相關的問題。
例如,當使用問卷調查來獲得研究結果時,我們會要求樣本(問卷答題者)回答問卷上所列出的問題,但是,如果無法接觸到合適的問卷答題者,或是所涉及地理區域不夠廣泛,在這些情況下,所選取的樣本(問卷答題者)則不能夠算是隨機樣本(random sample)。
當進行研究並且希望獲得有效的研究結果時,充足的樣本數是非常重要的。樣本數越大,研究結果便越精確。但是當樣本數不夠大的時候,便較難使用有限數據來證明研究內容的顯著相關性。
通常在進行統計分析時,較大的樣本(sample)數較能代表母體(population),因此通過分析所得到的結果,也較能在母體中套用。若不知該如何選取適當的樣本數,建議可以參考scientific calculation tools
在從事研究時,應引用過去的文獻內容作為該研究的基礎,回顧文獻可以為研究主題提供理論基礎。但是,由於研究主題涉及范圍的不同,相關的文獻也可能較為有限。
當研究主題相關的文獻不夠充足時,也許必須發展一個新的研究框架或理論。在這個情況下,過去文獻的不足反而可以做為發展研究空白(research gap)的契機,並且可以藉此提出相關領域未來研究方向的建議。
當撰寫完研究分析結果(在討論Discussion部分),你也許會發現所使用搜集資料的方法限制了全面分析研究結果的能力。
例如,也許你發現某個問卷中的問題應該以其他觀點來陳述,或者你忽略了某些重要的問題而未包含在問卷中,這時,必須在」研究局限性」中提及這方面的不完善,並且指出未來研究中可以通過何種特定的搜集資料方法,來解決這個問題。
(7)selectionbias解決方法擴展閱讀
論文寫作中添加有關研究局限性的描寫有助於增加文章的可信度。如果審稿人發現某一局限,但是作者未事先說明,審稿人可能會對論文產生負面印象。如果在未來的研究背景下討論論文的每個局限性,文章更有可能被引用,因為它將為其他研究人員的研究問題提供有價值的信息。
另外,提及研究局限性也表明我們已充分的考量過研究的不足之處,以及我們對自己所研究的主題有著充分的了解。既然所有的研究都難免會有局限性,那麼比起刻意忽略這部分,誠實並且詳細的在論文中提出來,反而能更加給審稿人及其他研究人員留下好的印象。
『捌』 姜凱的中華對沖基金的問題
姜凱的投資業績記錄乍一看確實非常令人吃驚:從1998年8月起至2009年12月,該基金累計回報率是3300%,也就是說,投資人的錢在這11年中翻了33倍,年平均回報率是37.1%。在相同的時間段里,代表被動投資的標准普爾500指數(S&P 500)累計回報21.5%,年平均回報率是1.7%,簡直就是烏龜爬行。與姜凱「同類」(peer group)的股票對沖策略指數(HFRI Equity Hedge Index)累計回報161.5%,年平均回報率是8.8%,可以算是快馬飛奔。相比之下,該基金簡直就是衛星上天了!據國內某媒體報道,他還為籃球飛人喬丹(Michael Jordan)和美國名嘴奧普拉(Oprah)理財。彼實為天才乎?
在頭兩年(1998的8月至12月和1999全年)該基金分別獲得168.7%和137.6%的回報率。如何看待這樣炫目的成績?首先我們要知道,公募基金(mutual fund)受證監會監管,必須定期公布業績並且在證監會備份,而對沖基金的業績資料都是對沖基金們自發上報給商業性資料庫的,從什麼時候開始上報,完全由對沖基金經理們自己決定。這就導致業績數據帶有一個「選擇性高起點」傾向(self-selection bias)。中華對沖基金什麼時候開始運作,什麼時候決定開始上報業績?投資人必須要問這個問題。因為假如投資人是在看到這兩年光輝業績之後再開始讓他打理投資,回報率就大打折扣,雖然仍較可觀,但絕對不再是驚世駭俗級別的了。
同時大家應該也記得,在1998至2000年間,互聯網泡沫膨脹,誰炒股誰就業績顯赫,誰投資誰就落後得慘不忍睹(尤其是那些老老實實哼哧哼哧研究行業公司基本面的,包括股神巴菲特在內),不少散戶因為資本金基數低,都能獲得百分之好幾百的回報(中國A股市場的股民對這種現象應該也不陌生),一點也不令人奇怪。後來的投資人必須要了解,姜凱那兩年裡的三位數回報是在多大的資金規模基礎上取得的?在最近5年內,該基金的業績一年不如一年。假如你是從2007年開始投資該基金的話,到2009年底時你還是虧錢的。特別令人不解的是2009年的前9個月該基金累計回報是負數 (-2.51%),而幾乎所有的對沖基金策略指數在同期內都是兩位數級別的正回報率,標准普爾500指數這只烏龜都領先該基金若干個百分點。種種因素表明,該基金頭兩年的業績當屬「界外值」(outlier),其平均年化回報率因為這兩個數值而明顯高估。
該基金與全球各主要股票市場的相關性低得有點「不食人間煙火」,而它與賣空策略基金平均指數(HFRI Short Bias Index)又是負相關(因此賣空對沖不是它達到低相關性的主要手段)。要知道,金融巨騙馬多夫的策略就是和什麼東西都不顯示相關性。
最能體現對沖基金經理投資能力的是熊市。牛市裡阿狗阿貓都能賺錢,熊市裡能「東方不敗」的才是真正的高手。我把摩根士丹利亞太(除日本外)指數歷史數據分成「正回報」和「負回報」兩組,分別代表牛市和熊市,然後用回歸分析計算中華對沖基金在牛市和熊市裡與大市的相關性。結果顯示,在牛市和熊市裡該基金與大市都具有實質相關性(statistically significant correlations),也就是說股市往上它也往上,股市下跌它也下跌,顯示該基金「對沖」不夠,控制風險的能力稍遜一籌。2008年是「黑天鵝」降臨的一年,該基金當年虧損12.7%,好於標准普爾500的虧損37%。然而,從8月至12月,該基金連續虧損總計50%,把上半年的獲利全部「抹殺」。很多股票對沖基金經理都沒有逃過2008年這一劫,有的年度業績甚至還不如中華對沖基金,但是他們要麼及時撤離市場,保留實力,要麼加強對沖機制,緩解下跌風險,沒有像中華對沖基金那樣連續5個月「坐以待斃」,以至於一年之內業績大起然後大落。
一番谷歌網路之後,我找到最早中文媒體報道姜凱的文章,是2007年8月南方人物周刊的「姜凱:我為喬丹和奧普拉理財」。把喬丹和奧普拉抬出來,不知道是否經過兩位名人授權。一般來講,公開透露客戶是為高端客戶理財的職業忌諱。另外,喬丹的身家好幾個億,奧普拉更是個超級大富婆,該基金全部資產也只是他們身家的小小零頭,說是為他們理財,恐怕不能算是准確的說法。像這樣級別的高端客戶,一般都有專門的團隊為他們理財決定什麼時候投什麼。確實,對沖基金在美國高端客戶的投資組合中占的比例較高,但是中華對沖基金這樣的高風險「牛角尖」策略(niche strategy)很難被大面積接受,也容納不了太多的資金(limited capacity)。該基金專注的投資范圍——中國在海外上市的股票——非常狹窄,超額收益α的潛力相當有限。所以這種投資策略的規模無法增加,不會成為主流產品。投入資金一多,就會影響收益。這就好比一個游泳池又淺又小,再厲害的泳將也無法徹底施展拳腳,要是池子里人再多一點,就壓根沒法遊了。姜凱在采訪中也表示,他的基金規模不大,若干年前還退還投資人資本,正是說明了這種策略的局限。
同時該篇報道中提及他「創立中華對沖基金(原名龍基金)時才24歲,是最年輕的對沖基金經理,更是該領域首位華裔」。這種說法經不起推敲。在美國,成立任何一種企業,包括對沖基金,都不是什麼難事——到相關部門登個記,繳注冊費就行了。對沖基金領域來自中國內地的華裔人士數量眾多,姜凱絕不是首位。
最耐人尋味的是,從2010年1月起,中華對沖基金已經停止向主要對沖基金資料庫上報業績。晨星公司(Morningstar)的資料庫顯示,中華對沖基金管理的資產從2005年的1000萬美元上升到2006年最高點8500萬美元,然後開始下降,2008年底為5200萬美元,2009年底只有1400萬美元。這樣的資產規模令人對該基金的生存狀態擔憂。
美國證監會高級政策顧問理查德布克斯特伯(Richard Bookstaber)最近總結了問題對沖基金的七大症狀,很值得大家牢記。第一條,對沖基金的業績由基金經理「自報家門」,未經第三方審計。第二條,基金業績大轉彎無法解釋。第三條,衍生品(derivatives)使用增加(衍生品往往被用來掩蓋基金實際操作中的缺陷)。第四條,基金策略「神秘化」,沒有人搞得懂基金的投資哲學、過程和方式,到底在投資些什麼東西。第五條,基金公司人員變動,或者基金經理的生活方式發生了重大變化。第六條,基金管理資產急劇減少(有人知道你不知道的東西?)。第七條,基金業績走下坡路(基金投資策略不靈驗了?)。
『玖』 樣本選擇偏差(sample selection bias)與倖存者偏差(survivorship
Selection bias is the selection of indivials, groups or data for analysis in such a way that proper randomization is not achieved, thereby ensuring that the sample obtained is not representative of the population intended to be analyzed.
而 servivorship bias 是即便你的sample 是通過科學的和完全random的一樣會存在的情況,比如說你分析金融危機過後各種基金的回報情況時候 即便你是完全隨機抽樣,你還是選不到那些已經掛掉的。剩下的本來就相對優質。