导航:首页 > 解决方法 > selectionbias解决方法

selectionbias解决方法

发布时间:2022-04-28 21:40:59

‘壹’ 统计概率样本偏差relevant/irrelevant features in sample selection bias

这是feature selection bias,可以通过random decision tree来优化

‘贰’ 简述病因研究中的偏倚的种类及控制措施有哪些

定义及种类:

偏倚是在研究中(从设计到执行的各环节)的系统误差及解释结果的片面性而造成的,使研究结果与其真值出现了某些差值。因为它是由系统误差所造成,加大样本并不能使之减少。一旦造成事实,则无法消除其影响。因此,必须认识偏倚,从设计起直到整个研究过程均要加以控制。病因研究中的偏倚有10种以上,它们可以归纳为选择性偏倚、信息(测量、观察)性偏倚及混杂(混淆)性偏倚。
(一)选择性偏倚(selection bias)
在选择研究对象时,试验组和对照组的设立(纳入标准)不正确,使得这两组人在开始时即存在处理因素以外的重大差异,从而产生偏倚。常见的主要有:
1.就诊机会偏倚(入院率偏倚,admissionrate bias)由于疾病严重程度不同、就医条件不同、人群对某一疾病的了解和认识程度不同等原因而使患不同种类疾病的人(或有某种特性者)的住院率不同。从医院选取对照时,如果没有注意到此点,则可引起偏倚。此种偏倚首先由Berkson发现并记述,因此,将此种偏倚又称为Berkson偏倚或Berkson谬误(fallacy)。
2.现患病例及新发病例偏倚(prevalence-incidencebias,又叫Neyman bias)此种偏倚易出现在病程较短的严重致死性疾病,如心肌梗死,部分病例在送到医院前已死亡,如果只以存活的现患病例为对象,研究某因素的作用,必然产生偏倚。这些死亡病例通常未计入心肌梗死总发病人数中,以至于所报道的患病数少于实际的发病数。又如,在病例对照研究中有意或无意排除(或加入)某些病例,也可出现偏倚,如研究吸烟与肺癌的关系时,对照组包括了慢性支气管炎和冠心病,由于此二病均与吸烟有关,所以吸烟与肺癌的OR减低,甚至于看不出吸烟作为肺癌的病因作用。患病后改变生活习惯也可以使用病例对照方法探讨病因出现偏倚,如患肺癌后戒烟,患高血压后将饮食口味调淡、不吃动物脂肪(肥肉)、适当增加体力活动等等,都可在病例对照研究中使这些因素的病因作用被抵消。又如,乳腺癌与利血平关系的病例对照研究,在对照组中排除了心血管病人(其中有相当多的高血压病人,他们服用利血平),所以得出利血平是乳腺癌的危险因素的结论。另一个研究将全部病例均纳入,则未发现此相关。
3.检出信号偏倚(detectionsignal bias,unmasking bias)某因素如能引起或促进某症候(与所研究疾病的体征或症状类似)的出现,使患者因此而去就医,这就提高了该病的检出机会,使人误以为某因素与该病有因果联系。这种虚假联系造成的偏倚称为检出信号(或检出症候)偏倚。如,曾有研究发现子宫内膜癌与绝经期服用雌激素有关。这个研究结果是因为绝经期妇女服用雌激素会引起不规则子宫出血,因此而就医,得到检查子宫内膜的机会较多,从而增加了发现子宫内膜癌的机会。不服用雌激素的子宫内膜癌常无明显症状,发现机会较少。以刮宫或子宫切除作为诊断子宫内膜癌的诊断时,绝经期服用雌激素的OR为1.7,而以子宫出血就诊者的OR为9.8,二者相差悬殊。显然,以子宫出血就诊增高了OR。此类偏倚即检出信号偏倚。
4.无应答偏倚(non-responsebias)即研究对象对研究内容产生不同的反应而造成的偏倚。如用通信方式调查吸烟情况,不吸烟者与吸烟者的应答率可以相差悬殊。无应答者的暴露或患病状况与应答者可能不同。如果无应答者比例较高,则使以有应答者为对象的研究结果可能存在严重偏倚。所以在研究报告中必须如实说明应答率,并评价其对结果可能造成的影响。与一部分人无应答相反的情况是有一部分人特别乐意或自愿接受调查或测试。这些人往往是比较关心自身健康或自觉有某种疾病,而想得到检查机会的人。他们的特征或经历不能代表目标人群。由此造成的偏倚称为志愿者偏倚(volunteer bias)。
总之,无论什么原因使观察组与对照组成员不是来自同一总体,即可造成除研究因素以外的有关因素在两组分布不均衡,从而造成选择偏倚。
(二)衡量偏倚(measurement bias)或信息偏倚(information bias)
对观察组和对照组进行观察或测量时存在频度和(或)强度的差异,而使最终判断结果时出现偏倚。在非盲法观察时,由于观察者知道谁在观察组,、谁在对照组,更易出现此种偏倚。
1.回忆偏倚(recall bias)特别是在病例对照研究中,需要被观察者回忆过去的情况(甚至久远的情况,如癌的病因学研究),回忆的准确性会受到影响。病例组可能回忆仔细(特别是当怀疑某因素与某病有关时,如吸烟、被动吸烟与某些癌的关系,口服避孕药与下肢血栓性静脉炎、服雌激素与子宫内膜癌等),而对照组回忆则可能不那么仔细,尤其当研究者屡次提醒病例组有否这些因素时(诱导其回答,更容易出现偏倚-寻因性偏倚)。有时某种症状或状态的存在会诱导产生或加强其与某种因素的联系,如前段所举子宫内膜癌,得出与口服雌激素有联系的结论即属此,称为疑因性偏倚(exposure suspicion bias)。
2.疑诊偏倚当观察者已知被观察者的某些情况时,在研究时会自觉不自觉地侧重询问、检查有关情况(如对服口服避孕药的妇女,仔细检查其有无下肢血栓性静脉炎,而对有下肢血栓性静脉炎的妇女仔细询问其口服避孕药的历史)就可能得出二者有联系的结论。但实际上可能是偏倚所致。
3.沾染偏倚(contaminationbias)对照组成员有意或无意应用了试验组的措施。如用低钠盐减少钠摄入与高血压关系的研究时,对照组成员同样可以购得低钠盐(因接受宣传后认为低钠盐可以防止高血压),从而使判断结果时出现偏倚(沾染性偏倚)。试验组成员有意或无意接受了研究因素以外的措施,而使结果有利于试验组,称为干扰。干扰与沾染最容易在非盲法观察的条件下发生。
(三)混杂(混淆)偏倚(confounding bias)
混杂(淆)因子存在时,在分析结果时可能错误地把某一因素当成某一结果的原因。即是存在混杂偏倚。前节曾谈到混杂因子。
混杂偏倚使研究结论不能反映真实的因果联系。这种偏倚的产生常常是研究者专业知识局限,不了解混杂的存在,或者虽然知道,但忽略了其存在。混杂偏倚常常在资料分析阶段显露出来。因而一旦认识后是可以设法纠正的。
混杂因素:①不是要研究的暴露因素,而是研究过程中常规地被收集起来的(如年龄、性别、吸烟、饮酒等生活习惯),是一个外部变量(extraneous variable);②是对研究的疾病的危险因素,或通过其他危险因素而间接起病因作用;③它与所研究的暴露因素之间有统计学的联系,但二者又是独立存在的。
应结合专业知识去考虑本次研究的结果,可能有什么混杂因素夸大或缩小了其效应指标(RR或OR)。根据可能的混杂因素分析校正的(adjusted)RR或OR(记为aRR或aOR),以与最初所得到的粗的(crude)RR或OR(记为cRR或cOR)比较。如果aRR与cRR或aOR与cOR相近似,则此因素非混杂因素,如相差大则为混杂因素。最常用的方法为按可疑的混杂因素进行分层分析。即是将有此因素的作为一层来比较其RR或OR,而将无此因素的作为另外一层来分析。也可以比较分层前后x2值,此时用Mantel-Haen-szel法比较。如分层前后无差别,则表示分层因素非混杂因素。还可比较分层校正前OR(cOR)与校正后OR(aOR),如有差异说明分层因素为混杂因素。

控制措施:

(一)混杂偏倚
根据专业知识事先找出可能存在的混杂因素,在设计时注意去掉这些混杂因素。混杂出现在两组分配不均匀的情况,因此,尽量做到齐同对比以防止混杂因素的作用。
在资料分析阶段显现出来的混杂偏倚,可以按前节所述的方法加以纠正,如分层分析,也可用多元回归分析及标准化等方法加以处理,以识别混杂因素的影响。
(二)选择偏倚及衡量(测量)偏倚
这些偏倚是在科研设计及观察阶段所产生,主要因为设计不周及(或)测量带有倾向性而造成。带有方向性,不能以加大样本量加以减少,一旦形成之后即无法弥补,很可能需要重新进行。因此,从设计之初就要考虑到各个环节可能出现的偏倚,而加以防止,一般应注意以下几点:
1.设计方案及研究方法的选择应当选择论证强度大的设计方案。
为避免选择性偏倚,首先的设计方案应是随机对照设计方案。有严格的诊断标准和纳入标准的队列研究方案也较好。由于病例对照研究在临床较易执行,因此,较多使用。此时必须注意严格选定有代表性的研究对象(病例及对照),使病例与对照均衡,资料可靠、分析正确,或应用多因素分析方法
2.严格限定纳入标准规定纳入与排除的标准。病例与对照的诊断应有“金标准”。尽可能采取随机分组法。病例对照研究使用配比法,可使病例与对照组有良好的可比性。测量和判定结果时实行盲法,尽量应用客观指标。分析时采用分层分析法及对率进行标准化等等。要有良好的科研作风及严谨的科学态度,争取病人良好的依从性及减少失访率。

‘叁’ 处理selection bias,怎么用stata做

处理选择性问题时,有一部分选择性问题:在可观测变量上的选择性问题可以用Heckman两步法来做,

‘肆’ propensity score原理是什么

一、一种统计方法,即propensity score (PS)倾向指数。在统计分析中,是一种无偏估计的方法。

二、三种倾向分数的应用方法:匹配法(matching )、 分层法( st ratif icat ion or subclassificat ion)以及回归调整法( reg ression adjustment )。

三、其中,匹配法和分层法是在观察研究中长期被用于消除选择性偏差( selection bias)的有效方法。

四、匹配法是从控制组中挑选出个体以匹配处理组被试的方法。从处理组逐次挑选被试,在控制组中寻找与此被试的倾向分数最为接近的全部被试。

五、再随机从抽取出的全部被试中抽取一个或多个作为处理组被试的对照被试。这种方法常用于处理组被试数量较少而控制组被试数量较大的情况。

六、分层法是将被试按照倾向分数的一定标准区分为若干层, 在不同层次的倾向分数上,均衡其他特征变量从而实现处理组和控制组之间的比较。

七、研究发现,采用五等分的分层法可以有效的消除倾向分数模型中所有特征变量 95%的偏差。

八、回归调整法是将倾向分数作为一个协变量,引入回归方程,再来探讨分组变量与因变量之间的关系。

(4)selectionbias解决方法扩展阅读:

倾向评分匹配(Propensity Score Matching,简称PSM)是一种统计学方法,用于处理观察研究(Observational Study)的数据。在观察研究中。

由于种种原因,数据偏差(bias)和混杂变量(confounding
variable)较多,倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响,以便对实验组和对照组进行更合理的比较。

这种方法最早由Paul
Rosenbaum和Donald Rubin在1983年提出,一般常用于医学、公共卫生、经济学等领域。

以公共卫生学为例,假设研究问题是吸烟对于大众健康的影响,研究人员常常得到的数据是观察研究数据,而不是随机对照实验数据(Randomized
Controlled Trial
data),因为吸烟者的行为和结果,以及不吸烟者的行为和结果,是很容易观察到的。

但如果要进行随机对照实验,招收大量被试,然后随机分配到吸烟组和不吸烟组,这种实验设计不太容易实现,也并不符合科研伦理。

‘伍’ 政治问题

本文先从一个比较宏观的角度,讨论民意调查的科学基础、民意汇集功能与限制,尔后再循序导入我国政府首长施政满意度调查的个案分析,进而从方法学和民意调查的政治功能两个面向,来反思当前政治民意调查或施政满意度调查所引发的争议问题。本研究发现目前的政府首长施政满意度调查,仍旧面临许多技术面的难题,例如施政满意度的概念制作与问卷设计、电话簿的编制架构与行政区不一致、电话调查系统的抽样架构涵盖率偏低及其衍生的问题等,这些因素相当程度限制了政治民意调查的科学描述、解释及预测能力。更有甚者,在调查技术尚待精益求精、寻求本土化突破之际,国内对于民意调查的操作与解读经常偏向政治上的考量,充斥着结果论、简化论、信赖叙述推论和至上论等迷思。本文最后提出重建政治民意调查的公信力,首要在于还给施政满意度调查一个独立自主的运作空间,避免政治力量或商业利益的不当侵扰,并将其制度化为政府例行业务的一部份,定期实施各种民意调查来昭信于社会大众。
政治民意调查与商业领域的市场调查不同,这类调查旨在探求民众对于公职选举的候选人、重要政策议题或者政府首长施政满意度的看法。除了各类型的选举调查之外,首长施政满意度是目前最常见的政治民意调查主题。民意调查基金会在民国七十六年公布总统和行政院长的施政满意度调查,开启国内有关政府首长声望调查的风气之先,稍后也陆续引起其它民意调查机构的注意与跟进。归纳言之,目前常见的政府首长施政满意度调查,是近似于英美西方国家对政治人物所实施的一种声望调查(popularity polling)。这类民意调查通常以行政首长的整体施政表现, 或者民众对于重大政策的反应为观察焦点,但部份的调查也会伴随中央各部会首长的职务表现评估。

相较于西方的施政满意度调查一般只限于最高行政首长,我国也针对各部会首长进行职务表现的评比,这是英美国家相关的民意调查较为罕见的现象。就落实主权在民所揭示“民之所欲,常在我心”的理想而言,本文认为施政满意度调查不仅是一种具有科学及专业性的民意反映途径,同时也是衡量政府首长民意支持度或认同感的重要工具。然而,就民意调查的设计与执行而言,政府首长施政表现的评估,本质上是一个相当抽象而且复杂的议题;常见的问题包括:首长的知名度经常与其施政表现的评价相互纠缠不清,受访者对政府首长的施政评价,也经常与其个人的感觉或印象相互混杂(傅恒德,民88 年)。若是如此,首长的施政满意度评估是否即等同于个人的知名度或印象调查?施政满意度调查的结果又能否客观地反应政府首长实际的施政绩效?把不同性质或功能定位的政府首长一起做调查,并将评比结果加以排序比较是否具有意义呢?随着政府首长施政满意度调查日益普遍化之后,这些争议将更值得学术社群与实务界的民调工作者加以正视。

本文以国内近两年来主要学术机构和传播媒体的民意调查中心, 针对各级政府首长所进行的施政满意度调查为观察对象,透过次级数据(secondary data)的比较分析,来探讨相关的民意调查在研究设计与调查执行上的优缺点。在一个多元、开放竞争的社会,民意调查已逐步建立影响政府决策的地位;不仅是许多从政人物搜寻和掌握民意脉动的重要途径,同时也由于探讨主题的敏感性和希望调查结果能具有统计上推论的价值,这类民意调查的争议性通常远高于那些以探求消费者购买意愿为宗旨的市场调查。基于此,本文以下先从一个比较宏观的角度,讨论民意调查的科学基础、政治功能与限制,希望为当前的施政满度度调查提供一个评估与对话的基础。尔后再循序导入我国政府首长施政满意度调查的个案分析,探讨这类民意调查在研究设计上的优缺点。最后,从方法学和民意调查的政治功能两个面向,来反思我国政府首长施政满意度调查所引发的各种争议。

贰、民意调查的科学基础

政治学者指出民意(public opinion)是所有个人意见的总和, 政府对于这些意见有必要慎重留意并纳入决策时的参考(Key, 1961; Ranney, 1993: 123)。难怪许多民主国家和政治人物,都将民意视为一股强劲的政治力量,深深左右该国的政治运作。虽然民意经常是分散、游移不定、甚至于相互冲突,但是拜信息科技快速发展与统计抽样原理之赐,计算机辅助电话访问系统(Computer-Assisted Telephone Interviewing System, 以下简称CATI)大量被运用于民意调查(public opinion polls)的领域,使得掌握民意脉动的梦想愈来愈有实现的可能性。

在媒体和学术机构广泛涉入下,民意调查似乎已成为当代政治生活的一部份,特别是选举前夕接踵而来的电话调查询问民众:假如明天投票,你(你)会支持那位候选人?百家争鸣的民意调查不仅引起社会各界许多的争议和讨论,同时也更令民众困惑于各项调查结果的参考价值。常见的疑惑包括:受访的民众是否具有代表性?主持调查的机构是否公正客观?有些民众无法联络上或者拒绝合作所显示的无响应问题(non-response problem),是否会造成抽样调查结果的偏差?民意调查是否会沦为候选人文宣造势的工具, 企图来影响一般选民的投票行为?以及为什么民意调查的预测,似乎总是与选举结果有相当的出入?

目前流行的政治类民意调查,是否称得上具有科学的基础呢? 从统计学原理和调查方法的角度来说, 答案应该是肯定的。当代的民意调查经常是利用抽样程序,从母体(population)随机选取样本(samples)来征询民众对某些公共议题的意见;相较于志愿响应的样本时常存在偏差,随机样本最大的优点是具有公正不偏性(郑惟厚,民87 年:10)。一般而言,严谨的随机抽样设计可以产生具有代表性的样本,使得意见调查的分析结果能够进一步推论到母体的整体实况。

采取抽样调查的原因,不仅在于普查(census)的程序既费时又太昂贵,同时也由于实地进行测量时,抽样调查的总和误差(total errors)一般较普查来得低(Singleton and Straits, 1998:137 )。再者,问卷设计上必须符合调查研究的专业要求,也在在反映出民意调查的科学性;例如问卷题目的用字遣词应避免过于艰涩难懂、笼统模糊,甚至使用一肩两担式问题(double barreled questions)或者掉入引导性或负载式问题(leading or loaded questions)的陷阱,同时也应注意问题选项的穷尽性和互斥性(exhaustive and mutually exclusive) (杨国枢等,民78 年;赖世培,民85 年)。换言之,唯有遵从问卷设计的各项要领与原则,才能确保民意调查工具的信度(reliability)与效度(validity)。1

其次,根据Singleton and Straits(1998)科学性质(nature of science) 的观点, 民意调查的科学基础可以分别从产品面(science as proct)和过程面(science as process)来加以评估。就产品面的特征而言,民意调查所提供的信息应该具备某种程度的描述(description)、解释和预测(explanation and prediction)以及理解(understanding)等功能(1998: 21-28)。然而,在实务上,不同学科所展现的理论功能具有一定的高低层次性,可以达到较高层次功能的科学知识,其理论建构的严谨程度也就愈高。

当中描述的功能要求民意调查能够使用自己独特的概念,来叙述一般民众对于特定议题的认知或态度;例如,美国总统的声望调查可以用来反映最高行政首长施政表现的民意支持度(approval rating)。解释或预测的功能则表现于某些经验法则(empricial rule) 是可以成立的前提之上, 亦即某一个变量(variable)的变化, 将会影响另一个变量状态的改变(Babbie, 1998)。根据过去的选举经验法则,在民调获得高支持度的候选人,通常会有较大的当选机率。基于此,台湾选举所谓的“西瓜效应”建议,为避免将选票虚掷在当选希望渺茫的参选人身上,选情被看好的候选人往往在投票日前,较容易获得游离或未决定选民的青睐。

理解功能的实现, 则建构在确定的因果关系(causal relationship)基础之上,这种因果关系必须同时兼顾统计上的关连性、影响方向确定以及可以祛除假性关系(non-spuriousness)等三项条件才能达成(Nachmias and Nachmias, 1995)。由于成就因果关系的条件过于严苛,一般的调查研究通常无法同时满足前述的要求。英美国家的投票行为研究虽然常假设,现任者的施政满意度与其当选机率是呈现统计上的正相关,但由于影响选民投票取向的因素众多,欲期建立一个选民投票行为的因果关系模式,事实上相当不容易。具体的事例如,陈水扁先生在民国八十七年寻求连任台北市长的选举,虽然他在历次的选举民意调查一直享有高度的市政建设满意度和选民支持率,但可能出于省籍情结的因素和恐独选民的危机意识作祟,终究不敌国新两党支持者合流所产生的围堵效果, 以致于不幸高票落选。显示了突出的施政满意度本身,并不必然可以保证当选连任。

就过程面而言,一项民意调查的执行必须妥善响应经验主义(empiricism)、客观性(objectivity)以及控制(control)等重要原则(Singleton and Straits, 1998: 28-34)。延续六0年代逻辑实证论者的观点,经验主义强调应该经由人的感官直接或间接加以观察,来理解周遭世界现象的一种研究途径;相对的,诉诸于直觉或权威所获得的信息并不是科学的证据,经验主义认为只有可以观察的(observable)事物,才能成为科学研究的题材,观察结果同时也必须具有测量上的意义(胡佛,民87 年;杨国枢等,民78 年)。由于政治类民意调查经常以选举、公共议题以及首长声望为研究对象,透过抽样设计和电话访问程序来测知民意的动向,显然是符合上述经验主义所谓可以观察、并具有测量意义的原则。

其次,就专业伦理的规范而言,政治民意调查本来应以探求民众真实的态度取向为最高鹄的,希望公共政策的制定能有助于实践多数人共享的公共利益;然而,政治过程却经常涉及各种社会价值的权威性分配, 政策利害关系人(policy stakeholders)又难免从本位主义的立场,来操作及解读相关的民意调查结果,以实现个人的信念或政治利益极大化为职志,致使民意调查的工具价值(instrumental value)可能凌驾于前述实质理性的目标之上。因此,客观性的原则着重调查过程中,研究者必须尽量维持公正客观,避免个人的认知、情绪、利益或价值不当介入民意调查的设计与执行,并且透过交互主观验证(inter-subjective testability) 的程序来获得相对客观(relatively objective)的结论,以代替绝对客观(absolutely objective)事实的追求(Babbie, 1998)。交互主观验证的程序是以多数的意见趋势为基础,这与民主多数决的原理也相互吻合。

最后,控制的原则在于侦察民意调查过程各种可能的误差或偏差(errors or bias),并且采取有效的作为来降低这些干扰因素(confounding factors)的不当影响。一个劣质的调查研究设计可能受到选择性偏差(selection bias)的干扰,不管它是来自一种自我选择的偏差(self-selection bias) 或者是萃取精华的偏差(creaming bias);2 例如许多叩应(CALL-IN)民意调查偏向于是自愿响应的样本,响应意见的民众代表性令人怀疑,调查结果的参考价值自然不高。

其次,从事问卷设计时应注意问题的措词须尽量清楚明确,不可以一题两问或者使用引导性及负载式的问题叙述,题目或选项的排列顺序是否会对调查结果造成不同的影响。这些属于测量工具方面的偏差因素必须积极处理,才能维护民意调查结果的准确度及可靠性。

综合言之,民意调查是属于社会科学研究常用的一种调查研究法(survey research),这种方法系针对特定的公共议题,通常以随机抽样程序选取具有代表性的样本,再借由预拟的问卷题目来征询民众对于某些议题的认知或看法。根据统计推论的原理,一项严谨设计并加以执行的民意调查通常具有“鉴微知着”的功能,所提供的信息可以作为描述、解释和预测特定事件结果的水晶球。然而,民意调查的实施过程存在相当大的模糊地带和不确定性,任何无心的疏忽或者有意的操纵都可能带来严重的偏差,使得预测结果与事实之间充斥“差以毫厘、失之千里”的现象,也因此一项科学的民意调查必须妥善响应经验主义、客观性以及控制等原则。

参、民意调查的意见汇集功能与限制

以下先叙述民意调查在汇集和反映民意所担负的政治功能,然后再谈民意调查在政治过程中运作的限制。

一、民意调查的意见汇集功能

随着民意左右当代政府运作的程度日益深化,民意调查在政府与人民之间扮演的桥梁角色也就愈来愈重要;尤其是面对民意如流水的多变与复杂特质,具有科学基础的民意调查理想上是探求人民希望政府采取那些行动,使政府能够迅速响应民众偏好的一种工具。相较于其它的民意表达或利益汇集的途径,如定期选举、议会制度、大众传播媒体、政党和利益团体各自拥有不同的缺憾,民意调查所具备的科学性、时效性、代表性和客观性,几乎使它成为现代民主社会生活的一部份(周祖诚,民87 年:74)。根据相关文献的分析,民意调查的政治功能至少表现在对于选举、政策议题以及政治人物的声望调查等三方面,分别说明如下。

民意调查在一九三○年代发源自美国,直到五○和六○年代才开始与美国总统选举结下不解之缘。许多总统候选人发现,民意调查的信息在协助掌握选情动态、区隔选民市场以及拟定竞选策略上具有很高的参考价值。约翰甘乃迪 (John Kennedy)是将民意调查应用在总统选举的个中翘楚,他当选之后并让民意调查专家(pollster)成为白宫的正式职位(Jacobs and Shapiro, 1994: 528)。台湾地区的选举调查是在政治解严之后才逐次发展出来,成为部分候选人或政党从事选情研判的重要工具;民国八十五年首次公民直选总统的过程中,民意调查在反映选情的角色着力日深;公元两千年总统大选前夕,白热化的总统选情调查,更是社会各界掌握各组参选人民意支持度的主要讯息来源。

选举调查的政治效果主要取决于,民意调查结果是否会对选民的投票行为产生关键的影响。例如未决定选民(undecided voters)是否会因民意调查转而支持较可能当选的候选人,或者逆向操作去支持声势落后的参选人。以美国的总统选举为例,目前并没有确实的证据显示前述的胜选列车效应(bandwagon effect) 或者同情效应(sympathy effect) 会出现(Ranney, 1993:130)。至于美国西岸的选民因与东岸时间差距三个小时,晚些结束投票是否会因东岸和中南部的选举结果,先经媒体揭晓而降低投票意愿呢?虽然目前没有充分的证据支持,但迹象显示部分投票意愿不高的选民可能会受到影响(Ranney, ibid.)。

就台湾选民的投票行为观察,有趣的是未决定选民最后选择偎大边的“西瓜效应”现象似乎存在,使得选举调查在激烈选战中的策略性角色愈趋于白热化,部分参选人可能借由操纵“假民调”的方式,来干扰选民投票取向的疑虑经常涌现。现行公职人员选举罢免法,明文禁止在选前十天内公布选举民意调查结果,虽不免有剥夺民众意见表述自由或借由民意调查来了解选情变化的缺憾,但是在目前民意调查机构良莠不齐、社群成员又缺乏自清自律的专业伦理规范下,诉诸于法律禁止规定的外控途径,似乎也是沈淀劣质民意调查在激昂选情中喧嚣的必要措施。

其次,民意调查也经常扮演征询民众对于特定公共议题的看法,以作为政府决策参考的角色。许多位美国总统与民意调查的关系至为密切,他们素来相当倚重民意调查专家的操盘来进行重大的决策;例如甘乃迪借助于哈利斯(Louis Harris)的民意调查来决定他的民权和外交政策(Reeves, 1993);尼克松在七0年初经由一系列民意调查最后才做成他的经济政策,还有工资与价格管制的政策决定(Jacobs and Shapiro, 1995);布什更是一位非常敏感于民意调查结果的总统,他的扫毒政策由原来的减少毒品需求转变为强力扫荡贩毒的措施,只因为提特(Robert
Teeter)的调查显示民众是支持铁腕的政策(Duffy and Goodgame, 1992);克林顿总统则仰赖格林堡(Stanley Greenberg)所设定的电话调查系统,来探求民众对总统经济政策的看法,使得修正后
的经济政策能够在国会获得高度的支持(Woodward, 1995)。总统在作决策时为何如此重视民意的动向呢?这可能与总统需要民意的强力支持来推动政策有些关连。学者郭汉即指出:总统若愈需要大众的支持,就愈有必要注意民心的向背(Cohen, 1997:14)。直言之,总统重视民意的反应不仅有助于提升他的政治声望,同时也可以增强与国会议价协商的地位,进而促使总统在
推动政策的合法化,以及实践政治目标的能力大为提升。

最后, 民意调查也好比是一支政治温度计(political thermometer),可以用来衡量行政首长的政治声望甚至于民意支持的高低。以美国民意调查的运作为例,总统声望的上下起伏一直被主要民意调查机构严密追踪,并且在一个长期观察的基础上被用来评估总统的职务表现,使得民意调查浸染成为华盛顿政治文化的重要内涵。约翰逊即是一位相当娴熟于民意调查事务的总统,据说他会把近期的声望调查数字随身放在口袋作参考(Altschuler, 1990)。不过各国公职人员声望调查的作法,可能跟随政府体制的特性而有所差异。在美式的总统制之下,许多民意调查一般只是针对总统的施政表现而来,却不对阁员进行个别的声望调查; 英国的民意调查机构对政党声望的重视程度,通常远高于行政首长的声望调查;法国属于双重首长制的国家,因此声望调查的对象同时包含总统和内阁总理两位重量级人物;我国的施政满意度调查经常一并兼顾总统、副总统及各部会首长等三种对象,是属于较为少见的例子(周祖诚,民87年:75-76)。

二、民意调查在实务运作上的限制

理想上民意调查在政府与人民之间可以担负重要的沟通功能;然而,值得注意的民意调查的运作却也经常面临许多内外在的限制因素。内在限制(intrinsic constraints)泛指,执行民意调查过程所涉及的各种概念制作、问卷设计、抽样以及调查实施上的技术面问题,这些问题大致属于民意测量工具本身未臻成熟而衍生的误差或偏差; 外在限制(extrinsic constraints)指称,民意调查在与政治过程从事互动之后所产生的各种问题,例如机构特性的影响、政治因素不当介入的干扰、选举调查的政治化倾向、民意调查对公共政策影响的局限性等。由于政治民意调查旨在透过探求选情、了解民众的政策偏好和政府首长的声望试图来左右政治过程,因此在多元利益交织的政治场域中,势必难以维持其原有的中立客观立场,这是社会各界在解读与运用政治民意调查时需要深思的课题。

就内在限制的因素而言,目前各家民意调查机构CATI 系统所使用的住宅电话号码簿, 普遍面临抽样架构(samplingframe)的涵盖度偏低问题,约只包含近六成的住宅电话用户。虽然完美的抽样架构极其少见, 通常都会有未登录(non-coverage)、空白或重复登录(blank or plicated coding)等缺失(陈膺强,民83 年:62-65),但那些被遗漏的住宅电话用户是否存在某种系统性的偏差(systematic bias),并足以干扰到调查结果是吾人所应关切的重点。其次,问卷设计上题目的叙述方式也可能影响到调查结果。曾经有一个民意调查询问美国人民:政府是否应该在社会救助政策上投入更多?若问题的措辞使用”穷人”而非”依靠福利过日的人”,赞成增加投入的比例明显高出甚多(Ranney, 1993: 129)。无响应(non-response)问题是目前抽样调查所面临的最大挑战,因为无响应问题造成的偏差很容易就超越信赖叙述(confidence statement)所谈的随机抽样误差的范围(郑惟厚,民87 年:39)。最常发生无响应的原因是联络不上受访者或受访者拒绝合作,这种情况下的电话调查是否会引入选择性偏差(selection bias),有系统地排除某些预定受访对象如穷人、摊贩、夜间或流动工作者等不容易联络上的族群,或者遗漏主观上较倾向于拒答者的意见,进而影响随机抽样程序的严谨性及样本结构的代表性,都是日后从事民意调查时值得密切观察的议题。

再就外在限制的因素而言,机构的特性可能会左右民意调查的处理方式,致使民意调查的科学性或实用价值随着情势的变迁而衰减。以政府部门、学术机构和新闻媒体三者来说,政府部门的民意调查通常关心访问主题的相关性与政治含意,强调民意调查结果的政治可欲性(political desirability)远高于对调查过程科学规范的坚持;学术机构的调查一般重视技术的完整性(technical integerity)和学术研究的价值,因此难免与政治圈内利害关系人的信息需求无法相契合; 新闻媒体从事的民意调查,倾向于强调新闻价值与时效的重要性,因此在题材的选择上经常是事件取向,对于调查方式与结果的处理也会考量时间的因素。基于访问的便利性,虽然CATI 已成为国内媒体最常采用的民意调查工具,但在争取时效和针对特定新闻事件做出及时的反应等期望下,调查访问的对象、完成的有效样本数和品质有时难免会受到牵累。

其次,虽然民意调查本意想借由提供相关的信息,来影响政治过程的运作,但是这项科学工具也可能因政治因素不当介入而遭受反向的操控,进而提供一些伪劣假冒的讯息来干扰社会大众的判断。以近年来台湾选举中常被讨论的西瓜效应和弃保效应为例,假若候选人对西瓜效应发酵的危机感愈趋强烈,选举调查的政治化倾向即可能升高,声势落后的参选人往往亟欲由操纵民意调查或散播耳语等途径来摆脱边陲化的印象,以避免选民偎大边的西瓜效应涌现而使自己提早出局。另外,弃保效应指称当所支持的对象胜选希望渺茫时,有些选民会放弃最爱改投当选机会较浓的候选人,来预防最不喜欢的竞争者最后夺魁的一种策略投票行为(strategic voting)。族群之间的省籍情结或者惧怕台独引发战争的心理因素,经常是激烈选战中弃保效应滋生的温床,在选情信息不完全、有弃保倾向的选民渴求参考讯息的情况下,各竞选阵营越可能顺势操纵民意调查的数据,来诱使有利于己的弃保效应发酵。公元两千年的总统大选过程,“宋出局”或“连老三”盈篇累牍的文宣广告,即是为了发动弃保效应战略的显例;换言之,选举调查被视为竞选策略或政治工具的诱因大幅增强,民意调查已不再是反映民意脉动的中性调查工具。

最后,民意虽然对政治过程具有一定程度的影响力,但过度夸大民意调查在决策制定过程的主宰地位, 则可能失之偏颇。部分的原因来自于吾人不能将“民调”等同视为“民意”;由于任何的民意调查都会面临不表态或拒答者的威胁,因此无论民意调查技术再怎样的精进突破,都很难精确掌握尚未表示意见者的态度意向,使得调查结果在表彰整体民意的功能受到限制。其次,民主国家的行政首长即使经常阅读各种民意调查的数据;然而,这些讯息所反应的民意毕竟只是影响政府决策的因素之一,而非全部分(Ranney, 1993: 130)。以美国政府为例,总统作决策时可能受到他的治国理念、世界观以及寻求历史上的地位等因素所左右;在另一方面,总统也可能相当关心公共政策的作为与实际绩效;总统甚至于可能透过演说或其它的策略行为,来引导和塑造民意的走向(Cohen, 1997: 164)。换言之, 政府首长的决策动机与目标事实上涵盖相当广泛的因素,无法单独以民意化约主义的观点来加以诠释;同时民意对公共政策的象征性影响可能多过于实质上的意义,总统虽然不见得会真正依循舆情的动向来行事,但行政首长至少希望能赢取重视民意的名声。

肆、政府首长施政满意度调查的个案分析

近两年来许多新闻媒体或学术机构附设的民意调查中心,曾分别针对萧内阁或者地方政府县市首长进行一系列的施政满意度调查,为国内的政治民意调查开拓另一番新气象。根据本研究访查结果,联合报和TVBS 的民意调查中心在这方面的投入较为积极,约每季对萧万长院长及各部会首长进行一次施政表现的总体评估,其它如中央通讯社或世新大学的民意调查部门,也曾数度举行萧内阁的施政满意度调查。此外,施政满意度调查的对象也逐渐扩及到地方县市政府及其行政首长,例如远见杂志和TVBS 民意调查中心所执行的各县市首长施政表现的评价,东海大学和传讯电视分别针对中部五县市政府首长和桃园县府团队,曾实施不同型态的施政满意度调查较具有代表性。3 部分政府机关如行政院研考会或新闻局,虽然也相当重视政府首长施政满意度调查的议题,但这些机构通常根据媒体报导和舆情数据分析来了解民意的动向,只有少数个案才会以委外研究的方式进行大规模调查,调查结果也仅供内部参考并不对外公布。

‘陆’ Excel中如何使用VBA的选择语句Select但却不触发SelectionChange事件

在代码最开始增加一句:
Application.EnableEvents = False

代码结束前增加
Application.EnableEvents = True

关于此处用到的EnableEvents的相关知识:
Application.EnableEvents=False
操作代码
Application.EnableEvents=True
这样可以屏蔽事件程序的暂时运行,以达到不会反复触发事件程序,造成死循环

‘柒’ 论文的局限性怎么写

在研究的过程中,有各种原因可能会导致研究产生局限性,这些原因主要可以分为两个部分: 由于研究方法论或是由于研究人员本身。若论文中发生方法论相关的研究局限性,可以直接清楚的指出潜在的问题,并提出建议改善的方法,这部分必须在”future studies”中更进一步讨论。

以下是关于方法论可能会产生的问题,以及这些问题对研究结果可能造成的影响:

当使用概率抽样/随机抽样(probability sampling)时,有可能所抽样的样本无法代表所研究的母体(population),这时研究则会产生与统计“sample bias” 或 “selection bias”(选择性偏差)相关的问题。

例如,当使用问卷调查来获得研究结果时,我们会要求样本(问卷答题者)回答问卷上所列出的问题,但是,如果无法接触到合适的问卷答题者,或是所涉及地理区域不够广泛,在这些情况下,所选取的样本(问卷答题者)则不能够算是随机样本(random sample)。

当进行研究并且希望获得有效的研究结果时,充足的样本数是非常重要的。样本数越大,研究结果便越精确。但是当样本数不够大的时候,便较难使用有限数据来证明研究内容的显着相关性。

通常在进行统计分析时,较大的样本(sample)数较能代表母体(population),因此通过分析所得到的结果,也较能在母体中套用。若不知该如何选取适当的样本数,建议可以参考scientific calculation tools

在从事研究时,应引用过去的文献内容作为该研究的基础,回顾文献可以为研究主题提供理论基础。但是,由于研究主题涉及范围的不同,相关的文献也可能较为有限。

当研究主题相关的文献不够充足时,也许必须发展一个新的研究框架或理论。在这个情况下,过去文献的不足反而可以做为发展研究空白(research gap)的契机,并且可以借此提出相关领域未来研究方向的建议。

当撰写完研究分析结果(在讨论Discussion部分),你也许会发现所使用搜集资料的方法限制了全面分析研究结果的能力。

例如,也许你发现某个问卷中的问题应该以其他观点来陈述,或者你忽略了某些重要的问题而未包含在问卷中,这时,必须在”研究局限性”中提及这方面的不完善,并且指出未来研究中可以通过何种特定的搜集资料方法,来解决这个问题。

(7)selectionbias解决方法扩展阅读

论文写作中添加有关研究局限性的描写有助于增加文章的可信度。如果审稿人发现某一局限,但是作者未事先说明,审稿人可能会对论文产生负面印象。如果在未来的研究背景下讨论论文的每个局限性,文章更有可能被引用,因为它将为其他研究人员的研究问题提供有价值的信息。

另外,提及研究局限性也表明我们已充分的考量过研究的不足之处,以及我们对自己所研究的主题有着充分的了解。既然所有的研究都难免会有局限性,那么比起刻意忽略这部分,诚实并且详细的在论文中提出来,反而能更加给审稿人及其他研究人员留下好的印象。

‘捌’ 姜凯的中华对冲基金的问题

姜凯的投资业绩记录乍一看确实非常令人吃惊:从1998年8月起至2009年12月,该基金累计回报率是3300%,也就是说,投资人的钱在这11年中翻了33倍,年平均回报率是37.1%。在相同的时间段里,代表被动投资的标准普尔500指数(S&P 500)累计回报21.5%,年平均回报率是1.7%,简直就是乌龟爬行。与姜凯“同类”(peer group)的股票对冲策略指数(HFRI Equity Hedge Index)累计回报161.5%,年平均回报率是8.8%,可以算是快马飞奔。相比之下,该基金简直就是卫星上天了!据国内某媒体报道,他还为篮球飞人乔丹(Michael Jordan)和美国名嘴奥普拉(Oprah)理财。彼实为天才乎?

在头两年(1998的8月至12月和1999全年)该基金分别获得168.7%和137.6%的回报率。如何看待这样炫目的成绩?首先我们要知道,公募基金(mutual fund)受证监会监管,必须定期公布业绩并且在证监会备份,而对冲基金的业绩资料都是对冲基金们自发上报给商业性数据库的,从什么时候开始上报,完全由对冲基金经理们自己决定。这就导致业绩数据带有一个“选择性高起点”倾向(self-selection bias)。中华对冲基金什么时候开始运作,什么时候决定开始上报业绩?投资人必须要问这个问题。因为假如投资人是在看到这两年光辉业绩之后再开始让他打理投资,回报率就大打折扣,虽然仍较可观,但绝对不再是惊世骇俗级别的了。

同时大家应该也记得,在1998至2000年间,互联网泡沫膨胀,谁炒股谁就业绩显赫,谁投资谁就落后得惨不忍睹(尤其是那些老老实实哼哧哼哧研究行业公司基本面的,包括股神巴菲特在内),不少散户因为资本金基数低,都能获得百分之好几百的回报(中国A股市场的股民对这种现象应该也不陌生),一点也不令人奇怪。后来的投资人必须要了解,姜凯那两年里的三位数回报是在多大的资金规模基础上取得的?在最近5年内,该基金的业绩一年不如一年。假如你是从2007年开始投资该基金的话,到2009年底时你还是亏钱的。特别令人不解的是2009年的前9个月该基金累计回报是负数 (-2.51%),而几乎所有的对冲基金策略指数在同期内都是两位数级别的正回报率,标准普尔500指数这只乌龟都领先该基金若干个百分点。种种因素表明,该基金头两年的业绩当属“界外值”(outlier),其平均年化回报率因为这两个数值而明显高估。

该基金与全球各主要股票市场的相关性低得有点“不食人间烟火”,而它与卖空策略基金平均指数(HFRI Short Bias Index)又是负相关(因此卖空对冲不是它达到低相关性的主要手段)。要知道,金融巨骗马多夫的策略就是和什么东西都不显示相关性。

最能体现对冲基金经理投资能力的是熊市。牛市里阿狗阿猫都能赚钱,熊市里能“东方不败”的才是真正的高手。我把摩根士丹利亚太(除日本外)指数历史数据分成“正回报”和“负回报”两组,分别代表牛市和熊市,然后用回归分析计算中华对冲基金在牛市和熊市里与大市的相关性。结果显示,在牛市和熊市里该基金与大市都具有实质相关性(statistically significant correlations),也就是说股市往上它也往上,股市下跌它也下跌,显示该基金“对冲”不够,控制风险的能力稍逊一筹。2008年是“黑天鹅”降临的一年,该基金当年亏损12.7%,好于标准普尔500的亏损37%。然而,从8月至12月,该基金连续亏损总计50%,把上半年的获利全部“抹杀”。很多股票对冲基金经理都没有逃过2008年这一劫,有的年度业绩甚至还不如中华对冲基金,但是他们要么及时撤离市场,保留实力,要么加强对冲机制,缓解下跌风险,没有像中华对冲基金那样连续5个月“坐以待毙”,以至于一年之内业绩大起然后大落。

一番谷歌网络之后,我找到最早中文媒体报道姜凯的文章,是2007年8月南方人物周刊的“姜凯:我为乔丹和奥普拉理财”。把乔丹和奥普拉抬出来,不知道是否经过两位名人授权。一般来讲,公开透露客户是为高端客户理财的职业忌讳。另外,乔丹的身家好几个亿,奥普拉更是个超级大富婆,该基金全部资产也只是他们身家的小小零头,说是为他们理财,恐怕不能算是准确的说法。像这样级别的高端客户,一般都有专门的团队为他们理财决定什么时候投什么。确实,对冲基金在美国高端客户的投资组合中占的比例较高,但是中华对冲基金这样的高风险“牛角尖”策略(niche strategy)很难被大面积接受,也容纳不了太多的资金(limited capacity)。该基金专注的投资范围——中国在海外上市的股票——非常狭窄,超额收益α的潜力相当有限。所以这种投资策略的规模无法增加,不会成为主流产品。投入资金一多,就会影响收益。这就好比一个游泳池又浅又小,再厉害的泳将也无法彻底施展拳脚,要是池子里人再多一点,就压根没法游了。姜凯在采访中也表示,他的基金规模不大,若干年前还退还投资人资本,正是说明了这种策略的局限。

同时该篇报道中提及他“创立中华对冲基金(原名龙基金)时才24岁,是最年轻的对冲基金经理,更是该领域首位华裔”。这种说法经不起推敲。在美国,成立任何一种企业,包括对冲基金,都不是什么难事——到相关部门登个记,缴注册费就行了。对冲基金领域来自中国内地的华裔人士数量众多,姜凯绝不是首位。

最耐人寻味的是,从2010年1月起,中华对冲基金已经停止向主要对冲基金数据库上报业绩。晨星公司(Morningstar)的数据库显示,中华对冲基金管理的资产从2005年的1000万美元上升到2006年最高点8500万美元,然后开始下降,2008年底为5200万美元,2009年底只有1400万美元。这样的资产规模令人对该基金的生存状态担忧。

美国证监会高级政策顾问理乍得布克斯特伯(Richard Bookstaber)最近总结了问题对冲基金的七大症状,很值得大家牢记。第一条,对冲基金的业绩由基金经理“自报家门”,未经第三方审计。第二条,基金业绩大转弯无法解释。第三条,衍生品(derivatives)使用增加(衍生品往往被用来掩盖基金实际操作中的缺陷)。第四条,基金策略“神秘化”,没有人搞得懂基金的投资哲学、过程和方式,到底在投资些什么东西。第五条,基金公司人员变动,或者基金经理的生活方式发生了重大变化。第六条,基金管理资产急剧减少(有人知道你不知道的东西?)。第七条,基金业绩走下坡路(基金投资策略不灵验了?)。

‘玖’ 样本选择偏差(sample selection bias)与幸存者偏差(survivorship

Selection bias is the selection of indivials, groups or data for analysis in such a way that proper randomization is not achieved, thereby ensuring that the sample obtained is not representative of the population intended to be analyzed.

而 servivorship bias 是即便你的sample 是通过科学的和完全random的一样会存在的情况,比如说你分析金融危机过后各种基金的回报情况时候 即便你是完全随机抽样,你还是选不到那些已经挂掉的。剩下的本来就相对优质。

阅读全文

与selectionbias解决方法相关的资料

热点内容
六字诀快速练习方法 浏览:854
获得金属单质常用的方法 浏览:316
用什么方法止痒好 浏览:631
瘦肚子后背运动方法视频 浏览:186
冬天怎么除甲醛最快最有效的方法 浏览:477
胸部热敷的正确方法 浏览:447
三七食用方法降血压 浏览:690
裁员的方法和技巧 浏览:724
uv胶水的使用方法 浏览:178
淋浴架子安装方法 浏览:492
贴片电容万用表测量方法 浏览:62
婴儿病毒性感冒鼻塞用什么方法 浏览:896
植物进化的研究方法 浏览:486
使用简写方法实现背景图片不平铺 浏览:139
如何自制消灭蟑螂最快最有效的方法 浏览:684
测距仪使用方法视频 浏览:985
在家锻炼屁股肌肉的好方法 浏览:100
西式糕点制作方法图片 浏览:521
正确的刹车排空气方法 浏览:992
火龙果冰粉的制作方法和步骤 浏览:83