导航:首页 > 研究方法 > 利用方差分析筛选特异菌群的方法

利用方差分析筛选特异菌群的方法

发布时间:2023-01-13 05:08:19

‘壹’ 环境微生物群落heatmap图怎么

1. 稀释性曲线(Rarefaction Curve)
采用对测序序列进行随机抽样的方法,以抽到的序列数与它们所能代表OTU的数目构建曲线,即稀释性曲线。
当曲线趋于平坦时,说明测序数据量合理,更多的数据量对发现新OTU的边际贡献很小;反之则表明继续测序还可能产生较多新的OTU。

横轴:从某个样品中随机抽取的测序条数;"Label 0.03" 表示该分析是基于OTU 序列差异水平在0.03,即相似度为97% 的水平上进行运算的,客户可以选取其他不同的相似度水平。
纵轴:基于该测序条数能构建的OTU数量。
曲线解读:
Ø 图1中每条曲线代表一个样品,用不同颜色标记;
Ø 随测序深度增加,被发现OTU 的数量增加。当曲线趋于平缓时表示此时的测序数据量较为合理。
2. Shannon-Wiener 曲线
反映样品中微生物多样性的指数,利用各样品的测序量在不同测序深度时的微生物多样性指数构建曲线,以此反映各样本在不同测序数量时的微生物多样性。
当曲线趋向平坦时,说明测序数据量足够大,可以反映样品中绝大多数的微生物物种信息。

横轴:从某个样品中随机抽取的测序条数。
纵轴:Shannon-Wiener 指数,用来估算群落多样性的高低。
Shannon 指数计算公式:
其中,
Sobs= 实际测量出的OTU数目;
ni= 含有i 条序列的OTU数目;
N = 所有的序列数。
曲线解读:
Ø 图2每条曲线代表一个样品,用不同颜色标记,末端数字为实际测序条数;
Ø 起初曲线直线上升,是由于测序条数远不足覆盖样品导致;
Ø 数值升高直至平滑说明测序条数足以覆盖样品中的大部分微生物。
3.Rank-Abundance 曲线
用于同时解释样品多样性的两个方面,即样品所含物种的丰富程度和均匀程度。
物种的丰富程度由曲线在横轴上的长度来反映,曲线越宽,表示物种的组成越丰富;
物种组成的均匀程度由曲线的形状来反映,曲线越平坦,表示物种组成的均匀程度越高。

横轴:OTU 相对丰度含量等级降序排列。
纵轴:相对丰度比例。
曲线解读:
Ø 图3与图4中每条曲线对应一个样本(参考右上角图标);
Ø 图3与图4中横坐标表示的是OTU(物种)丰度排列顺序,纵坐标对应的是OTU(物种)所占相对丰度比例(图3为相对百分比例,图4为换算后Log值),曲线趋于水平则表示样品中各物种所占比例相似;曲线整体斜率越大则表示样品中各物种所占比例差异较大。
4. 样本群落组成分析:多样本柱状图/ 单样本饼状图
根据分类学分析结果,可以得知一个或多个样品在各分类水平上的物种组成比例情况,反映样品在不同分类学水平上的群落结构。

柱状图(图5)
横轴:各样品的编号。
纵轴:相对丰度比例。
图标解读:
Ø 颜色对应此分类学水平下各物种名称,不同色块宽度表示不同物种相对丰度比例;
Ø 可以在不同分类学水平下作图分析。
饼状图(图6)
在某一分类学水平上,不同菌群所占的相对丰度比例。不同颜色代表不同的物种。
5. 样品OTU 分布Venn 图
用于统计多个样品中共有或独有的OTU数目,可以比较直观地表现各环境样品之间的OTU 组成相似程度。
不同样品用不同颜色标记,各个数字代表了某个样品独有或几种样品共有的OTU 数量,对应的OTU编号会以EXCEL 表的形式在结题报告中呈现。

分析要求
单张分析图,样本分组至少两个,最多5 个。
Ø 默认设置为97% 相似度水平下以OTU 为单位进行分析作图。
6. Heatmap 图
用颜色变化来反映二维矩阵或表格中的数据信息,它可以直观地将数据值的大小以定义的颜色深浅表示出来。将高丰度和低丰度的物种分块聚集,通过颜色梯度及相似程度来反映多个样品在各分类水平上群落组成的相似性和差异性。

相对丰度比例:
热图(图8)中每小格代表其所在样品中某个OTU 的相对丰度。以图8为例,红框高亮的小格所对应的信息为:样本(R11-1Z)中OTU(OTU128)的相对丰度比例大概为0.2%。
丰度比例计算公式(Bray Curtis 算法):

其中,
SA,i = 表示A样品中第i个OTU所含的序列数
SB,i = 表示B样品中第i个OTU所含的序列数
样品间聚类关系树:
进化树表示在选用成图数据中,样本与样本间序列的进化关系(差异关系)。处于同一分支内的样品序列进化关系相近。
物种/OTU 丰度相似性树:
丰度相似性树表示选用成图的数据中样品与样品中的OTU 或序列在丰度上的相似程度。丰度最相近的会分配到同一分支上。
客户自定义分组:根据研究需求对菌群物种/OTU 研究样本进行二级分组
Ø 二级物种/OTU 分组:将下级分类学水平物种或OTU 分配到对应的上级分类学水平,以不同颜色区分;
Ø 二级样品分组:根据研究需要,对样品进行人为的分组,以不同颜色区分。
7. 主成分分析PCA (Principal Component Analysis)
在多元统计分析中,主成分分析是一种简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中对方差贡献最大的特征,从而有效地找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。
通过分析不同样品的OTU 组成可以反映样品间的差异和距离,PCA 运用方差分解,将多组数据的差异反映在二维坐标图上,坐标轴为能够最大程度反映方差的两个特征值。如样品组成越相似,反映在PCA图中的距离越近。

横轴和纵轴:以百分数的形式体现主成分主要影响程度。以图9为例,主成分1(PC1)和主成分2(PC2)是造成四组样品(红色,蓝色,黄色和绿色)的两个最大差异特征,贡献率分别为41.1% 和27.1%。
十字交叉线:在图9中作为0 点基线存在,起到辅助分析的作用,本身没有意义。
图例解读:
Ø PCA 分析图是基于每个样品中所含有的全部OTU 完成的;
Ø 图9中每个点代表了一个样本;颜色则代表不同的样品分组;
Ø 两点之间在横、纵坐标上的距离,代表了样品受主成分(PC1 或 PC2)影响下的相似性距离;
Ø 样本数量越多,该分析意义越大;反之样本数量过少,会产生个体差异,导致PCA分析成图后形成较大距离的分开,建议多组样品时,每组不少于5个,不分组时样品不少于10个;
Ø 图10中的圆圈为聚类分析结果,圆圈内的样品,其相似距离比较接近。
8. RDA/ CCA 分析图
基于对应分析发展的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。主要用来反映菌群与环境因子之间的关系。RDA 是基于线性模型,CCA是基于单峰模型。分析可以检测环境因子、样品、菌群三者之间的关系或者两两之间的关系。

横轴和纵轴:RDA 和CCA 分析,模型不同,横纵坐标上的刻度为每个样品或者物种在与环境因子进行回归分析计算时产生的值,可以绘制于二维图形中。
图例解读:
Ø 冗余分析可以基于所有样品的OTU作图,也可以基于样品中优势物种作图;
Ø 箭头射线:图11中的箭头分别代表不同的环境因子(即图中的碳酸氢根离子HCO3-,醋酸根离子AC-等,图中的其它环境因子因研究不同代表的意义不同,因此不再赘述);
Ø 夹角:环境因子之间的夹角为锐角时表示两个环境因子之间呈正相关关系,钝角时呈负相关关系。环境因子的射线越长,说明该影响因子的影响程度越大;
Ø 图11中不同颜色的点表示不同组别的样品或者同一组别不同时期的样品,图中的拉丁文代表物种名称,可以将关注的优势物种也纳入图中;
Ø 环境因子数量要少于样本数量,同时在分析时,需要提供环境因子的数据,比如 pH值,测定的温度值等。
9. 单样品/ 多样品分类学系统组成树
根据NCBI 提供的已有微生物物种的分类学信息数据库,将测序得到的物种丰度信息回归至数据库的分类学系统关系树中,从整个分类系统上全面了解样品中所有微生物的进化关系和丰度差异。

单样品图(图12):可以了解单样品中的序列在各个分类学水平上的分布情况。

图例解读:
Ø 图12中不同的层次反映不同的分类学水平;
Ø 分支处的圆面积说明了分布在该分类学水平,且无法继续往下级水平比对的序列数量,面积越大,说明此类序列越多;
Ø 每个分支上的名词后面的两组数字分别表示比对到该分支上的序列数和驻留在该节点上的序列数;
Ø 图13中为某单一水平物种分布情况,并非是序列分布。

多样品图(图14):比对多个样品在不同分类学分支上序列数量差异。
图例解读:
Ø 比对不同样品在某分支上的序列数量差异,通过带颜色的饼状图呈现,饼状图的面积越大,说明在分支处的序列数量越多,不同的颜色代表不同的样品。
Ø 某颜色的扇形面积越大,说明在该分支上,其对应样品的序列数比其他样品多。
Ø 多样品在做该分析时,建议样品数量控制在10个以内,或者将重复样本数据合并成一个样本后,总样品数在10个以内。
10.系统发生进化树
在分子进化研究中,基于系统发生的推断来揭示某一分类水平上序列间碱基的差异,进而构建进化树。

‘贰’ 体质造句-用体质造句

1、钢铁者,实为一切实业之 体质 也。孙中山

2、晨跑可以增强 体质 ,晨跑可以改善习惯,晨跑可以强身健体!

3、不要依赖任何人,一个小公司的 体质 是强压和拼命才能锻炼出来的,寄生和依赖只会让自己在风向有所变化的时候死的很惨。

4、体育工作很重要问题就是要增强人民 体质 ,这是一个国家富强、文明的标志。

5、体育运动不仅能改变人的 体质 ,更能改变人的品格。

6、开展体育运动目的是增强人民 体质 。

7、良好的心理素质有益于增强 体质 ,提高抗病能力。

8、最标语式的一句话:发展体育运动,增强人民 体质 。

9、每当逢年过节,过敏 体质 人群常常只能望梅止渴。

10、她 体质 太弱,承受不了太大的重量。

11、因为我每天长跑,不但增强了 体质 ,还能够跑得很快。

12、坚持锻炼,不仅能够增强 体质 ,而且还能延年益寿。

13、从耳朵看 体质 :耳朵厚而大表明肾气充足;反之是肾气亏虚。耳朵肉多骨少,耳垂饱满,表明先天营养状况很好;耳朵肉少骨多,耳垂薄,代表体质先天不足。

14、痰湿 体质 要注意,冬日保持您情绪,平息燥火要务必,澄和心神养生气,保持运动强身体,出汗及时要擦洗,节制宵夜要牢记,祝你健康是福气,快乐总如意!

15、发展体育运动,增强人民 体质 。

16、我很担心他那弱不禁风的 体质 ,如何撑得起全家的重担。

17、锻炼身体不但能增强 体质 ,提高免疫力,而且能使人精神抖擞,容光焕发,以及它可以使自己显得更加朝气蓬勃。

18、推广广播体操,是增强全国人民 体质 的一种行之有效的措施。

19、冬到三九天,多多进补能御寒;寒虚 体质 分开补,羊肉牛肉强筋骨;冬吃萝卜赛过小人参,蛋白质、维生素能补身;早睡晚起养元气,适当锻炼莫忘记!

20、漂唇让你朱唇皓齿动人弦而且一些过敏 体质 的女性,涂上唇膏后嘴唇周围会产生一些过敏现象,不但没有起到美化效果,反而还变得难看。

21、单单他们的吵嚷就足以使 体质 脆弱的人神经错乱。这些吃得饱穿得暖的乡下人,只有在使出两肺的全部力量大叫才能感到那种吵吵闹闹的快乐,才能觉得表达得完全。

22、“发展体育运动,增强人民 体质 ”八个红漆大字因风雨侵蚀而斑驳了。

23、军训,可以增强 体质 ,磨练意志。

24、不放手让孩子去做,犹如血液循环受到阻碍,是会防害孩子增强 体质 的。

25、在我们所教育的人的身上,高尚的道德品质,丰富的精神世界和 体质 的健全发展应当合而为一。教育者的本领和艺术,在于他每时每刻都能够清醒地把握住这种和谐发展的实质。一个共产主义新人,并非所有良好特点和品质的机械堆积,而是他们和谐结合的统一体。

26、不幸的遭遇可以增长人的见解,改善人的心地,锻炼人的 体质 ,使一个青年能够担当起生活的责任,同时能够知道怎样享受人生,这是在富裕的环境中所受的教育万万不能达到的。

27、冬至,股票升值,财运随期而至,冬至,加薪升职,好运纷纷而至,冬至,提高 体质 ,身体健康才有斗志,你是潜力股,加油,我看好你噢!

28、冬季多锻炼,耐寒意志坚。冬泳治病、健身和抗衰,增强 体质 效果明显;跳绳运动简易又方便,还能增强血液循环;体育卫生要注意,适当锻炼身体健。

29、澳门的土生葡人作为中国近现代史上东西方种族混血、民族融合的一个特例,具有欧亚混血的 体质 特征,以及欧亚混合的“澳门土语”及谙熟双语的语言能力,中西合璧的风俗习惯,二元化的宗教信仰和根在澳门的族群意识。

30、冬季身体需调养,优质水果放身旁,香蕉柿子属寒凉,虚寒 体质 切莫尝,注意补水要适量,多喝稀粥胃气养,祝你冬季更健康!

31、预防冻疮,请听良方,坚持锻炼, 体质 增强,注意保暖,切莫着凉,鞋袜舒适,过紧不当;涂搽油脂,护肤提倡,热量食物,不妨多尝,祝你冬季,更加健康。

32、夏季零食好选择,吃出健康和美丽:番茄,维C多多更抗癌;坚果,富含蛋白强 体质 ;茶,奶茶绿茶皆不错;燕麦,营养瘦身更美容。愿你越吃越美丽!

33、冬季感冒要预防,妙招送你为健康:常喝开水利尿排毒,常喝枣姜汤增强 体质 ,冷水洗脸有助耐寒,床头摆薄荷油治疗鼻塞。

34、我们体内如果新陈代谢旺盛,那 体质 一定很好。

35、只要我们坚持锻炼,一定能增强 体质 。

36、在水利水电工程中,爆破块度对堆石坝坝 体质 量有决定性影响.

37、一个 体质 孱弱的民族无论到哪里,文化和经济都不能立足.

38、他宣称左手掌偶有多汗的情形,家人有异位性 体质 。

39、结论子宫肌瘤挖除术患者的手术年龄、 体质 量指数和子宫肌瘤的数目是术后复发的危险因素,术前产次是术后复发的保护因素。

40、此具龙山文化晚期的“小巨人”遗骸的发现,为中国史前人类的“ 体质 人类学研究”提供了丰富宝贵的材料。

41、模拟结果表明,该浇注系统填充过程平稳,温度场分布均匀,所得压铸件气体夹杂和冷隔缺陷少,整 体质 量较高。

42、结果表明:小陇山白皮松以青霉属和曲霉属为优势菌群,土壤整 体质 量不高。

43、某水电站右岸软弱岩带发育,坝基岩 体质 量较差.

44、五金件:橱柜上的五金件可说是整体厨房最重要的组成部分,它直接影响着橱柜的整 体质 量。

45、如果Nelson博士的实验结果重复成功,就为进一步研究健康心理同健康 体质 两者间关系的道路带来更多希望。

46、过去,我们的国家积贫积弱,国民 体质 不佳,西方人讽刺我们是“东亚病夫”。

47、临证还可根据患者的症状及 体质 等不同,酌加滋阴、利湿、养血、活血、通络之品。

48、高压均质机是液 体质 料均质细化和高压输送的专用设备。

49、以便了解保安族人手指指毛的分布情况,为进行 体质 人类学研究积累资料。

50、这孩子出生到现在尚不弥月,所以 体质 很差.

51、多吃红肉会造成人体 体质 呈酸性,所以最好是改吃鱼,或吃少量的鸡肉。

52、试验选用 体质 健康、生产性能相近的30周龄柴鸡360只,随机分为5组,每组3个重复,每个重复12只.

53、冬令进补必须根据 体质 ,因病因人对症用药,才能收到良好效果。

54、在中国镇压新疆人的抗议活动并且导致将近200人身亡的两年之后,中国国家媒 体质 疑安全部队是否过度使用武力。

55、暖湿的海洋气候和充足的阳光照射下,雅美少女们 体质 健美,都有一头乌黑的秀发。

56、提出邪毒留滞、饮食内伤、情志劳倦为引发肺癌病的主要原因,不可忽视 体质 因素导致肺癌病的重要意义。

57、测小白鼠力竭运动时间、抓力、 体质 量,取肝组织和后腿肌肉测定肝糖原、肌糖原含量。

58、介绍了气 体质 量流量计的特点,并对其工作原理和安装也作了详细的阐述。

59、她纤弱的 体质 使得她不欲担任如此艰钜的工作.

60、在此基础上,对超基性岩 体质 量进行了评价.

61、排气阀门的关闭直接造成参与气泡振荡的气 体质 量的减少,第二气泡脉冲相对主脉冲明显减小。

62、采用人口学和 体质 人类学的方法,对山西芮城清凉寺新石器时代墓地古代居民的人口寿命、性别比例进行了详细研究。

63、本文介绍了用于研究植物 体质 外体空间三维结构的树脂铸型技术.

64、目的探讨肿节风药材所含内酯类及黄酮类成分的整 体质 量控制方法。

65、无论如何,整 体质 素要比大小更重要。

66、我从来不吃猪肉,因为我的 体质 不宜吃猪肉。

67、可以预防视力衰退。患感冒者不宜饮用。燥热 体质 者,去桂圆肉,改用无花果5粒。

68、寒凉类有柑、橘、香蕉等, 体质 虚寒的人慎食.

69、它既是增强 体质 、促进健康的手段,又是太极拳懂劲、炼劲、运劲、发劲练习的必修课程。

70、像是美国银行业者即可能不太容易发债,因为这些公司因次贷危机注销了数以百亿美元计的资产,令人担忧他们的财务 体质 .

71、从 体质 特征上看,它与嘉戎藏族、羌族同源,而与玛曲、红原安多藏族关系较疏。

72、“屁,你走你就在外面遇到事情,我们还得去外面救你去,你说就你这 体质 还倒斗呢,你赶紧回家找人嫁了。你看过一片儿吗?叫。南派三叔

73、研究了不同浓度下乙二酸对元素电感耦合等离子 体质 谱行为的影响。

74、然而,在他离开之前,大师低声对他说:“随心所欲需要强健的 体质 作保证。”。

75、培训院校的管理状况关系到继续教育工作的成败,直接影响并决定继续教育的整 体质 量。

76、此外,毒品使吸毒者的 体质 下降,也为艾滋病的感染和发病大开绿灯。

77、结果表明:一定量的阻聚剂有效地减少了晶点数值,提高了熔 体质 量流动速率,保持了粘结树脂的剥离强度。

78、日常体育锻炼带来的健康效益不可估量,而且只要你参加锻炼,不管你的年龄、性别和 体质 如何,你都将从中获益。

79、比如说,遗传工程师应当不应当矫正近视或矫正易于发胖、掉头发的 体质 呢?

80、闭眼单脚站立是国家规定的 体质 测试项目之一。

81、本文采用灰色关联分析综合评价法对韩江赤凤、潮安、南社的水 体质 量进行评价,取得了良好的效果。

82、贰心性敏感而 体质 荏弱,很早就过世了。

83、本文论述了21世纪质量管理的重要性及其面临的挑战,提出通过供应链质量管理来保证产品整 体质 量的新思路,并引用了广州本田汽车有限公司的成功案例论述这一思路的具体实施过程。

84、射流泵是以液体射流作为工作介质,通过流 体质 点或微团的紊动扩散作用,把能量传给被抽流体的一种流体机械及混合反应设备。

85、该项目正在寻找新方法,使不同的机器人基于所处环境选择出入口和移动速度,并动态控制稳定性和身 体质 量。

86、为了适应新形式的发展,新龙企业严格按照ISO9001:2000的标准建立质量管理体系,并取得 体质 认证。

87、为大学生 体质 未达标群体探寻一条针对性强、简单易行且科学有效的运动健身途径,并为其增强体质、科学健身提供一定的现实指导。

88、因此,本研究以 北京师范大学 男生 体质 未达标群体为研究对象,采用文献资料法、人体测量法、专家访谈法和问卷调查法对该群体的体质进行了现状及原因分析。

89、跑步的老鼠会有 体质 上的优势,像是更好的耐力和更少的脂肪.

90、评价性抽验是指为掌握、了解医疗器械总 体质 量状况所进行的抽验.

91、青木瓜、女贞子、黄氏等上选材料,造就完美的蜕变过程,同时调整 体质 ,发育更趋完善。

92、适宜的蚕室环境条件,可增强蚕儿 体质 ,抑制其小环境内病原物的繁殖,降低发病率,提高茧的产量。

93、过敏 体质 的人应慎食海鲜,因为除了避免食用特定的过敏原之外,海鲜过敏并没有很好的预防方法。

94、中医经络理疗仪的服务对象是健康或亚健康人群,其目的是改善 体质 ,增进健康,保养皮肤,缓解疲劳,保健时不限时间。

95、他童年时代 体质 孱弱,在家读书读到九岁才转入当地的公立学校。

96、美丽应答:滋养肺气,润肠通便,改善便秘 体质 ,和胃健脾。

97、坚持服用蜂蜜柚子茶3个月,就可以达到“改变 体质 ”的作用。

98、文章阐述了监督总 体质 量和监督抽查中的合格、不合格的涵义。

99、方法用微波消解器消解,用电感耦合等离子 体质 谱仪测定牛蒡子中的微量元素含量。

100、野葛根丰胸胶囊,可以辅佐改善这种现象,由于每团体的 体质 差异,能够效果不一。

101、枸杞茶:枸杞一年四季皆可服用,夏季宜泡茶,但以下午泡饮为佳,可以改善 体质 ,利于睡眠。

102、溪洛渡水电站边坡岩 体质 量较好,自然边坡和拱肩槽工程边坡整体上均处于稳定状态。

103、但协方差分析结果表明,本次测量的母鸭体尺间的部分差异是由于 体质 量的差异带来。

104、早期的娃娃类年画,大都摹写宋代苏汉臣和画院的画本, 体质 丰腴,服饰打扮承继了宋画的特点。

105、地下热水的评价因子为地热异常程度及热流 体质 量。

106、很显然,我们两个的 体质 ,绝对不适合干这一行――一个是必然会撺掇我开棺材的体质,一个是开棺材必然遇到粽子的体质。我觉得以后一定要有自知之明,爷爷不让我干这一行显然是相当睿智的。南派三叔

107、青少年的 体质 逐年下降令人感喟.

108、 体质 虚弱者可用高丽参15克代替花旗参.

109、影响大学生 体质 健康下降的主要原囚有:大学生体质健康知识淡薄,生活方式不尽合理,高校对学生体质健康重视不够等。

110、结论是,体育教育不仅是 体质 发展的必要条件,也是智育和德育发展的重要条件。

111、色彩是评价陶瓷修复 体质 量的重要指标之一,修复体色彩逼真、有效是修复体成败的关键。

112、我们在科学与技术方面的进步,善与恶的特点兼而有之。生活上的舒适与便利,可能已经削弱了我们 体质 的活力与道德品质。威尔?杜兰特

113、它既是加强 体质 、促进健康的手段,又是太极拳懂劲、炼劲、运劲、发劲操演的必修课程。

114、在调查研究的基础上,对北京服装学院学生 体质 状况进行了一般性评估。

115、萨勒曼的 体质 很多灵感,他是抽取其打赤膊,在电影和节目期间到着名。

116、硫酸钡作为 体质 颜料广泛应用于涂料中。

117、你想走无始大帝的路吗?举世皆敌啊,打败所有王者,力压一切 体质 ,一路战到圣贤去,打进大帝境界...辰东

118、罗伯特提出的这些问题,对于媒 体质 询者和研究者来说有着非常重要的意义。

119、要定期进行妇科检查,注意外阴部清洁,经常进行体育锻炼,以增强 体质 。

120、若非天生 体质 有些特殊,林青恐怕也和大多数的同伴一样,免不了要在无尽的饥寒之中,冻死,病死,或者……生生被人打死。

‘叁’ 单因子指数法的主成分分析方法

地理环境是多要素的复杂系统,在我们进行地理系统分析时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上,这种想法是可以实现的,本节拟介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。
第一节 主成分分析方法的原理
主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的地理数据矩阵:
如何从这么多变量的数据中抓住地理事物的内在规律性呢?要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。
如果记原来的变量指标为x1,x2,…,xp,它们的综合指标——新变量指标为x1,x2,…,zm(m≤p)。则
在(2)式中,系数lij由下列原则来决定:
(1)zi与zj(i≠j;i,j=1,2,…,m)相互无关;
(2)z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差最大者;……;zm是与z1,z2,……zm-1都不相关的x1,x2,…,xp的所有线性组合中方差最大者。
这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一,第二,…,第m主成分。其中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。
从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是x1,x2,…,xp的相关矩阵的m个较大的特征值所对应的特征向量。
第二节 主成分分析的解法
主成分分析的计算步骤
通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:
(1)计算相关系数矩阵
在公式(3)中,rij(i,j=1,2,…,p)为原来变量xi与xj的相关系数,其计算公式为
因为R是实对称矩阵(即rij=rji),所以只需计算其上三角元素或下三角元素即可。
(2)计算特征值与特征向量
首先解特征方程|λI-R|=0求出特征值λi(i=1,2,…,p),并使其按大小顺序排列,即λ1≥λ2≥…,≥λp≥0;然后分别求出对应于特征值λi的特征向量ei(i=1,2,…,p)。
(3)计算主成分贡献率及累计贡献率
一般取累计贡献率达85-95%的特征值λ1,λ2,…,λm所对应的第一,第二,……,第m(m≤p)个主成分。
(4)计算主成分载荷
由此可以进一步计算主成分得分:
第三节 主成分分析应用实例
主成分分析实例
对于某区域地貌-水文系统,其57个流域盆地的九项地理要素:x1为流域盆地总高度(m)x2为流域盆地山口的海拔高度(m),x3为流域盆地周长(m),x4为河道总长度(km),x5为河
表2-14 某57个流域盆地地理要素数据
道总数,x6为平均分叉率,x7为河谷最大坡度(度),x8为河源数及x9为流域盆地面积(km)的原始数据如表2-14所示。张超先生(1984)曾用这些地理要素的原始数据对该区域地貌-水文系统作了主成分分析。下面,我们将其作为主成分分析方法在地理学研究中的一个应用实例介绍给读者,以供参考。
表2-15相关系数矩阵
(1)首先将表2-14中的原始数据作标准化处理,由公式(4)计算得相关系数矩阵(见表2-15)。
(2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表2-16)。由表2-16可知,第一,第二,第三主成分的累计贡献率已高达86.5%,故只需求出第一,第二,第三主成分z1,z2,z3即可。
表2-16 特征值及主成分贡献率
(3)对于特征值λ1=5.043,λ2=1.746,λ3=0.997分别求出其特征向量e1,e2,e3,并计算各变量x1,x2,……,x9在各主成分上的载荷得到主成分载荷矩阵(见表2-17)。
表2-17 主成分载荷矩阵
从表2-17可以看出,第一主成分z1与x1,x3,x4,x5,x8,x9有较大的正相关,这是由于这六个地理要素与流域盆地的规模有关,因此第一主成分可以被认为是流域盆地规模的代表:第二主成分z2与x2有较大的正相关,与x7有较大的负相关,而这两个地理要素是与流域切割程度有关的,因此第二主成分可以被认为是流域侵蚀状况的代表;第三主成分z3与x6有较大的正相关,而地理要素x6是流域比较独立的特性——河系形态的表征,因此,第三主成成可以被认为是代表河系形态的主成分。
以上分析结果表明,根据主成分载荷,该区域地貌-水文系统的九项地理要素可以被归为三类,即流域盆地的规模,流域侵蚀状况和流域河系形态。如果选取其中相关系数绝对值最大者作为代表,则流域面积,流域盆地出口的海拔高度和分叉率可作为这三类地理要素的代表,利用这三个要素代替原来九个要素进行区域地貌-水文系统分析,可以使问题大大地简化。
二、内梅罗水质指数污染
表1 内梅罗水质指数污染等级划分标准 P <1 1~2 2~3 3~5 >5 水质等级 清洁 轻污染 污染 重污染 严重污染 表2 地表水环境质量标准(GB3838—2002) 单位:mg/L 序 号 项 目 V类标准值 1 水温(℃) — 2 PH值(无量纲) 6—9 3 溶解氧 ≥ 2 4 高锰酸盐指数 ≤ 15 5 化学需氧量 ≤ 40 6 五日生化需氧量 ≤ 10 7 氨氮 ≤ 2.0 8 总磷 ≤ 0.4 9 总氮 ≤ 2.0 10 铜 ≤ 1.0 11 锌 ≤ 2.0 12 氟化物 ≤ 1.5 13 硒 ≤ 0.02 14 砷 ≤ 0.1 15 汞 ≤ 0.001 16 镉 ≤ 0.01 17 铬(六价) ≤ 0.1 18 铅 ≤ 0.1 19 氰化物 ≤ 0.2 20 挥发酚 ≤ 0.1 21 石油类 ≤ 1.0 22 硫化物 ≤ 1.0 23 粪大肠菌群(个/L) ≤ 40000 表3 水质评价计算方法 单因子污染指数 Pi = Ci/ Si Ci——第i项污染物的监测值; Si——第i项污染物评价标准值; 溶解氧指数 Cf——对应温度T时的饱和溶解氧浓度;
Ci——溶解氧浓度监测值;
Si——溶解氧评价标准值; pH指数 pHi——pH监测值;
pHS,min——评价标准值的下限;
pHS,max ——评价标准值的上限; 污染物超标倍数 Ci ——第i项污染物的监测值;
C0 ——第i项污染物评价标准值; 内梅罗指数 Pmax ——单因子污染指数的最高值;
Pi ——第i项污染物的污染指数;
n ——参与评价污染物的项数; 常用的客观赋权法之一:熵值法
熵是信息论中测度一个系统不确定性的量。信息量越大,不确定性就越小,熵也越小,反之,信息量越小,不确定性就越大,熵也越大。熵值法主要是依据各指标值所包含的信息量的大小,利用指标的熵值来确定指标权重的。熵值法的一般步骤为:
(1)、对决策矩阵作标准化处理,得到标准化矩阵,并进行归一化处理得:
(2)、计算第个指标的熵值:。其中。
(3)、计算第个指标的差异系数。对于第个指标,指标值的差异越大,对方案评价的作用越大,熵值越小,反之,差异越小,对方案评价的作用越小,熵值就越大。因此,定义差异系数为:。
(4)、确定指标权重。第个指标的权重为:。
效益型和成本型指标的标准化方法
对于效益型(正向)指标和成本型(逆向)指标,由于这两者是最常见并且使用最广泛的指标,所以,对这两种指标标准化处理的方法也最多,一般的处理方法有:
1. 极差变换法
该方法即在决策矩阵中,对于效益型指标,令
=
对于成本型指标,令
=
则得到的矩阵称为极差变换标准化矩阵。其优点为经过极差变换后,均有,且各指标下最好结果的属性值,最坏结果的属性值。该方法的缺点是变换前后的各指标值不成比例。
2. 线性比例变换法
即在决策矩阵中,对于效益型指标,令
=
对成本型指标,令
=

=
则矩阵称为线性比例标准化矩阵。该方法的优点是这些变换方式是线性的,且变化前后的属性值成比例。但对任一指标来说,变换后的和不一定同时出现。
3. 向量归一化法
即在决策矩阵中,对于效益型指标,令
对于成本型指标,令
则矩阵称为向量归一标准化矩阵。显然,矩阵的列向量的模等于1,即。该方法使,且变换前后正逆方向不变,缺点是它是非线性变换,变换后各指标的最大值和最小值不相同。
4. 标准样本变换法
在中,令
其中,样本均值,样本均方差,则得出矩阵,称为标准样本变换矩阵。经过标准样本变换之后,标准化矩阵的样本均值为,方差为。
5. 等效系数法
对成本型指标,令
=
该方法的优点是变换前后的指标值成比例,缺点是各指标下方案的最好与最差指标值标准化后不完全相同。
另外,关于效益型指标的标准化处理还有:
=
关于成本型指标的标准化处理还有:
=
固定型指标的标准化方法
对于固定型指标,若设为给定的固定值,则标准化处理的方法主要有以下几种,即令



(4.15)式的特点是各最优属性值标准化后的值均为1,而各最差属性的值标准化后的值不统一,即不一定都为0。
若设和分别是人为规定的最优方案和最劣方案,在该情形下,还给出了效益型、成本型和固定型指标的新的标准化方法。
对效益型和成本型,有:
对固定型指标则有:
区间型指标的标准化方法
对区间型的指标,其指标标准化处理的方法主要有以下几式:
设,令
或令
显然,还可以简化为:
或令
或令
其中,是指给定的某个固定区间,即属性值越接近该区间越好。
偏离型指标的标准化方法
对越来越偏离某值越好的偏离性指标,一般有如下标准化公式:
或令
(对都有)
或令
偏离型指标是与固定型指标相对立的一种指标类型,它的公式使用可以用固定型指标的公式改造,但在使用时要注意其公式的适用范围。
偏离区间型指标的标准化方法
对偏离区间型指标,有如下标准化的方法:

或令
或令
其中,是某个固定区间,属性值越偏离该区间越好。偏离区间型指标是与区间型指标相对立的一种指标类型。

‘肆’ ROC曲线——相关文献实例、原理和绘制方法

数据分析最让人着迷的一种用途是可以基于现有数据创建能够区分不同类型情景的机器学习预测模型。通过定义明确的模型,可以确定能够预测结果的最重要影响因素,为战略假设开发有价值的洞察力,甚至可以通过友好的用户界面将模型的逻辑实现到软件应用程序中。

首先,我们需要评估构建好的预测模型是否具有良好准确的预测能力!比如,如果我们的电子邮件程序的垃圾邮件分类器只能检测到50%的不需要的电子邮件或请求,我们都会非常愤怒。本文将讨论如何使用经典工具来评估预测模型:接收器操作特性(ROC)曲线。

本文主要分为三个部分整理ROC曲线相关内容,可根据自己的需要进行挑选:

1、使用ROC曲线分析的相关文献实例

2、ROC曲线的原理和历史

3、如何绘制ROC曲线

从一篇SCI出发: Improvement of Insulin Sensitivity after Lean Donor Feces in Metabolic Syndrome Is Driven by Baseline Intestinal Microbiota Composition

这是阿姆斯特丹大学学术医学中心在2017年发表在cell子刊上的文献,其中一个highlight提到:Response to lean donor FMT is driven by baseline fecal microbiota composition,使用了ROC曲线来评估预测模型的好坏。

为了比较异体FMT中菌群与效果之间的关系,首先按照FMT前后Rd值的变化将患者分为responders组和non-responders组,并比较了两组的菌群差异,从菌群多样性变化来看,基于Shannon指数发现,两组的多样性均没有发生显着改变,然而,两组基线时的菌群多样性却又显着差异(图5A),具体表现为non-responders的基线菌群多样性显着高于responders。随后,作者使用了弹性网络算法elastic net algorithm ( Zou and Hastie, 2005 )区分responders和non-responders,为了避免过度拟合,在数据的训练分区(80%)上使用了十折交叉验证,剩下的20%样品用作测试数据集。要选择的参数是 L1,L2范数和正则化阈值之间的比率。稳定性选择采用80% 的随机二次抽样方法进行,共100次。在稳定性选择过程中,计算所有权重系数为非零的特征。这些计数被归一化并转换为稳定系数,对于总是被选择的特征值在1.0之间,对于从未被选择的特征值在0.0之间。通过随机试验评价弹性网络算法所得结果的统计有效性。按照程序将结果变量(例如,同种异体相对于自体或应答者相对于无应答者)随机重组,同时保留相应的微生物谱。重复100次,每次计算受试者-工作特征-曲线下面积(ROC AUC)评分。用于二进制分类任务的性能度量是 ROC AUC。ROC 可以理解为一个正确分类同种异体受试者与自体受试者或有效者与无效者的概率图。数据集中的交叉验证是通过随机隐藏模型中20% 的受试者并评估该组的预测质量来完成的。ROC AUC 评分用0.5 AUC 来衡量分类模型的预测准确性,对应于一个随机结果。定义了一个临界值0.05,并将原始数据集的真实 AUC 与此值进行了比较。

作者通过ROC曲线评估了基线菌群组成预测6周代谢反应的模型,显示AUC=0.88,模型良好。

从这篇文献了解到ROC曲线可用于评估某个寻找biomarkers的预测模型的好坏。

再从一篇SCI了解: Alterations in the gut microbiome and metabolism with coronary artery disease severity

这是一篇本课题组与北京协和医学院合作在2019年发表的文章,关注了不同冠状动脉疾病Coronary artery disease (CAD)类型患者的肠道菌群区分差异。其中,作者通过ROC曲线评估了区分不同CAD亚型(稳定型冠状动脉疾病(SCAD) ,不稳定型心绞痛(UA)和心肌梗死(MI))的特征共变化菌群和代谢物随机森林模型,得到比较良好的预测结果。

Subgroup identification and prediction based on CAGs and CAD-associated metabotypes

为了确定肠道菌群中的 CAGs 和代谢产物模块是否可以作为鉴别冠心病不同阶段与正常冠状动脉的生物标志物,根据24个 CAGs 和72个血清代谢类型构建了随机森林模型对冠心病不同阶段进行分类,并利用 ROC曲线(ROC)曲线对分类进行了检验(详情见“材料和方法”一节)。总共构建了5个预测模型(Control vs. CAD, Control vs. SCAD, SCAD vs. UA, SCAD vs. ACS和UA vs. MI)。

随后,作者再通过招募新队列使用该模型进行分类预测,进一步论证该疾病亚型识别模型的潜在分类能力。

小结:从这两篇文献来看,作者均通过某个分类法机器学习预测模型寻找biomarkers,然后使用ROC曲线对模型进行评估。因此,我们可以初步得知,ROC曲线是用于检验构建的预测模型好坏的一种衡量方法。那么除了这种用途,ROC曲线还能做什么呢?

为了进一步了解并应用ROC曲线,我们需要首先了解ROC曲线的原理和过往↓

关于ROC曲线相关介绍的文章非常多,这里我摘抄出个人认为比较详细,可用性强的文章,加以理解。

一、评估预测模型的方法

首先,我们应该了解到预测模型的类型可以分为回归模型和分类模型(分类模型又有两类算法:分类输出型和概率输出型,这里就不一一赘述),而不同模型的评估度量也是不同的, 如何评估模型好坏 , 机器学习(二十四)——常见模型评估方法 , 分类模型的评估方法简介 首先需要了解自己构建的预测模型类型来决定评估方法,并不局限于使用ROC曲线进行评估。

ROC曲线原理:

关于ROC曲线的概念和意义可参考: ROC曲线的概念和意义

英文比较好的话也可以看看这篇: ROC curves – what are they and how are they used?

为了更直观的理解ROC,也可以看看这个视频: ROC and AUC, Clearly Explained!

受试者工作特征曲线(receiver operator characteristic curve, ROC曲线),最初用于评价雷达性能,又称为接收者操作特性曲线。ROC曲线其实就是从混淆矩阵衍生出来的图形,以真阳性率(灵敏度,Sensitivity)为纵坐标,假阳性率(1-特异度,1-Specificity)为横坐标绘制的曲线。

其自变量(检验项目)一般为连续性变量(如蛋白质因子、菌株、代谢物等的检测丰度或含量),因变量(金标准,如某疾病亚型分类、治疗响应和无响应、患病和未患病)一般为二分类变量。

ROC曲线图形:随着阈值的减小,更多的值归于正类,敏感度和1-特异度也相应增加,所以ROC曲线呈递增趋势。那条45度对角线是一条参照线,也就是说ROC曲线要与这条曲线比较。简单的说,如果我们不用模型,直接随机把客户分类,我们得到的曲线就是那条参照线,然而我们使用了模型进行预测,就应该比随机的要好,所以ROC曲线要尽量远离参照线,越远,我们的模型预测效果越好。

ROC曲线就是用来判断诊断的正确性,最理想的就是曲线下的面积为1,比较理想的状态就是曲线下的面积在0.8-0.9之间,0.5的话对实验结果没有什么影响。

提到ROC曲线,就离不开AUC(ROC曲线下面积),其判定方法为AUC应该大于0.5。ROC曲线是根据与对角线进行比较来判断模型的好坏,但这只是一种直觉上的定性分析,如果我们需要精确一些,就要用到AUC,也就是ROC曲线下面积(AUC)。

从AUC判断分类器(预测模型)优劣的标准:

AUC = 1,是完美分类器,采用这个预测模型时,存在至少一个阈值能得出完美预测。绝大多数预测的场合,不存在完美分类器。

0.5 < AUC < 1,优于随机猜测。这个分类器(模型)妥善设定阈值的话,能有预测价值。

AUC = 0.5,跟随机猜测一样(例:丢铜板),模型没有预测价值。

AUC < 0.5,比随机猜测还差;但只要总是反预测而行,就优于随机猜测。

看上图,参考线的面积是0.5,ROC曲线与它偏离越大,ROC曲线就越往左上方靠拢,它下面的面积(AUC)也就越大,这里面积是0.869。我们可以根据AUC的值与0.5相比,来评估一个分类模型的预测效果。

二、ROC曲线的历史和关键值

这里推荐阅读这篇: 机器学习基础(1)- ROC曲线理解 。这里从最初雷达兵使用ROC曲线评估的故事说起,言简意赅。

ROC曲线最初的研究是为了确定美国雷达“接收机操作员”是如何漏掉日本飞机的。在模型预测判断中,会出现真阳、假阳、真阴和假阴的三种情况,而不同雷达兵都可能有自己的一套评判标准,对每个接收的信号是大鸟还是轰炸机,每个雷达兵会给出自己的判断结果,这样每个雷达兵就都能计算出一个ROC曲线上的关键点(一组FPR,TPR值),把大家的点连起来,也就是最早的ROC曲线了。

ROC曲线需要了解几个关键值:

敏感性: 正确识别真阳性的比例。在这种情况下,健康患者的比例由诊断工具正确识别。这有时被称为“召回”。

SN =真阳性/(真阳性+假阴性)

逆(1灵敏度)=  假负率 。未被该工具检测到的健康患者被错误地识别为患有CAD。假阴性也称为II型错误。

特异性: 正确识别真阴性的比例。在这种情况下,通过诊断工具正确识别CAD患者的比例。

SP =真阴性/(真阴性+误报)

逆(1-特异性)=  假阳性率 。CAD患者被错误地识别为无CAD。误报也称为I型错误。

积极预测价值: 该工具报告的阳性比例,实际上是积极的。对于诊断工具报告缺乏CAD的患者组,PPV是实际上没有患病的患者的比例。这有时被称为“精确度”。

PPV =真阳性/(真阳性+误报)

负面预测值: 该工具报告的负面影响的比例,实际上是负面的。对于诊断工具报告存在CAD的患者组,NPV是实际上没有CAD的患者的比例。

NPV =真阴性/(真阴性+假阴性)

这里可以借助混淆矩阵加以理解:

TP(True Positive): 真实为0,预测也为0

FN(False Negative): 真实为0,预测为1

FP(False Positive): 真实为1,预测为0

TN(True Negative): 真实为0,预测也为0

三、ROC曲线的主要作用

1、ROC曲线能很容易地查出任意界限值时的对疾病的识别能力。

2、选择最佳的诊断界限值。

3、两种或两种以上不同诊断试验对疾病识别能力的比较。在对同一种疾病的两种或两种以上诊断方法进行比较时,可将各试验的ROC曲线绘制到同一坐标中,以直观地鉴别优劣,靠近左上角的ROC曲线所代表的受试者工作最准确。亦可通过分别计算各个试验的ROC曲线下的面积(AUC)进行比较,哪一种试验的AUC最大,则哪一种试验的诊断价值最佳。

四、交叉验证和过拟合问题

参考: 你真的了解交叉验证和过拟合吗?

机器学习】Cross-Validation(交叉验证)详解

10折交叉验证(10-fold Cross Validation)与留一法(Leave-One-Out)、分层采样(Stratification)

意识到过拟合好像也是个棘手的问题,所以在这里补充一下:

简单来讲,当 train set 误差较小,而 test set 误差较大时,我们即可认为模型过拟合。这句话表达的另一层意思是,模型评估指标的方差(variance)较大,即可认为模型过拟合。另外,无论监督学习还是非监督学习,均存在过拟合的问题。

有一个比喻还不错,这里也摘抄下来:

语文老师 让同学A 解释一个句子:  ‘某鲁迅先生的文章~~~~~~~~’

欠拟合:    差生: 这是个什么鬼东西,比例哔哩哔哩~~~~

过拟合:    语文老师的解释: ‘表面上看是~~~,但其实~~~~,本质上~~~~~~,反映了~~~~心情,烘托了~~~气氛~~~’

正常:        当时鲁迅先生觉得天色晚了,该休息了。

那么,如何才能够在一定程度上避免过拟合呢?这就引出了交叉验证:

最简单的判断模型是否过拟合的方法,就是通过training accuracy 和 test accuracy 数值大小,直观的判断模型是否过拟合。例如,训练集的准确率为90%,而测试集的准确率为70%,那么我们可以认为模型过拟合。不过,这种方法没有明确的判断标准,完全靠个人的主观判断——“感觉训练和测试的误差相差有点大,有可能过拟合”。

如何利用交叉验证避免过拟合?

避免模型过拟合的方法,总结大概以下几点:

   - 重新清洗数据(删除稀疏特征、对噪声数据进行处理(删除/替换))

- 重新采样(改变采样方法等)

- 增加训练数据

- 采用交叉验证训练模型

- 重新筛选特征

- 降低模型复杂度(增加正则项:L1,L2)

- dropout(神经网络中,让神经元一定的概率不工作)

这里探讨如何利用交叉验证来避免模型过拟合:

第一个作用是对模型的性能进行评估 。当我们通过一次划分样本对模型进行训练和测试时,由于样本划分的偶然性,会导致我们对模型的评估不准确。因此,可以采用交叉验证对模型进行评估(一般采用5折或10折,sklearn默认采用的是3折),以 n 折交叉验证结果的均值,作为模型的性能评估。

第二个作用就是用来避免过拟合 。例如当我们进行10折交叉验证时,训练了10次,得到了10个模型,每个模型的参数也是不同的,那么我们究竟用哪个模型作为我们最终的模型呢?答案是: 一个都不用!我们要利用全量数据重新训练出一个最终模型!

关于实现ROC曲线的绘制,可通过多种途径进行,这里列出一些可操作平台和方法:

1、SPSS: 如何用SPSS做ROC曲线分析?看这1篇就够了!

2、R语言: R语言逻辑回归、ROC曲线和十折交叉验证

                    ROC曲线基于R语言-(pROC包)

                    R语言pROC包绘制ROC曲线

3、Python: 机器学习基础(1)- ROC曲线理解

                    ROC原理介绍及利用python实现二分类和多分类的ROC曲线

4、Matlab: Matlab绘图——ROC曲线绘制(官方demo)

                     ROC曲线详解及matlab绘图实例

ROC曲线的初步学习就到这里,我们初步了解到ROC曲线最初是用来评估雷达兵判断的轰炸机信号准确性的方法,随后沿用到了医学指标的判定上,在生活中应用广泛。ROC曲线可用于查出任意界限值时的对疾病的识别能力,选择最佳的诊断界限值,还可以用在评估机器学习预测模型的好坏上(目前好像这方面用的比较多)。当然,还有一些问题值得讨论,比如,何时需要使用ROC曲线,S折交叉验证平均ROC曲线如何绘制,等等。在机器学习模型构建过程中,训练集和测试集的建立,模型的交叉验证和ROC曲线评估的结合,还需要继续学习。

Kootte RS, Levin E, Salojärvi J, Smits LP, Hartstra AV, Udayappan SD, Hermes G, Bouter KE, Koopen AM, Holst JJ, Knop FK, Blaak EE, Zhao J, Smidt H, Harms AC, Hankemeijer T, Bergman JJGHM, Romijn HA, Schaap FG, Olde Damink SWM, Ackermans MT, Dallinga-Thie GM, Zoetendal E, de Vos WM, Serlie MJ, Stroes ESG, Groen AK, Nieuwdorp M. Improvement of Insulin Sensitivity after Lean Donor Feces in Metabolic Syndrome Is Driven by Baseline Intestinal Microbiota Composition. Cell Metab. 2017 Oct 3;26(4):611-619.e6. doi: 10.1016/j.cmet.2017.09.008. PMID: 28978426.

Liu H, Chen X, Hu X, Niu H, Tian R, Wang H, Pang H, Jiang L, Qiu B, Chen X, Zhang Y, Ma Y, Tang S, Li H, Feng S, Zhang S, Zhang C. Alterations in the gut microbiome and metabolism with coronary artery disease severity. Microbiome. 2019 Apr 26;7(1):68. doi: 10.1186/s40168-019-0683-9. PMID: 31027508; PMCID: PMC6486680.

Rodriguez-Ruiz A, Lång K, Gubern-Merida A, Broeders M, Gennaro G, Clauser P, Helbich TH, Chevalier M, Tan T, Mertelmeier T, Wallis MG, Andersson I, Zackrisson S, Mann RM, Sechopoulos I. Stand-Alone Artificial Intelligence for Breast Cancer Detection in Mammography: Comparison With 101 Radiologists. J Natl Cancer Inst. 2019 Sep 1;111(9):916-922. doi: 10.1093/jnci/djy222. PMID: 30834436; PMCID: PMC6748773.

Duclos G, Bobbia X, Markarian T, Muller L, Cheyssac C, Castillon S, Resseguier N, Boussuges A, Volpicelli G, Leone M, Zieleskiewicz L. Speckle tracking quantification of lung sliding for the diagnosis of pneumothorax: a multicentric observational study. Intensive Care Med. 2019 Sep;45(9):1212-1218. doi: 10.1007/s00134-019-05710-1. Epub 2019 Jul 29. PMID: 31359081.

‘伍’ 环境微生物群落heatmap图怎么画

稀释性曲线(Rarefaction Curve)采用对测序序列进行随机抽样的方法,以抽到的序列数与它们所能代表OTU的数目构建曲线,即稀释性曲线。当曲线趋于平坦时,说明测序数据量合理,更多的数据量对发现新OTU的边际贡献很小;反之则表明继续测序还可能产生较多新的OTU。横轴:从某个样品中随机抽取的测序条数;"Label 0.03" 表示该分析是基于OTU 序列差异水平在0.03,即相似度为97% 的水平上进行运算的,客户可以选取其他不同的相似度水平。纵轴:基于该测序条数能构建的OTU数量。曲线解读:Ø 图1中每条曲线代表一个样品,用不同颜色标记;Ø 随测序深度增加,被发现OTU 的数量增加。当曲线趋于平缓时表示此时的测序数据量较为合理。2. Shannon-Wiener 曲线反映样品中微生物多样性的指数,利用各样品的测序量在不同测序深度时的微生物多样性指数构建曲线,以此反映各样本在不同测序数量时的微生物多样性。当曲线趋向平坦时,说明测序数据量足够大,可以反映样品中绝大多数的微生物物种信息。横轴:从某个样品中随机抽取的测序条数。纵轴:Shannon-Wiener 指数,用来估算群落多样性的高低。Shannon 指数计算公式:其中,Sobs= 实际测量出的OTU数目;ni= 含有i 条序列的OTU数目;N = 所有的序列数。曲线解读:Ø 图2每条曲线代表一个样品,用不同颜色标记,末端数字为实际测序条数;Ø 起初曲线直线上升,是由于测序条数远不足覆盖样品导致;Ø 数值升高直至平滑说明测序条数足以覆盖样品中的大部分微生物。3.Rank-Abundance 曲线用于同时解释样品多样性的两个方面,即样品所含物种的丰富程度和均匀程度。物种的丰富程度由曲线在横轴上的长度来反映,曲线越宽,表示物种的组成越丰富;物种组成的均匀程度由曲线的形状来反映,曲线越平坦,表示物种组成的均匀程度越高。横轴:OTU 相对丰度含量等级降序排列。纵轴:相对丰度比例。曲线解读:Ø 图3与图4中每条曲线对应一个样本(参考右上角图标);Ø 图3与图4中横坐标表示的是OTU(物种)丰度排列顺序,纵坐标对应的是OTU(物种)所占相对丰度比例(图3为相对百分比例,图4为换算后Log值),曲线趋于水平则表示样品中各物种所占比例相似;曲线整体斜率越大则表示样品中各物种所占比例差异较大。4. 样本群落组成分析:多样本柱状图/ 单样本饼状图 根据分类学分析结果,可以得知一个或多个样品在各分类水平上的物种组成比例情况,反映样品在不同分类学水平上的群落结构。柱状图(图5)横轴:各样品的编号。纵轴:相对丰度比例。图标解读:Ø 颜色对应此分类学水平下各物种名称,不同色块宽度表示不同物种相对丰度比例;Ø 可以在不同分类学水平下作图分析。饼状图(图6)在某一分类学水平上,不同菌群所占的相对丰度比例。不同颜色代表不同的物种。5. 样品OTU 分布Venn 图用于统计多个样品中共有或独有的OTU数目,可以比较直观地表现各环境样品之间的OTU 组成相似程度。不同样品用不同颜色标记,各个数字代表了某个样品独有或几种样品共有的OTU 数量,对应的OTU编号会以EXCEL 表的形式在结题报告中呈现。分析要求单张分析图,样本分组至少两个,最多5 个。Ø 默认设置为97% 相似度水平下以OTU 为单位进行分析作图。6. Heatmap 图用颜色变化来反映二维矩阵或表格中的数据信息,它可以直观地将数据值的大小以定义的颜色深浅表示出来。将高丰度和低丰度的物种分块聚集,通过颜色梯度及相似程度来反映多个样品在各分类水平上群落组成的相似性和差异性。相对丰度比例:热图(图8)中每小格代表其所在样品中某个OTU 的相对丰度。以图8为例,红框高亮的小格所对应的信息为:样本(R11-1Z)中OTU(OTU128)的相对丰度比例大概为0.2%。丰度比例计算公式(Bray Curtis 算法):其中,SA,i = 表示A样品中第i个OTU所含的序列数SB,i = 表示B样品中第i个OTU所含的序列数样品间聚类关系树:进化树表示在选用成图数据中,样本与样本间序列的进化关系(差异关系)。处于同一分支内的样品序列进化关系相近。物种/OTU 丰度相似性树:丰度相似性树表示选用成图的数据中样品与样品中的OTU 或序列在丰度上的相似程度。丰度最相近的会分配到同一分支上。客户自定义分组:根据研究需求对菌群物种/OTU 研究样本进行二级分组Ø 二级物种/OTU 分组:将下级分类学水平物种或OTU 分配到对应的上级分类学水平,以不同颜色区分;Ø 二级样品分组:根据研究需要,对样品进行人为的分组,以不同颜色区分。7. 主成分分析PCA (Principal Component Analysis)在多元统计分析中,主成分分析是一种简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中对方差贡献最大的特征,从而有效地找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。通过分析不同样品的OTU 组成可以反映样品间的差异和距离,PCA 运用方差分解,将多组数据的差异反映在二维坐标图上,坐标轴为能够最大程度反映方差的两个特征值。如样品组成越相似,反映在PCA图中的距离越近。横轴和纵轴:以百分数的形式体现主成分主要影响程度。以图9为例,主成分1(PC1)和主成分2(PC2)是造成四组样品(红色,蓝色,黄色和绿色)的两个最大差异特征,贡献率分别为41.1% 和27.1%。十字交叉线:在图9中作为0 点基线存在,起到辅助分析的作用,本身没有意义。图例解读:Ø PCA 分析图是基于每个样品中所含有的全部OTU 完成的;Ø 图9中每个点代表了一个样本;颜色则代表不同的样品分组;Ø 两点之间在横、纵坐标上的距离,代表了样品受主成分(PC1 或 PC2)影响下的相似性距离;Ø 样本数量越多,该分析意义越大;反之样本数量过少,会产生个体差异,导致PCA分析成图后形成较大距离的分开,建议多组样品时,每组不少于5个,不分组时样品不少于10个;Ø 图10中的圆圈为聚类分析结果,圆圈内的样品,其相似距离比较接近。8. RDA/ CCA 分析图基于对应分析发展的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。主要用来反映菌群与环境因子之间的关系。RDA 是基于线性模型,CCA是基于单峰模型。分析可以检测环境因子、样品、菌群三者之间的关系或者两两之间的关系。横轴和纵轴:RDA 和CCA 分析,模型不同,横纵坐标上的刻度为每个样品或者物种在与环境因子进行回归分析计算时产生的值,可以绘制于二维图形中。图例解读:Ø 冗余分析可以基于所有样品的OTU作图,也可以基于样品中优势物种作图;Ø 箭头射线:图11中的箭头分别代表不同的环境因子(即图中的碳酸氢根离子HCO3-,醋酸根离子AC-等,图中的其它环境因子因研究不同代表的意义不同,因此不再赘述);Ø 夹角:环境因子之间的夹角为锐角时表示两个环境因子之间呈正相关关系,钝角时呈负相关关系。环境因子的射线越长,说明该影响因子的影响程度越大;Ø 图11中不同颜色的点表示不同组别的样品或者同一组别不同时期的样品,图中的拉丁文代表物种名称,可以将关注的优势物种也纳入图中;Ø 环境因子数量要少于样本数量,同时在分析时,需要提供环境因子的数据,比如 pH值,测定的温度值等。9. 单样品/ 多样品分类学系统组成树根据NCBI 提供的已有微生物物种的分类学信息数据库,将测序得到的物种丰度信息回归至数据库的分类学系统关系树中,从整个分类系统上全面了解样品中所有微生物的进化关系和丰度差异。单样品图(图12):可以了解单样品中的序列在各个分类学水平上的分布情况。图例解读:Ø 图12中不同的层次反映不同的分类学水平;Ø 分支处的圆面积说明了分布在该分类学水平,且无法继续往下级水平比对的序列数量,面积越大,说明此类序列越多;Ø 每个分支上的名词后面的两组数字分别表示比对到该分支上的序列数和驻留在该节点上的序列数;Ø 图13中为某单一水平物种分布情况,并非是序列分布。多样品图(图14):比对多个样品在不同分类学分支上序列数量差异。图例解读:Ø 比对不同样品在某分支上的序列数量差异,通过带颜色的饼状图呈现,饼状图的面积越大,说明在分支处的序列数量越多,不同的颜色代表不同的样品。Ø 某颜色的扇形面积越大,说明在该分支上,其对应样品的序列数比其他样品多。Ø 多样品在做该分析时,建议样品数量控制在10个以内,或者将重复样本数据合并成一个样本后,总样品数在10个以内。10.系统发生进化树在分子进化研究中,基于系统发生的推断来揭示某一分类水平上序列间碱基的差异,进而构建进化树。

‘陆’ 腹内侧前额叶与脑岛皮层变化对儿童到青少年元记忆发育的影响

文章首发于思影科技,siyingkeji。此微信公众号致力于科普fMRI,致力于科普fMRI,结构像,白质高信号分析,PET,DTI,QSM,ASL,BOLD-CVR,影像组学,菌群,EEG/ERP,FNIRS,眼动等相关知识,欢迎大家学习交流讨论。

元记忆监控与内生 回忆准确性的能力在儿童发育过程大大改善,但潜在的神经变化和对智力发育的影响在很大程度上是未知的。来自加州大学戴维斯分校心智与大脑中心( Center for mind and brain, UCD )的 Yana Fandakova 等人在 PNAS 发表了一篇文章,研究了支持元认知的关键脑区的皮层变化是否有助于从童年到青春期早期的元记忆监控能力变化。

自省记忆准确性和元记忆监视的能力对于指导学习和决策非常重要,例如一个学生对考试准备的复习材料有疑问,他会重复检查这些材料;同样地,如果一个目击者对自己看到的犯罪信息的记忆不确定,他很可能会拒绝作证。

跨学科研究表明,小学时期的记忆监测能力已经有所改善,年龄较大的孩子对判断记忆是否准确的信心比年龄小的孩子更大。然而,当情感过程可能改变或影响行为规范时,这种发展是否延伸到青春期仍然是一个悬而未决的问题。支持元记忆监测能力发展的结构性大脑变化也是未知的。因此了解青春期元认知如何发展,以及与之相关的大脑发育有助于阐明儿童成长为独立的学习者和问题解决者的关键因素。

对成人的研究可以确定对元记忆监测相关脑区的发育模式的预测,比如成人元记忆监测个体差异与前额叶皮层(APFC),腹内侧前额叶皮层(vmPFC),背前扣带皮层(dACC)和前脑岛等的结构异常有关。虽然这些脑区的确切作用尚不清楚,但最近的一项研究表明前额叶区域与包括脑岛和扣带皮层的感觉皮层的相互作用提供了元记忆监测能力。这说明脑岛和背前扣带皮层提供了持续认知表现(例如,误差信号,不确定性信号)的输入,然后与前额叶皮层(PFC)中的当前目标和信念的认知相结合,最终产生内省报告和随后的决定。

本文中研究了一组145名7至15岁的儿童,他们在三个测量场合进行结构磁共振成像的扫描(图1A; 347纵向扫描)。并且对31名成年人作为样本进行横断面比较。参与者在编码期间完成了记忆任务和注意力操作任务,获得不同难度程度和记忆精度。参与者在三种不同注意力需求条件下观看了一系列场景(图1B)。在检索期间,参与者从不同的条件下观看了新的场景或研究场景,并表明了他们对场景识别判断的信心(图1B)。对于正确和不正确的响应,置信度分布的差异可能会随着开发过程中存储器精度水平的不同而不同。因此在调查年龄差异时记录了从童年到青春期转型期间记忆准确性的差异变化。

本文研究了前脑岛,dACC,vmPFC和APFC的结构变化如何影像儿童后期和青春期的元记忆监测能力的发展。研究表明,岛状皮层的变化大致遵循一个皮质变薄的线性轨迹,而侧向和内侧PFC发育的特征是初始阶段皮层厚度增加到9岁左右,随后开始变薄。本文提出的一种假设是脑岛的早期功能成熟可能有助于开发前期的元记忆监测,而后期成熟的PFC区域则在后期支持更复杂的控制操作。这一假设与PFC区域与低龄时期元记忆的变化仅显示弱相关的观点相一致,所以后期皮层厚度变薄才促进了脑功能的提高。另外一种假设是脑区皮层厚度的特异变化轨迹函数可能导致了元记忆监测能力的提高。如果是这样,内外侧PFC区域(其灰质厚度在童年期间继续增加)皮层厚度的变厚和脑岛皮层的变薄共同造成了记忆的发育,尽管它们受到其皮质变化的具体模式的限制。

此外,本文还研究了元记忆监测对认知发展的重要性超出了记忆的准确性。如果对记忆准确性内省的能力与学习相关,那么它对于智力发展可能更重要。迄今为止没有研究解决这个问题,因此本文研究了儿童期后期和青春期的记忆监测与智力(IQ)之间的横向纵向关系。

1. 被试

T1: 145名儿童提供行为数据[M(SD)= 9.57(1.09)岁,74名女性],其中141名提供结构MRI数据。 T1还包括31名成年人的行为和结构MRI数据[M(SD)= 19.46(1.61)岁,18位女性]。 T2:T1后约1.4年,包括120名儿童的行为数据[M(SD)= 10.88(1.22)岁,57名女性],其中117名儿童提供结构MRI数据。 T3:T2后约1.3年,包括107名儿童的行为数据(M(SD)= 12.22(1.3)岁,48名女性],其中89名提供结构MRI数据。由Wechsler Abbreviated Scale of Intelligence (WASI)分别测试儿童的IQ:T1 (WASI-I) T3(WASI-II)。该研究得到加利福尼亚大学戴维斯分校机构审查委员会的批准。所有与会者及其家长获得知情同意书。

2. 认知记忆任务

在encoding阶段,每个被试呈现4个户外场景的24个blocks,其中包括16个active blocks和8个passive blocks(图1B)。每个block呈现3秒钟,之后跟着测试场景以确保参与者遵循指示并观察刺激。encoding之后被试进行认知测试,包括48个block场景和32个新场景,并且在被试决策之后对置信度进行打分(三分制)。

3. MRI 采集和分析

扫描获取被试的全脑高分辨率T1像后按照标准程序(Fischl B, DaleAM (2000) Measuring the thickness of the human cerebral cortex from magneticresonance images. Proc Natl Acad Sci USA 97:11050–11055.)使用Freesurfer 5.3进行重建。基于Destrieux atlas(Destrieux C, Fischl B, Dale A, Halgren E (2010)Automatic parcellation of human cortical gyri and sulci using standardanatomical nomenclature. Neuroimage 53:1–15.)提取以下ROIs的皮质厚度:vmPFC,insula, APFC和dACC。

4. 统计分析

T1横向分析包括按中位数将145名儿童分为幼龄组(7.41-9.59岁,n = 72)和大龄组(9.61-12.04岁,n =73),此外还有一组成年人。正确判定和错误判定的差值作为被试的认知准确率,AUC值作为元记忆分辨率。这一措施描述了观察者在自信判断中如何区分正确和不正确的反应,并通过绘制不同级别的累积置信对确定正确与不正确的响应计算AUC。然后使用lme4中实现的多级模型进行纵向分析:首先计算了认知准确率,AUCROC2和皮层厚度随时间的线性或非线性变化。其次计算了不同ROI的皮层变化与AUCROC2随时间变化的相关分析。为了确保我们的结果不依赖于元记忆的精确测量,我们还将meta d'作为基于模型的元记忆监测。

lme4多级模型: 是感兴趣的结果, 是随机截距(对于个体i的初始评估的预测得分), 是随机斜率(个体i的预测变化率), 是自初始评估以来的时间量, 是残差。在第2级模型中, 是个体i第一次参与实验的年龄, 表示T1阶段的9.6岁小孩的预测得分。 2级回归系数 表示截距的横向差异。第二个模型测试了二次关系,并且包括随时间变化的二次效应。在第三个模型中,将 作为线性斜率和二次斜率的预测因子(当需要二次斜率时),以测试个体随时间的变化率是否取决于T1的年龄。我们使用似然比检验来测试模型拟合的差异。性别作为所有模型中level 2的协变量,如果不重要,则从进一步分析中除去。报告的最终模型仅包括显着增加模型稳定性的预测因子。level2的协变量包括每个ROI在T1年龄段的皮层厚度和T1之后的皮质厚度变化。首先,由ROIs在T1的皮层厚度和随时间的厚度变化预测了随机截距。然后测试了每个ROI中的初始厚度和厚度变化是否预测随时间变化的速率(即斜率)。为了排除半脑差异,对左半脑和右半脑分别分析。 Bonferroni校正多重比较应用于ROI和posthoc比较(labeled PBonf)。

1. Age Differences and Change in Recognition Accuracy over Time

使用包含以9.6岁的截距为中心的线性和二次模型来研究被试识别精度的纵向提高,研究发现了时间变化显着的线性(b = 0.061,P <0.05)和二次(b = 0.014,P <0.05)影响,被试认知识别的准确度随时间提高,但与后期相比,前期的提高更显着(图S1)。此外还评估了操作任务难度导致识别精度的差异,在所有儿童和时间点上,识别假想参与场景的准确率高于忽视场景[b = 0.124,P <0.05,Bonferroni校正P(PBonf)<0.05],且高于passive blocks(b = 0.050,P <0.05,PBonf <0.05)(图S1)。假想参与场景相对于被动状态的纵向提高较大(b = 0.020,P <0.05,PBonf = 0.09),但是忽略场景条件相对于被动状态的纵向提高不明显(P> 0.54),彼此没有显着差异(P> 0.13)。在P <0.05水平上相互作用不显着(所有P> 0.08)。总体而言,随着时间的推移,识别准确度得到改善,假想参与场景的识别准确度有最大提高。

2. Age Differences and Change in Metamemory Monitoring over Time

对于T1期间记忆监测的年龄差异的初步评估,本文首先比较了儿童和成人之间正确和不正确反应的平均信心(图2A)。有效的记忆监测反映在对正确反应比对错误反应有更高的判断信心。通过年龄组(年龄较小的儿童与较大的儿童与成年人)×条件(参加与,忽略,被动)×识别准确度(正确与不正确)混合方差分析来检查T1中的信心判断的年龄差异。

研究发现一个显着的年龄组×精度相互作用[F(2,169)= 11.32,P <0.05,partial η2(ηp2)= 0.12],使得参与者在认知测试中正确反应比不正确反应的信心更高。成年人相对于幼童(P <0.05,PBonf <0.05)和较大龄儿童(P <0.05,PBonf <0.05)都表现出显着差异。两组儿童间没有显着差异(P = 0.10,PBonf = 0.30)。与两组儿童相比,成年人元记忆准确性内省能力的年龄差异是由于成年人对错误反应的信心较低[F(2,169)= 5.90,P <0.05,ηp2 = 0.07]。相比之下,正确反应的信心没有年龄差异[F(2,169)= 0.34,P = 0.71,ηp2 = 0.00]。严格来说,当识别精度被包括为协变量[F(2,168)= 9.78,P <0.05,ηp2 = 0.10]时,这个年龄组×准确度相互作用在置信判断中保持显着。

将条件(参与,忽略,被动)作为方差分析中的一个因素以评估编码时的注意力变化是否会导致T1阶段记忆监测的年龄差异。状态×精度有显着相互作用[F(2,338)= 9.96,P <0.05,ηp2 = 0.06]。参与比忽略对正确反应的信心要高(P <0.05,PBonf <0.05),反之忽略高于被动状态(P <0.05,PBonf <0.05)。对错误反应的置信度在不同条件下没有差异(P> 0.47)。在所有年龄组均观察到这种情况,而年龄组间差异无统计学意义(P = 0.37)。其余的相互作用均不显着(Ps> 0.24)。

总之,虽然对正确反应的信心受到条件的影响,但这些影响并不依赖于年龄。因此所有后续分析混合了各种情况下元记忆监测能力的变化。使用以9.6岁为中心的截距和随时间线性变化的模型研究了元记忆分辨率的纵向变化。T1阶段的结果表明大龄组较幼龄组的元记忆分辨率高[b = 0.010,P <0.05;图2B提供了与成年人的横向比较]。时间的线性效应也是显着的(b = 0.014,P <0.05),表明元记忆分辨率随时间变化递增(图2C,D)。当识别精度包含在模型中时,元记忆分辨率与时间的相关任然存在(b = 0.012,P <0.05),这表明元记忆监测能力的纵向提高不仅仅反应在识别精度的提高。这些结果用替代的元记忆敏感性测量法( meta d’)进行了复制,该方法基于信号检测理论(图S2)。

3. Age Differences and Change in CorticalThickness over Time

从先验的ROIs提取皮层厚度,即左右半脑的anterior insula,vmPFC,APFC和dACC。首先研究了T1阶段两组儿童和成人横向的皮层厚度差异(图3)。所有的ROI的皮层厚度都有显着年龄差异(PsBonf <0.05),此外成年人的所有ROI的皮层厚度都比两组儿童的低(PsBonf <0.05),但两组儿童间没有差异(PsBonf> 0.05)。这表明支持元记忆监测的脑区均随年龄增长产生了皮层发育。

其次,使用以9.6岁为中心的截距和随时间线性变化的模型来研究儿童皮层厚度的纵向变化。每个ROI的参数估计和统计分析如图3和表1所示(各个数据点如图S3所示)。在左半球,T1阶段脑岛有显着主效应,在多次比较校正后vmPFC尽管不显着但有主效应趋势。在这脑区,年龄较大的儿童初次评估时的皮层厚度比年龄小的儿童低。时间的线性效应在脑岛中显着,但在APFC,vmPFC或dACC中不显着(图3)。左脑ROI的后续分析表明,脑岛的皮层厚度变薄显着大于dACC(P<0.05,PBonf <0.05)和vmPFC(P <0.05,PBonf <0.05)的皮层厚度变化,比APFC(P<0.05,PBonf = 0.09)的皮层厚度变化有显着趋势。

在右半球,时间的线性效应在脑岛和vmPFC中显着,但在dACC和APFC中不显着(图3和表1)。而随着时间的推移,脑岛的皮层厚度变薄显着,但vmPFC中皮层厚度反而增加了,此外,在APFC中观察到变薄的趋势(P= 0.05,在多次比较校正之前)。对右脑ROIs的组间比较证明脑岛与vmPFC(P <0.05,PBonf <0.05),vmPFC与APFC(P<0.05,PBonf <0.05)之间的发育轨迹有显着异常,而vmPFC和dACC(P= 0.07,PBonf = 0.21)并无显着异常。在左半球或右半球的任何ROI中,时间和高阶相互作用的二次效应不可靠。

总之,这些纵向分析显示了ROIs皮层厚度的不同发育轨迹,脑岛皮层变薄,vmPFC皮层变厚,在研究时间段内dACC或APFC无显着变化。

4. CorticalChanges Predict Metamemory Monitoring Improvement over Time

本研究不仅提供了儿童皮层发育的证据,还研究了这些皮层变化是否预测了记忆监测能力的变化,即ROIs中的初始厚度和厚度变化是否能够预测元记忆分辨率的改善。在左半球,随时间增加脑岛皮层显着变薄的儿童(b = -0.160,P<0.05;图4A),以及随时间增加vmPFC皮层显着变厚的儿童(b =0.158,P< 0.05;图4B),均随时间的推移显示出更高的记忆监测改善率。APFC(b =0.023,P =0.63)和dACC(b =0.017,P =0.68)的变化不能预测元记忆分辨率的变化。此外,对照分析表明,在控制识别准确率后,记忆分辨率的增加率仍然与左侧vmPFC(b =0.13,P =0.02)和左前脑岛(b =-0.14,P =0.01)的变化相关。在右半球,随时间增加脑岛皮层变薄只能大致作为总体记忆分辨率的预测因子(b =-0.090,P =0.05),且与元记忆分辨率的改变不相关。跨半球的模型与左半球观察到的结果类似。

总之,这些结果表明额叶亚区域的皮层发育有助于提高儿童对记忆准确性的内省能力。然而,不同皮层区域有助于记忆监测的方式取决于它们独特的皮层变化模式。研究结果表明,儿童过渡到青春期的元记忆监测能力的增加与脑岛皮层变薄和vmPFC皮层变后有关。

5. Relation of Metamemory Monitoring to Intellectual Ability

元记忆监测能力对规范大脑学习有重要作用,因此这一能力的提高可能也会与智商变化相关。仅在T1和T3两个时间点测量被试的 IQ。因此,使用路径建模(图S4)来研究元记忆分辨率(AUCROC2),识别精度和IQ之间的并发关系以及它们的纵向关系。该模型显示出良好的拟合[χ2(6)=3.46,比较拟合指数(CFI)=1.00,近似均方根误差(RMSEA)=0.00,90%置信区间=0.00-0.09]。T1(r = 0.19,P =0.05)和T3(r =0.17,P =0.07)的IQ和元记忆分辨率之间存在趋势相关。此外T1阶段的IQ可以预测T3阶段的元记忆分辨率(β=0.24,P<0.05),T3时T1预测IQ的记忆分辨率(β=0.26,P<0.05)。因此,元记忆分辨率和智商不仅同时相关,而且在横向和纵向都表现出相互影响。但是记忆监测与智力能力之间的关系不太可能反映与记忆能力的共同关系,因为横向纵向两种分析所用的模型均包含了记忆准确率(图S4)。

总之,本文代表了对理解支持元记忆发展的神经机制研究的第一步,因为元记忆监测能力对学习和决策至关重要。研究结果表明,元记忆监测能力的发育远超儿童中期,并表现为前脑岛和vmPFC的结构变化,而且元记忆监测能力的发育与儿童智力的变化显着相关。因此,对于支持元记忆和元认知的神经认知机制的更好理解对当前的教育发展尤为重要。在这种情况下,寻找提高元认知监测能力的有效途径及其对元认知控制的应用必然有助于指导和改善个体自我管理学习的能力。

参考文献:Yana Fandakova,Diana Selmeczy, Sarah Leckey, Kevin J. Grimm,et al. Changes in ventromedialprefrontal and insular cortex support the development of metamemory fromchildhood into adolescence. PNAS. 2017

网址:http://www.pnas.org/content/early/2017/06/29/1703079114.short

‘柒’ 重要环境地质指标释义

一、地表特征

名称:地表特征

简介:地表特征指标主要测量或监测地表植被的变化及地表面的裸露程度。为衡量草地退化的最为直观的指标之一。一般来说,草地退化的过程是:草地的茂盛程度降低,逐渐稀疏,高度呈下降趋势,耐旱型植物开始逐渐占优势,退化到一定程度,地表的裸露程度不断增加,造成土地沙化、盐渍化等。

意义:草地退化是草地生态系统的退化,其后果表现在各个方面。最直接、最易为人们看到的是草地植被的变化。严重退化的草地,其植物群落的高度,盖度明显下降,据调查,羊草的高度从45cm降到7cm,其盖度即从30%降到10%,而大针茅的高度由27cm降到3cm,盖度由5%降到0%,所以退化的草原最显着的后果是植被的矮化。此后,生产力也大大下降,生物量只有原生植被的40%左右。

植被变化的另一个表现是植物群落组成的变化,在家畜的过度啃食条件下,不耐牧的植物显着减少,而耐牧的植物则被保存下来,其结果导致退化草地由低适口性的植物所组成,这也就是为什么退化草场的最终类型都可能是由耐旱耐牧的植物所组成的原因。在内蒙古典型草原,草原退化后,植物主要由冷蒿、星毛委陵菜构成。

地表植被的分布是反映草地退化最为直观的指标之一,通过统计一个地区草地植被的覆盖度、高度和产草量等参数,可以很好地衡量这个地区的草地退化情况。另外一些标志着某类草地植被类型出现的特征种植物或标志草地出现退化具有指示意义的植物种,也具有很重要的意义。

人为或自然原因:自然因素与人为因素综合作用。

适用环境:适合于处在退化过程中草原地区。

监测场地类型:已出现不同程度植被退化、地表裸露的退化地区。

空间尺度:块段至景观/中尺度至区域尺度。

测量方法:采用面积统计的方法进行测量。方法是随机量取一定面积的地块,分别计算其中草地面积与非草地面积占其总面积的百分率。

测量频率:1~2年。

数据与监测的局限性:在进行指标参数测量和计算的过程中,会有部分人为主观因素的影响。

过去与未来的应用:仝川(2000)根据地被物明显减少、地被物消失以及表土裸露,甚至出现盐碱斑为临界值,将草地退化程度划分为轻度、中度、重度3个等级。李博(1997)以地被物明显减少、地被物消失、地表裸露、呈现裸地或盐碱斑为临界值,划分出轻度、中度、重度和极度退化4个等级。我国现行的国家标准——天然草地退化、沙化、盐渍化的分级指标(GB 19377—2003)其中也包括对地表特征的监测参数(见表4-7)。

可能的临界值:对于草地退化、草地沙化和草地盐渍化,浮沙堆积面积占草地面积相对百分数的增加率、盐碱斑面积占草地面积相对百分数的增加率2个参数有不同的临界值。

生态环境地质指标研究

主要参考文献:

李博.中国北方草地退化及其防治对策.中国农业科学,1997(6):1-9.

天然草地退化、沙化、盐渍化的分级指标(GB 19377—2003).

仝川.草地退化指数的研究.内蒙古大学学报(自然科学版),2000(5):508-512.

其他资料来源:农林牧、环保等相关部门。

有关的环境与地质问题:草地退化、草地沙化和草地盐渍化。

总体评价:可用于测量和监测草地退化、草地沙化和草地盐渍化的现状及发展趋势。

二、土壤理化性质

名称:土壤理化性质

简介:土壤理化性质包括土壤物理特性和土壤化学特性。物理特性包括土壤结构、土壤质地、土壤含水量、土壤容重等,化学特性包括酸碱度(pH值)、含盐量等。

意义:土壤的物理特性主要指土壤温度、水分含量及土壤质地和结构等。土温是太阳辐射和地理活动的共同结果。不同类型土壤有不同的热容量和导热率,因而表现出相对太阳辐射变化的不同滞后现象。这种土温对地面气温的滞后现象对植物有利,影响植物种子萌发与出苗,制约土壤盐分的溶解、气体交换与水分蒸发、有机物分解与转化。较高的土温有利于土壤微生物活动,促进土壤营养分解和植物生长。土壤水分直接影响各种盐类溶解、物质转化、有机物分解。土壤水分不足不能满足植物代谢需要,会产生旱灾,同时好气性微生物氧化作用加强,有机质消耗加剧。水分过多使营养物流失,还引起嫌气性微生物缺氧分解,产生大量还原物和有机酸,抑制植物根系生长。土壤中空气含量和成分也影响土壤生物的生长状况,土壤结构决定其通气度,其中CO2含量与土壤有机物含量直接相关,土壤CO2直接参与植物地上部分的光合作用。土壤的质地、结构和土壤的水分空气和温度状况密切相关,并直接或间接的影响着植物和土壤动物的生活。沙土类土壤黏性小,气孔多,通气透水性强,蓄水和保肥能力差,土壤温度变化剧烈;黏土类土壤的质地黏重,结构紧密,保水保肥能力强,但孔隙小,通气透水性差,湿时黏干时硬;壤土类土壤的质地比较均匀,土壤既不太松又不太黏,通气透水性能良好且有一定的保水保肥能力。

土壤化学特性主要包括酸碱度(pH值)、含盐量等。土壤酸碱度是土壤最重要的化学性质,因为它是土壤各种化学性质的综合反映,对土壤肥力、土壤微生物的活动、土壤有机质的合成和分解、各种营养元素的转化和释放、微量元素的有效性以及动物在土壤中的分布都有着重要的影响。土壤酸碱度(pH值)间接影响生物对矿质营养的利用,它通过影响微生物的活动和矿质养分的溶解度进而影响养分的有效性。对一般植物而言,土壤pH=6~7时养分的溶解度最高,最适宜植物生长。在强碱性土壤中容易发生铁、硼、铜、锰、锌等的不足;在酸性土壤中则易发生磷、钾、钙、镁的不足。

人为或自然原因:人为/自然因素综合作用。

适用环境:适用于干旱、半干旱地区的草地类型。

监测场地类型:适合在有较厚第四系堆积层的草原地区监测。

空间尺度:适宜在小-中尺度的区域进行测量与监测。

测量方法:土壤理化性质包括土壤结构、土壤质地、土壤含水量、土壤容重、土壤酸碱度(pH值)、土壤含盐量等。

(1)土壤结构:是指土壤颗粒(包括团聚体)的排列与组合形式。土壤结构是成土过程或利用过程中由物理的、化学的和生物的多种因素综合作用而形成,按形状可分为块状、片状和柱状3大类型;按其大小、发育程度和稳定性等,再分为团粒、团块、块状、棱块状、棱柱状、柱状和片状等结构。其测量方法主要采用野外直接描述测定。

(2)土壤质地:土壤质地即土壤机械组成,是指土壤中各级土粒含量的相对比例及其所表现的土壤砂粘性质。可划分为3大质地类型,即沙土类、壤土类和粘土类。可采用野外直接描述测定和野外采样实验室分析2种方法。

野外直接描述测定方法:根据土壤中砂粒、粉粒和黏粒三级含量,并参考砾石量,可划分为3大质地类型,即沙土类、壤土类和粘土类。各种土壤质地如下:

沙土:干土块不用力即可用手指压碎,肉眼可看出是沙粒,在手指上摩擦时,可发出沙沙声。抓一把沙用手捏紧,沙粒即行下泻,愈紧握下泻愈快。湿时不能揉成球,或在水分较多时,能揉成球或粗条状,但都有裂缝。胶结力弱,用力即碎。

沙壤土:干土块不用力即可用手指压碎,用小刀在其上刻划有条纹,痕迹不整,肉眼可见单粒,摩擦时也有沙沙声。湿土可揉成球,亦可搓成圆条。

粉沙壤土:干土块压碎用力较大,用小刀刻划,痕迹较沙壤土明显,但边缘破碎不齐。干摩擦时仍有沙沙声。湿土可搓成球,稍用力也致散开,有一定可塑性,可揉成圆条,粗约3毫米,手持一段,即破碎为数段。

壤土:干土块压碎时必须用相当大的力量,用刀刻划,刀痕粗糙,唯边缘稍平整,湿土可揉成细圆条状,弯成直径2~3cm的小圆圈时,既出现裂缝折断。

粉沙粘壤土—粘壤:干土块用手指不能压碎,用刀刻划痕迹较小,湿土用力较大也可搓成球,手揉时,不费力即可揉成粗为1.5~2mm细条,也可变成直径为2cm的圆环,压扁圆环时,其外圈部分发生裂缝,可塑性较大,可用两指搓成扁平的光面,光滑面较粗糙,不显光亮。很湿的土置于二手指间,再抬手指,粘着力不强,有棱角.

粘土:干土块坚硬,手指压不碎,湿土可揉成球或细条,但仍会有裂缝,手揉时较费力。干土加水不能很快浸润,粘性大,很湿的土置于二指间粘力较大,有粘胶的感觉。土壤压成扁片时,表面光滑有反光。

重粘土:干土十分坚硬,以斧头打始碎,土块有白痕,并粘在斧上,湿土可塑性大,粘着力更强,搓成条或球均光滑,手指感觉细腻,塑性甚大,土壤压成片时表面光滑有亮光。

野外采样实验室分析方法:采用筛分法,分析采集的土壤样本的颗粒组成,按DT-82土工试验规程进行命名。

(3)土壤含水量:土壤中所含水分的数量。一般是指土壤绝对含水量,即100g烘干土中含有若干克水分。也称土壤含水率。可采用野外直接描述测定和野外采样实验室分析2种方法。

野外直接描述测定方法:采用TDR水分测定仪测定。

野外采样实验室分析方法:采用烘干称重法。野外用环刀取样并即时称重,实验室用恒温箱对土壤样本进行烘干后称重,由此计算土壤总量含水量。

(4)土壤容重:一定容积的土壤(包括土粒及粒间的孔隙)烘干后的重量与同容积水重的比值。它与包括孔隙的1立方厘米烘干土的重量用克来表示的土壤容重,在数值上是相同的。采用野外采样实验室分析方法。

(5)土壤酸碱度(pH值):又称“土壤反应”。它是土壤溶液的酸碱反应。主要取决于土壤溶液中氢离子的浓度,以pH值表示。可采用野外直接描述测定和野外采样实验室分析2种方法。

野外直接描述测定方法:采用土壤pH计测定。

野外采样实验室分析方法:采用电位测定法进行测定。

(6)土壤含盐量:指土壤中盐分的含量。采用野外采样实验室测定方法。

测量频率:5~10年。

数据与监测的局限性:在指标参数的野外测定过程中,会受人为主观因素的影响,另外实验室分析数据也可能存在一定的误差。

过去与未来的应用:陈有君、红梅等(2004)研究过浑善达克沙地不同植被下的土壤水分状况,结果表明植物的生长使根层土壤含水量下降,而且不同植物利用水的土层及利用土壤水的量不同。在干旱半干旱地区,植被影响着降水在土层中的分布及地表的蒸散条件,使土壤有效水向浅层分配。而降水在土壤不同深度的分配及入渗深度,决定着地表植被的生活型,从而影响地表植被的演替方向及顶级类型。

朱志梅、杨持等(2007)以内蒙古多伦县为例,进行了草地退化对土壤理化性质质的影响研究。结果表明,随着草地退化的加剧:①土壤颗粒组成发生变化,黏粒含量趋于减少,砂粒增多。不同粒径对土壤团粒结构形成和保水保肥的贡献不同,黏粒的减少抑制了土壤的膨胀、可塑性及离子交换等物理性质。②土壤含水量下降。上层(0~20cm)土壤含水量下降明显,随着沙漠化梯度的增加,表层土壤含水量下降速度加快,从而深层土壤含水量逐渐高于表层。③土壤容重呈上升趋势。容重的增加必然影响土壤中水分和空气的移动及植物根系的发育。不同深度的土壤容重与草地退化也存在一定的关系,潜在阶段深土层(30~50cm)的容重最小,而严重阶段表土层(0~5cm)容重最小。④土壤有机质、C、N含量下降,方差分析显示各沙漠化梯度间均差异极显着。且土壤N的衰减要快于C。土壤C/N比呈增加趋势,说明伴随着土壤C,N的显着下降,质地变粗,植物N素供应不足更为突出。⑤土壤容重与土壤全N,C及黏粒含量的相关分析表明,细颗粒物多,有机质含量高,土壤容重减小,从而有助于提高土壤的稳定性,且5~10cm土层的性质表现突出。⑥土壤的颗粒组成状况与土壤营养元素之间有着同增同减性,但黏粒与N的关系要密切于黏粒与C和C,N间的关系。因此,土壤中细颗粒物的减少会导致N素的衰减十分明显,从而导致土壤稳定性降低。

可能的临界值:对于草地退化,有土壤容重相对百分数的增加率的临界值;对于草地沙化,有土壤质地>0.05mm粗砂粒含量相对百分数的增加率、<0.01mm物理性粘粒含量相对百分数的减少率的临界值;对于草地盐渍化,有土壤含盐量、土壤酸碱度的临界值。

生态环境地质指标研究

其他可能的临界值:一般含矿物质多而结构差的土壤(如砂土),土壤容积比重在1.4~1.7之间;含有机质多而结构好的土壤(如农业土壤),在1.1~1.4之间。土壤酸碱度对土壤肥力及植物生长影响很大,我国西北、北方不少土壤pH值大,南方红壤pH值小。因此,可以种植和土壤酸碱度相适应的作物和植物。如红壤地区可种植喜酸的茶树,而苜蓿的抗碱能力强等。土壤酸碱度对养分的有效性影响也很大,如中性土壤中磷的有效性大;碱性土壤中微量元素(锰、铜、锌等)有效性差。在农业生产中应该注意土壤的酸碱度,积极采取措施,加以调节。土壤pH=6~7时养分的溶解度最高,最适宜植物生长。另外土壤含盐量超过0.3%,土壤便会发生盐碱化。

主要参考文献:

陈有君,红梅等.浑善达克沙地不同植被下的土壤水分状况.干旱区资源与环境.2004,18(1):68-73.

天然草地退化、沙化、盐渍化的分级指标(GB 19377—2003).

朱志梅,杨持等.多伦草原土壤理化性质质在沙漠化过程中的变化.水土保持通报,2007年,27(1):1-5.

其他资料来源:农林牧、环保等相关部门。

有关的环境与地质问题:草地退化、草地沙化及草地盐渍化。

总体评价:土壤的理化性质是反映自然和人为因素的灵敏指标,有助于进行草地退化的监测。

三、土壤养分

名称:土壤养分

简介:土壤养分指土壤中的养分贮量、强度因素和容量因素,主要取决于土壤矿物质及有机质的数量和组成。就世界范围而言,多数矿质土壤中的氮、磷、钾三要素的大致含量分别是0.02%~0.5%、0.01%~0.2%和0.2%~3.3%。但土壤向植物提供养分的能力并不直接决定于土壤中养分的贮量,而是决定于养分有效性的高低;而某种营养元素在土壤中的化学位又是决定该元素有效性的主要因素。化学位是一个强度因素,从一定意义说,它可以用该营养元素在土壤溶液中的浓度或活度表示。由于土壤溶液中各营养元素的浓度均较低,它们被植物吸收以后,必须迅速地得到补充,方能使其在土壤溶液中的浓度即强度因素维持在一个必要的水平上。所以,土壤养分的有效性还取决于能进入土壤溶液中的固相养分元素的数量,通常称为容量因素。在实用中,养分容量因素常指呈代换态的养分的数量(代换性钾、同位素代换态磷等)。土壤养分的实际有效性,即实际被植物吸收的养分数量,还受土壤养分到达植物根系表面的状况,包括植物根系对养分的截获、养分的质流和扩散三方面状况的影响。

意义:土壤养分是土壤化学性质的体现。但与土壤的酸碱度等参数相比,土壤养分指标对植物生长的过程具有相当的控制作用,植物生长发育主要取决于土壤中有机质和氮磷钾含量,且还受这几者之间供给比例的影响。J.von Liebig(1843)提出了植物生长的最小养分律,意指植物的产量由含量最少的养分所支配的定律。如果相对增加最少的某个因子(最少因子),那么产量将与此成比例地增加。其次如果其他某个因子成为相对最少时,产量也不会增加,一旦增加这个因子,则产量就会再次增加。例如氮供给不充足时,即使多施磷等,但植物产量仍受氮的施用量所决定。

另外,除主要的养分因素之外,土壤还提供植物体生长发育的一些微量元素。微量元素虽然在植物体内的含量不多,但与其生长发育息息相关。微量元素最突出的作用是与生命活力密切相关,能发挥巨大的生理作用。其中B、Mo、Cu、Zn、Fe、Mn等微量元素对植物的生长具有重要意义。

人为或自然原因:土壤养分主要取决于土壤矿物质及有机质的数量和组成,但受人为活动影响。

适用环境:适用于干旱、半干旱地区的草地类型。

监测场地类型:适合在有较厚第四系堆积层的草原地区开展监测。

空间尺度:适宜在小至中尺度的区域进行测量与监测

测量方法:具体测量参数为有机质、氮、磷、钾及一些微量元素。

土壤有机质:泛指土壤中来源于生命的物质。包括:土壤微生物和土壤动物及其分泌物以及土体中植物残体和植物分泌物。

氮、磷、钾:氮是构成蛋白质的主要成分,对茎叶的生长和果实的发育有重要作用,是与产量最密切的营养元素。磷能够促进幼苗根系生长和改善植物品质。钾能促进植株茎秆健壮,改善植物品质,增强植株抗寒能力。

微量元素:生物体是由60多种元素所组成,其中C、H、O、N、Ca、P、Mg、Na等含量较大的元素,称为宏量元素。而占生物体总重量0.01%以下的如Fe、Zn、Cu、Mn、Cr、Se、Mo、Co、F等,为微量元素。微量元素虽然在生物体内的含量不多,但与生物体的生存和健康息息相关。它们的摄入过量、不足、或缺乏都会不同程度地引起生物体生理的异常或发生疾病。微量元素最突出的作用是与生命活力密切相关,能发挥巨大的生理作用。而这些微量元素必须直接或间接地由土壤供给。到目前为止,已被确认与人体健康和生命有关的必需微量元素有18种,即有Fe、Zn、Cu、Mn、Cr、Se、Co、I、Ni、F、Mo、V、Sn、Si、Sr、B、Ru、As等。

测量方法主要采用野外取样实验室测试方法。

测量频率:5~10年

数据与监测的局限性:数据的获取主要依靠实验室分析获取,在经济上受一定限制,因此该项指标不宜开展大规模的测量和监测。

过去与未来的应用:国内的研究者对土壤养分与地表植被退化的相关性进行了大量的研究。如赵利君,王艳荣等(2005)进行了土壤养分在草原退化过程中的变化分析,研究了三个不同退化强度草原的有机质含量和全磷含量的差异及其季节变化,结果表明,不同群落土壤有机质和全磷含量大小顺序都为:未退化群落>中退化群落>重退化群落,方差分析指出中度退化群落与不退化群落土壤有机质的最大差异出现在0~10cm土层处,而重度退化群落与中度退化群落土壤有机质的最大差异出现在10~20cm土层处。在0~10cm层次三种群落全磷含量之间都没有显着差异。在10~20cm和20~40cm层次上,未退化群落与中度、重度退化群落之间存在极显着差异。中、重度退化群落之间差异不显着。

闫顺国(1991)对河西走廊盐渍化草地土壤生态环境进行了研究,分析了土壤盐分组成对植被生长的影响,对土壤盐分组成,pH及有机质含量(OM)进行了主成分分析。结果表明,各变量在环境分类中的作用秩序为:。

钟志祥、万开元等(2006)研究了武汉植物园迁地保护植物樟科和木兰科21种珍稀植物的营养状况及其所生长土壤的营养条件。结果表明:酸性土壤中Fe、Mn、Cu、Zn、B、Mo 6种微量元素的有效态含量顺序为Fe>Mn>Cu>Zn>B>Mo,其平均值大小与全国平均值相差不大;植物叶片中微量元素含量大小顺序为Fe>Mn或(Mn>Fe)>B>Zn(或Zn>B)>Cu>Mo,与正常含量范围相比,所有植物Mn含且偏高,部分植物Fe含量较大,Cu、Zn、B含量较为正常,Mo含量偏低,生物吸收系数大小顺序为Zn>Fe>Mn>B>Cu。

可能的临界值:对于草地退化,有0~20cm土层有机质含量相对百分数的减少率和0~20cm土层全氮含量相对百分数的减少率的临界值;对于草地沙化,有有机质相对百分数的减少率、全氮含量相对百分数的减少率的临界值:

生态环境地质指标研究

其他可能的临界值:多数矿质土壤中的氮、磷、钾三要素的大致含量分别是0.02%~0.5%、0.01%~0.2%和0.2%~3.3%。

主要参考文献:

天然草地退化、沙化、盐渍化的分级指标(GB 19377—2003).

闫顺国.河西走廊盐渍化草地土壤生态指标的选择与分类.草业科学,1991,8(3):22-25.

赵利君,王艳荣等.土壤环境质量在草原放牧退化过程中的变化研究.内蒙古科技与经济,2005:35-36.

钟志祥,万开元,余场冰等.21种迁地保护植物微量元素与土壤养分状况分析.中南林学院学报,2006(10).

其他资料来源:农林牧、环保等相关部门。

有关的环境与地质问题:草地退化、草地沙化及草地盐渍化。

总体评价:土壤养分是土壤化学性质的体现。但与土壤的酸碱度等参数相比,土壤养分指标对植物生长的过程具有相当的控制作用,植物生长发育主要取决于土壤中有机质和氮磷钾含量,且还受这几者之间供给比例的影响。

四、地下水水位与水质

名称:地下水水位与水质

简介:地下水水位指的是指地下含水层中水面的高程。根据钻探观测时间可分为初见水位、稳定水位、丰水期水位、枯水期水位、冻前水位等。作为草地生长的地下水分“仓库”,地下水对植物的生长发展有着及其的作用。研究表明,地下水位埋深很大程度上决定着地表植被的生长状况。地下水位是由降水和地表水下渗量等因素所控制。还在一定程度上取决与人类的活动,如农业灌溉抽取地下水、居民生产生活用水等。

地下水水质指未经人类活动污染的自然界地下水的物理化学特性及其动态特征。物理特性主要指水的温度、颜色、透明度、嗅和味。水的化学性质由溶解和分散在天然水中的气体、离子、分子、胶体物质及悬浮质、微生物和这些物质的含量所决定。天然水中溶解的气体主要是氧和二氧化碳;溶解的离子主要是钾、钠、钙、镁、氯、硫酸根、碳酸氢根和碳酸根等离子。生物原生质有硝酸根、亚硝酸根、磷酸二氢根和磷酸氢根离子等。此外,还有某些微量元素,如溴、碘和锰等。胶体物质有无机硅酸胶体和腐殖酸类有机胶体。悬浮固体以无机质为主。微生物有细菌和大肠菌群。地下水水质主要与含水层岩石的化学成分和补给区的地质条件有关,除此之外还受人类活动影响。

意义:在干旱半干旱地区,地下水位与水质和生态环境的关系十分密切。尤其对于植物的生长发育,有着密不可分的关系。我国西北地区是典型的干旱半干旱地带,干旱少雨,蒸发量大,年降水一般在400 mm以下,荒漠地带则在250 mm以下,局部地区甚至只有30~40 mm,其地带性植被为荒漠植被,十分稀疏。对生态环境起主要作用的是依靠地下水维持生存的非地带性中生和中旱生植被。

人为或自然原因:地下水位和水质的变化受气候降水的影响,也与岩土性质有关,但也受人类活动的制约。

适用环境:适用于干旱、半干旱地区的草地类型。

监测场地类型:适合在地下水位埋深较浅的草原地区开展。

空间尺度:适宜在小至中尺度的区域进行测量与监测

测量方法:地下水水位与水质的测量参数包括潜水位埋深、总溶解固体。

潜水位埋深:潜水井中地下水的自由表面为潜水面。潜水面的绝对高程为潜水位,从地表到潜水位的深度称为潜水位埋深。

总溶解固体:总溶解固体是水化学成分测定的重要指标,用于评价水中总含盐量,是农田灌溉用水适用性评价的主要指标之一。

测量方法:地下水位采用野外实际观测方法测量,总溶解固体主要采用野外取样实验室测试方法,主要有重量法,电导法,阳离子加和法,离子交换法,比重计法等。

测量频率:3~5年。

数据与监测的局限性:潜水位的测量若无较好的潜水井,在野外较难测定;地下水质数据的获取主要依靠实验室分析获取,在经济上受一定限制,因此该项指标不宜开展大规模的测量和监测。

过去与未来的应用:国内的众多学者对植物与地下水位之间的关系也做了大量的研究。有学者提出把满足干旱区非地带性天然植被生长需要的地下水位埋藏深度称作生态地下水位(简称生态水位)。还有学者从不同角度研究了植物生长与地下水位的关系,提出了适宜水位、最佳水位、盐渍临界深度、生态警戒水位等等。

如杨泽元、王文科等(2006)从陕北风沙滩地区水资源可持续发展的角度深入探讨了地下水位埋深与植被生长及土地荒漠化的关系,提出了“生态安全地下水位”的概念,将其定义为“在干旱半干旱地区,维系植被的正常生长,维系河流、湖泊、沼泽(或湿地)正常的生态功能,且不发生土地荒漠化、水质恶化、地面沉降等生态环境问题的地下水位埋深”。通过研究表明:陕北风沙滩地区地下水位埋深小于1.5m为盐渍化水位埋深,1.5~3m为最佳地下水位埋深,3~5m为乔灌木承受地下水位埋深,5~8m为警戒地下水位埋深,8~15m为乔木衰败地下水位埋深,大于15m为乔木枯梢地下水位埋深。

张丽、董增川等(2004)以生态适宜性理论为基础,根据塔里木河干流流域典型植物的随机抽样调查资料,建立了干旱区几种典型植物生长与地下水位关系的对数正态分布模型。根据建立的模型得出干旱区典型植物的最适地下水位。结果表明:①最适地下水位:干旱区典型植物出现频率最高的地下水埋深分别为:胡杨2.51m,柽柳2.2m,芦苇1.36m,罗布麻2.51m,甘草2.39m,骆驼刺2.84m。最适宜区间为2~3m。②生态地下水位:适宜干旱区植物正常生长的地下水位为2~4m。因此,干旱区合理的生态地下水位应保持在2~4m之间,这样才有利于植被生长和生态环境恢复。③植物的生态幅度:不同的植物对地下水位的忍耐范围不同,胡杨、怪柳、骆驼刺的方差较大,说明它们可以在较大的地下水位范围内生存,生态幅度较大;芦苇、罗布麻、甘草的方差较小,说明它们可以在较小的地下水位范围内生存,生态幅度较小。④植被盖度、频率与地下水位的关系:植被盖度!出现频率与地下水位存在一定的关系,在植被最适地下水位附近,植被生长最好,出现频率最高,相应的植被盖度最高;在植物的适宜地下水范围内,植被生长良好,出现频率较高,相应的植被盖度也较高;在其他地下水范围内则植被长势受水分亏缺或土壤盐渍化的影响,生长相对不好,出现频率相应就低,盖度也低。

纪连军、高洪彬等(2006)研究了半干旱地区地下水位埋深对杨树生长发育的影响,结果表明在半干旱地区,当地下水位埋深在1.2~2.5m时,杨树幼树生长发育正常,幼树基本无枯梢枯干现象;当地下水位深度超过3m时,幼树枯梢枯干现象随地下水位下降而增多。

周绪、刘志辉等(2006)研究了新疆鄯善南部地区地下水位降幅对天然植被衰退过程的影响分析,研究结果表明地下水位降幅位于5~8m之间为天然植被覆盖变化敏感区间,降幅超过10m天然植被将会出现严重衰败。

可能的临界值:对于草地盐渍化,有潜水位和总溶解固体相对百分数的减少率的临界值:

生态环境地质指标研究

其他可能的临界值:水的总溶解固体通常以1l水中含有各种盐分的总克数来表示(g/l)。根据总溶解固体的大小,水可分为以下5种。

生态环境地质指标研究

主要参考文献:

天然草地退化、沙化、盐渍化的分级指标(GB 19377—2003).

杨泽元,王文科等.陕北风沙滩地区生态安全地下水位埋深研究.西北农林科技大学学报(自然科学版),2006,34(8):67-74.

张丽,董增川等.干旱区典型植物生长与地下水位关系的模型研究.中国沙漠,2004,24(1):110-113.

其他资料来源:农林牧、环保等相关部门。

有关的环境与地质问题:草地退化、草地沙化及草地盐渍化。

总体评价:地下水位和水质与植物的生长有着不可分割的联系,不同植物种属对于地下水位有着不同的需求,地下水位和水质的变化直接决定着地上植被群落的演替。近年来,我国北方的大部分地区地下水位都存在不同程度的下降,伴随着这个过程,大量的亲水性植被开始凋落,耐旱型植被逐渐占优势,若地下水位持续下降,很可能导致大面积的植被凋谢和死亡,促成草地退化和土地退化。

‘捌’ 急用呀!生物专业英文文献翻译,要求人工翻译,语句通顺,谢谢,满意后加分~ 急用,越快越好~谢谢好心人~

2.6 统计分析
在一个完全随机区组设计中对所有在当前的研究中获得的数据进行分析。在实验一中,采用单向方差分析测试,不同处理之间显着性差异水平定为(P<0.05),用邓肯多重比较方法检验。在实验二中,对作为的2×2因子安排的完全随机区组设计的处理数据进行分析。益生菌产品的主要成效(LF或SF),抗生素(粘菌素或洁霉素),和他们的相互作用由SAS的混合程序计算。然而,当相互作用(益生菌x抗生素)没有统计学意义时(P<0.05),它就要从最终的模型中剔除。在这两个实验中所有分析中都以畜舍为实验单位。在统计分析中细菌数转化为log计数。
3 结果
3.1 实验1
3.1.1 生长性能和表观总消化道消化率
猪在第一阶段的饮食处理对性能没有影响(表3)。然而,在第二阶段和整个试验期间,当与饲喂NC饮食的猪相比时,饲喂PC,LF和SF饮食的猪其ADG,ADFI和G:F显着提高(P<0.05)。而且,饲喂PC和SF饮食的猪有更高的平均日增重,在第二阶段和整个试验期间更好的G:F比饲喂SF饮食的猪有更高的平均日增重。在干物质和总能的总体表观消化率上不同的饮食处理没有影响,然而,与饲喂NC和LF的猪相比,饲喂PC和SF的猪有更多的粗蛋白总体表观消化率(表4)。
3.1.2 粪便中的细菌数量
不同的饮食处理对粪便中的第14天和28天的厌氧菌和双歧杆菌属和第14天的乳酸菌属没有影响(表5)。然而,饲喂PC(第14天和28天)和SF(第28天)的猪比饲喂NC的猪有较少的粪便梭菌属和大肠杆菌群。而且,饲喂SF的猪比饲喂NC,PC和LF的猪有更多的乳酸菌属。
3.2 实验2
3.2.1 生长性能和表观总消化道消化率
在第一阶段,饲喂SF的猪比饲喂LF的猪消耗更多的饲料,饲喂SF和饲喂LF的猪的总体表观消化率和平均日增重是相同的(表6)。在第二阶段和整个试验期间饲喂SF的猪比饲喂LF的猪表现出更好的ADG(P<0.01),ADFI(P<0.01)和G:F(P<0.05)。然而,在猪的性能上,不同的抗生素没有影响。在第一和第二阶段中,饲喂SF的猪比饲喂LF的猪有更多的干物质和粗蛋白的总体表观消化率(表7)。然而,对干物质,粗蛋白和总能量的总体表观消化率不同的抗生素没有影响。

阅读全文

与利用方差分析筛选特异菌群的方法相关的资料

热点内容
气舍穴最佳取穴方法 浏览:570
风管连接可以采取哪些方法 浏览:450
红枣用什么方法做效果好 浏览:946
窗口的关闭按钮在哪里设置方法 浏览:87
回忆性散文一般常用的叙述方法 浏览:282
房门对卫生间门解决方法 浏览:604
一年级什么是口算方法 浏览:876
宫颈糜烂度的治疗方法 浏览:948
科学种植致富的方法 浏览:540
灵卡预测最简单方法 浏览:370
微信转移通讯录在哪里设置方法 浏览:366
旅行备用手机使用方法 浏览:673
课堂游戏互动属于什么教学方法 浏览:434
食用粘液的使用方法 浏览:70
手机指纹解锁的正确方法 浏览:558
防水地漏的安装方法图解 浏览:77
月亮餐的制作方法视频 浏览:248
小熊电烤箱使用方法 浏览:203
治疗宫颈炎最好方法 浏览:661
对孩子使用手机好的方法和建议 浏览:619