1. 20世纪谁发明了什么那国人哪年发明的
这个问题其实问的就是二十世纪的发明以及有关发明家的详情,有关发明举例解释如下:
1、蒸汽机:推动了整个工业革命的发展(发明人瓦特)
传统的马力或者水力无法提供工业革命所需的动力,蒸汽机能量的开发为世界带来了一种更有效更强大的动力。虽说古人在公元前2世纪就已经开始这方面的探索,但直到瓦特的蒸汽机面市后,才真正开启了蒸汽机的商业价值。许多历史学家认为,蒸汽机的开发是工业革命最重要的发明之一,因为蒸汽机的出现带动了冶金、煤矿和纺织业的发展。蒸汽机的出现及纺织业的机械化,提高了工业的用铁量。由于英国拥有丰富的铁矿和煤矿,需求量的增加刺激了冶铁技术和煤矿业的改进,同时加快了工业化的步伐。1804年出现的蒸汽机火车和1807年出现的蒸汽机轮船大大改善了运输条件,辅助了工业革命的发展。
2、电话:掀开人类通讯史的新篇章(发明人贝尔)
“沃森先生,请立即过来,我需要帮助!”这是1876年3月10日电话发明人亚历山大·贝尔通过电话成功传出的第一句话,电话从此诞生了,人类通讯史从此掀开了一个全新的篇章。
人类进行无线通讯的梦想则是1973年在美国纽约实现的。当时,这台世界上第一个实用手机体积大,重达1.9 公斤,是名副其实的“大哥大”。26年后的今天,世界最小的手机也诞生了,它只有寻呼机那么大,也比第一代手机轻了不少。
1964年是人类通讯史上另一个重要转折点,这年夏天,全世界成千上万的观众通过电视第一次收看由卫星转播的日本东京奥林匹克运动会实况。这是人类有史以来第一次通过电视屏幕同时间观看千里之外发生的事,人们除了感叹奥运精彩壮观的开幕式和各种比赛外,更惊叹于科技的进步。这一切都归功于哈罗德·罗森发明的地球同步卫星。
1969年夏天,国际互联网的雏形在美国出现,它由四个电脑网站组成,一个在加州大学分校,另三个在内华达州。1972年,实验人员首次在实验网络上发出第一封电子邮件,这标志着国际互联网开始与通讯相结合。到了90年代,国际互联网开始转为商业用途。1995年网络发展到第一个高潮,这一年被称为国际互联网年。在电子商业浪潮的推动下,国际互联网在21世纪对人类社会的影响将更加深远。
3、汽车:载着时代向前奔驶(发明人法国人居纽)
汽车改变了人类的整个交通状况,拥有汽车工业成了每一个强大工业国家的标志。
汽车走过这样一段历史:1771年,法国人居纽设计出蒸汽机三轮车;1860年,法国人雷诺制造出了以煤炭瓦斯为燃料的汽车发动机;1885年,德国人本茨和戴姆勒各自完成了装有高速汽油发动机的机车和装有二冲程汽油发动机的三轮汽车,并且成功企业化;1908年,美国人福特采用流水式生产线大量生产价格低、安全性能高、速度快的T型汽车。汽车的大众化由此开始;1912年,凯迪拉克公司推出电子打火启动车,使妇女也开始爱上汽车;1926年,世界第一家汽车制造公司戴姆勒·本茨公司成立;1934年,第一辆前轮驱动汽车面世;1940年,大战令许多汽车制造商停产,欧洲车商开始转向生产军用车辆;50年代,德国沃尔沃的甲壳车轿车一经推出就成为最受欢迎的汽车;1970年到2000 年,日本车在亚洲走俏,丰田、本田、三菱以及日产特高技术小型车入侵欧美市场,改写了欧美牌子垄断的局面。
实际上,汽车的发明使人类的机动性有了极大的提高,使20世纪人类的视野更加开阔,更追求自由。当然,汽车工业的发展也带来了道路网挤占土地资源、大气污染和高昂的车费等问题,但不管怎么说,汽车确实载着人类向前发展,向前奔驶。
4、电视:人类自己创造的“魔鬼”(发明人发明家保罗.尼普科夫)
现代人可以一天不吃饭,不喝水,但不能一天没有电视。
电视的设想和理论早在1870年就出现过。1884年,德国发明家保罗.尼普科夫设计了全个穿孔的“扫描圆盘 ”,当圆盘转动的时候,小孔把景物碎分成小点,这些小点随即转换成电信号,另一端的接收机把信号重组成与原来图像相同但粗糙的影像。1926年,苏格兰人约翰·贝蒙德采用尼普科夫的“大圆盘”制造了影像机。
真正制造出画面稳定的电视是从俄罗斯移民到美国的拉基米尔·佐里金和出生在美国犹它州的菲洛·法恩斯沃思。在 1939年的世界博览会上,世界第一台真正清晰的电视开播,电视真正诞生了。
5、电脑:人类未来的希望(发明人艾克特)
1946年2月4日,美国军方和政府部门的代表、着名的科学家一起挤在宾夕法尼亚大学的一个房间里。当一位陆军将军轻轻按下电钮后,占满整整三堵墙的机器立即亮了起来,人们热烈鼓掌,高声欢呼:“ENIAC活了!”并且向总工程师埃科特祝贺。“ENIAC”就是世界上第一台电脑。
6、世纪重大发明--胰岛素(发明人梅宁和明考斯基)
在人类尚未发现胰岛素之前的19世纪,糖尿病还是一种致命的疾病,患者经常在饱受极度的饥渴之后,死于营养不良。“糖尿病”这个名字就源于患者尿中含有高糖。但那时人们对真正的病因并不清楚。
1889年,梅宁和明考斯基在法国的斯特拉斯堡,人为地从狗的身上摘除了胰腺,于是这只狗得了糖尿病。这就证明,糖尿病是由胰腺功能失调、胰腺的分泌物缺乏所引起的。1901年,美国病理学家尤金·奥佩研究了胰腺分泌的神秘物质。1909年,这种物质最终被命名为“胰岛素”。正是它帮助人体细胞吸收糖分。为肌体提供必需的能量。直到20世纪20年代,时任加拿大多伦多大学医学院教师的班廷和他的学生贝斯特,在糖类代谢专家麦克劳德的协助下,第一次从狗的胰腺中提取了胰岛素,并注射到另一只因摘除胰腺而得了糖尿病的狗体内,狗的血糖很快恢复到正常水平。1922年1月11日,班廷为十四岁的患者汤普森提供了第一针胰岛素,其血糖下降了25%,十天后经过再次注射,血糖下降了75%,由于胰岛素剂量的增加,汤普森成为依靠胰岛素活下来的世界第一人。仅过了一年,即1923年,胰岛素开始大批量生产。实验室提取法以惊人的速度转为商业化生产工艺,并迅速扩展到全球,使以往致命的病魔不再可怕。因此,班廷和麦克劳德于同年荣获得诺贝尔奖。
由于糖尿病具有易染性和能遗传的特点,所以此病患者的数量持续增加,对胰岛素的需求也与日俱增。如何用化学方法合成胰岛素,以替代从数百万动物的胰腺中分离的方法,已成为各国科学家探求的目标。50年代中期,弗雷德里克·桑格终于发现了胰岛素的结构,它是由51个氨基酸组成的一种蛋白质分子,由于这一发现,他于1958年获得了诺贝尔奖。
中国科学家在这一领域也取得了骄人的成绩。新中国诞生之初,生物学家便开始对人工合成胰岛素进行集体攻关,并于1963年在世界上首次成功获得人工合成胰岛素。现在我国和许多工业发达国家正在运用基因工程制造胰岛素,并应用于临床实践。可以说,从发现、提取,到人工合成胰岛素,科学家们经历了上百年的不懈探索。如今胰岛素不论是天然的还是人工合成的,依然是众多糖尿病患者不可或缺的药物。
可以想象,21世纪,随着科学技术的迅速发展,人类对自身组织的进一步认识,以及对基因密码的破解,终究有一天会以一种新的医疗观念和手段,直接作用于人的免疫系统,彻底战胜病魔。
2. 数据挖掘概念综述
数据挖掘概念综述
数据挖掘又称从数据库中发现知识(KDD)、数据分析、数据融合(Data Fusion)以及决策支持。KDD一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议上。随后在1991年、1993年和1994年都举行KDD 专题讨论会,汇集来自各个领域的研究人员和应用开发者,集中讨论数据统计、海量数据分析算 法、知识表示、知识运用等问题。随着参与人员的不断增多,KDD国际会议发展成为年会。1998 年在美国纽约举行的第四届知识发现与数据 挖掘国际学术会议不仅进行了学术讨论,并且有30多家软件公司展示了他们的数据挖掘软件产品,不少软件已在北美、欧洲等国得到应用。
一、什么是数据挖掘
1.1、数据挖掘的历史
近十几年来,人们利用信息技术生产和搜集数据的能力大幅度提高,千万万个数据库被用于商业管理、政府办公、科学研究和工程开发等等,这一势头仍将持续发展下去。于是,一个新的挑战被提了出来:在这被称之为信息爆炸的时代,信息过量几乎成为人人需要面对的问题。如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息利用率呢?要想使数据真正成为一个公司的资源,只有充分利用它为公司自身的业务决策和战略发展服务才行,否则大量的数据可能成为包袱,甚至成为垃圾。因此,面对”人们被数据淹没,人们却饥饿于知识”的挑战。另一方面计算机技术的另一领域——人工智能自1956年诞生之后取得了重大进展。经历了博弈时期、自然语言理解、知识工程等阶段,目前的研究 热点是机器学习。机器学习是用计算机模拟人类学习的一门科学,比较成熟的算法有神经网络、遗传算法等。用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后的知识,这两者的结合促成了数据库中的知识发现(KDD:Knowledge Discovery in Databases)的产生,因此,数据挖掘和知识发现(DMKD)技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。
数据挖掘又称从数据库中发现知识(KDD)、数据分析、数据融合(Data Fusion)以及决策支持。KDD一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议上。随后在1991年、1993年和1994年都举行KDD 专题讨论会,汇集来自各个领域的研究人员和应用开发者,集中讨论数据统计、海量数据分析算 法、知识表示、知识运用等问题。随着参与人员的不断增多,KDD国际会议发展成为年会。1998 年在美国纽约举行的第四届知识发现与数据 挖掘国际学术会议不仅进行了学术讨论,并且有30多家软件公司展示了他们的数据挖掘软件产品,不少软件已在北美、欧洲等国得到应用。
2.2数据挖掘的概念
从1989年到现在,KDD的定义随着人们研究的不断深入也在不断完善,目前比较公认的定义是Fayyad 等给出的:KDD是从数据集中识别出有效的、新颖的、潜在有用的以及最终可理解模式的高级处理过程。从定义可以看出,数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。人们把原始数据看作是形成知识的源泉,就像从矿石中采矿一样。原始数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门很广义的交叉学科,它汇聚了不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。
特别要指出的是,数据挖掘技术从一开始就是面向应用的。它不仅是面向特定数据库的简单检索查询调用,而且要对这些数据进行微观、中观乃至宏观的统计、分析、综合和推理,以指导实际问题的求解,企图发现事件间的相互关联,甚至利用已有的数据对未来的活动进行预测。
一般来说在科研领域中称为KDD,而在工程领域则称为数据挖掘。
二、数据挖掘的步骤
KDD包括以下步骤:
1、数据准备
KDD的处理对象是大量的数据,这些数据一般存储在数据库系统中,是长期积累的结果。但往往不适合直接在这些数据上面进行知识挖 掘,需要做数据准备工作,一般包括数据的选择(选择相关的数据)、净化(消除噪音、冗余数据)、推测(推算缺失数据)、转换(离散值 数据与连续值数据之间的相互转换,数据值的分组分类,数据项之间的计算组合等)、数据缩减(减少数据量)。如果KDD的对象是数据仓 库,那么这些工作往往在生成数据仓库时已经准备妥当。数据准备是KDD 的第一个步骤,也是比较重要的一个步骤。数据准备是否做好将影 响到数据挖掘的效率和准确度以及最终模式的有效性。
2、数据挖掘
数据挖掘是KDD最关键的步骤,也是技术难点所在。研究KDD的人员中大部分都在研究数据挖掘技术,采用较多的技术有决策树、分类、 聚类、粗糙集、关联规则、神经网络、遗传算法等。数据挖掘根据KDD的目标,选取相应算法的参数,分析数据,得到可能形成知识的模式 模型。
3、评估、解释模式模型
上面得到的模式模型,有可能是没有实际意义或没有实用价值的,也有可能是其不能准确反映数据的真实意义,甚至在某些情况下是与事 实相反的,因此需要评估,确定哪些是有效的、有用的模式。评估可以根据用户多年的经验,有些模式也可以直接用数据来检验其准确性。 这个步骤还包括把模式以易于理解的方式呈现给用户。
4、巩固知识
用户理解的、并被认为是符合实际和有价值的模式模型形成了知识。同时还要注意对知识做一
致性检查,解决与以前得到的知识互相冲 突、矛盾的地方,使知识得到巩固。
5、运用知识
发现知识是为了运用,如何使知识能被运用也是KDD的步骤之一。运用知识有两种方法:一种是只需看知识本身所描述的关系或结果,就 可以对决策提供支持;另一种是要求对新的数据运用知识,由此可能产生新的问题,而需要对知识做进一步的优化
三、数据挖掘的特点及功能
3.1、数据挖掘的特点
数据挖掘具有如下几个特点,当然,这些特点与数据挖掘要处理的数据和目的是密切相关的。
1、处理的数据规模十分巨大。
2、查询一般是决策制定者(用户)提出的即时随机查询,往往不能形成精确的查询要求。
3、由于数据变化迅速并可能很快过时,因此需要对动态数据作出快速反应,以提供决策支持。
4、主要基于大样本的统计规律,其发现的规则不一定适用于所有数据
3.2、数据挖掘的功能
数据挖掘所能发现的知识有如下几种:
广义型知识,反映同类事物共同性质的知识;
特征型知识,反映事物各方面的特征知识;
差异型知识,反映不同事物之间属性差别的知识 ;关联型知识,反映事物之间依赖或关联的知识;
预测型知识,根据历史的和当前的数据推测未来数据;偏离型知识,揭示事物偏离常规的异常现象。
所有这些知识都可以在不同的概念层次上被发现,随着概念树的提升,从微观到中观再到宏观,以满足不同用户、不同层次决策的需要。例如,从一家超市的数据仓库中,可以发现的一条典型关联规则可能是”买面包和黄油的顾客十有八九也买牛奶”,也可能是”买食品的顾客几乎都用信用卡”,这种规则对于商家开发和实施客户化的销售计划和策略是非常有用的。至于发现工具和方法,常用的有分类、聚类、减维、模式识别、可视化、决策树、遗传算法、不确定性处理等。归纳起来,数据挖掘有如下几个功能:
预测/验证功能:预测/验证功能指用数据库的若干已知字段预测或验证其他未知字段值。预测方法有统计分析方法、关联规则和决策树预测方法、回归树预测方法等。
描述功能:描述功能指找到描述数据的可理解模式。描述方法包括以下几种:数据分类、回归分析、簇聚、概括、构造依赖模式、变化和偏差分析、模式发现、路径发现等。
四、数据挖掘的模式
数据挖掘的任务是从数据中发现模式。模式是一个用语言L来表示的一个表达式E,它可用来描述数据集F中数据的特性,E 所描述的数据是集 合F的一个子集FE。E作为一个模式要求它比列举数据子集FE中所有元素的描述方法简单。例如,“如果成绩在81 ~90之间,则成绩优良”可称 为一个模式,而“如果成绩为81、82、83、84、85、86、87、88、89 或90,则成绩优良”就不能称之为一个模式。
模式有很多种,按功能可分有两大类:预测型(Predictive)模式和描述型(Descriptive)模式。
预测型模式是可以根据数据项的值精确确定某种结果的模式。挖掘预测型模式所使用的数据也都是可以明确知道结果的。例如,根据各种 动物的资料,可以建立这样的模式:凡是胎生的动物都是哺乳类动物。当有新的动物资料时,就可以根据这个模式判别此动物是否是哺乳动物。
描述型模式是对数据中存在的规则做一种描述,或者根据数据的相似性把数据分组。描述型模式不能直接用于预测。例如,在地球上,70 %的表面被水覆盖,30 %是土地。
在实际应用中,往往根据模式的实际作用细分为以下6 种:
1、分类模式
分类模式是一个分类函数( 分 类 器),能够把数据集中的数据项映射到某个给定的类上。分类模式往往表现为一棵分类树,根据数据的 值从树根开始搜索,沿着数据满足的分支往上走,走到树叶就能确定类别。
2、回归模式
回归模式的函数定义与分类模式相似,它们的差别在于分类模式的预测值是离散的,回归模式的预测值是连续的。如给出某种动物的特征,可以用分类模式判定这种动物是哺乳动物还是鸟类;给出某个人的教育情况、工作经验,可以用回归模式判定这个人的年工资在哪个范围内,是在6000元以下,还是在6000元到1万元之间,还是在1万元以上。
3、时间序列模式
时间序列模式根据数据随时间变化的趋势预测将来的值。这里要考虑到时间的特殊性质,像一些周期性的时间定义如星期、月、季节、年 等,不同的日子如节假日可能造成的影响,日期本身的计算方法,还有一些需要特殊考虑的地方如时间前后的相关性(过去的事情对将来有 多大的影响力)等。只有充分考虑时间因素,利用现有数据随时间变化的一系列的值,才能更好地预测将来的值。
4、聚类模式
聚类模式把数据划分到不同的组中,组之间的差别尽可能大,组内的差别尽可能小。与分类模式不同,进行聚类前并不知道将要划分成几 个组和什么样的组,也不知道根据哪一(几)个数据项来定义组。一般来说,业务知识丰富的人应该可以理解这些组的含义,如果产生的模式无法理解或不可用,则该模式可能是无意义的,需要回到上阶段重新组织数据。
5、关联模式
关联模式是数据项之间的关联规则。关联规则是如下形式的一种规则:“在无力偿还贷款的人当中,60%的人的月收入在3000元以下。”
6、序列模式
序列模式与关联模式相仿,而把数据之间的关联性与时间联系起来。为了发现序列模式,不仅需要知道事件是否发生,而且需要确定事件 发生的时间。例如,在购买彩电的人们当中,60%的人会在3个月内购买影碟机
五、数据挖掘的发现任务
数据挖掘涉及的学科领域和方法很多,有多种分类法。根据挖掘任务分,可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等;根据挖掘对象分,有关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及环球网Web;根据挖掘方法分,可粗分为:机器学习方法、统计方法、神经网络方法和数据库方法。机器学习中,可细分为:归纳学习方法(决策树、规则归纳等)、基于范例学习、遗传算法等。统计方法中,可细分为:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)等。神经网络方法中,可细分为:前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。数据库方法主要是多维数据分析或OLAP 方法,另外还有面向属性的归纳方法。
从挖掘任务和挖掘方法的角度而言有数据总结、分类发现、聚类和关联规则发现四种非常重要的发现任务。
5.1、数据总结
数据总结目的是对数据进行浓缩,给出它的紧凑描述。传统的也是最简单的数据总结方法是计算出数据库的各个字段上的求和值、平均值、方差值等统计值,或者用直方图、饼状图等图形方式表示。数据挖掘主要关心从数据泛化的角度来讨论数据总结。数据泛化是一种把数据库中的有关数据从低层次抽象到高层次上的过程。由于数据库上的数据或对象所包含的信息总是最原始、基本的信息(这是为了不遗漏任何可能有用的数据信息)。人们有时希望能从较高层次的视图上处理或浏览数据,因此需要对数据进行不同层次上的泛化以适应各种查询要求。数据泛化目前主要有两种技术:多维数据分析方法和面向属性的归纳方法。
1、多维数据分析方法是一种数据仓库技术,也称作联机分析处理(OLAP)。数据仓库是面向决策支持的、集成的、稳定的、不同时间的历史数据集合。决策的前提是数据分析。在数据分析中经常要用到诸如求和、总计、平均、最大、最小等汇集操作,这类操作的计算量特别大。因此一种很自然的想法是,把汇集操作结果预先计算并存储起来,以便于决策支持系统使用。存储汇集操作结果的地方称作多维数据库。多维数据分析技术已经在决策支持系统中获得了成功的应用,如着名的SAS数据分析软件包、Business Object公司的决策支持系统Business Object,以及IBM公司的决策分析工具都使用了多维数据分析技术。
采用多维数据分析方法进行数据总结,它针对的是数据仓库,数据仓库存储的是脱机的历史数据。
2、为了处理联机数据,研究人员提出了一种面向属性的归纳方法。它的思路是直接对用户感兴趣的数据视图(用一般的SQL查询语言即可获得)进行泛化,而不是像多维数据分析方法那样预先就存储好了泛化数据。方法的提出者对这种数据泛化技术称之为面向属性的归纳方法。原始关系经过泛化操作后得到的是一个泛化关系,它从较高的层次上总结了在低层次上的原始关系。有了泛化关系后,就可以对它进行各种深入的操作而生成满足用户需要的知识,如在泛化关系基础上生成特性规则、判别规则、分类规则,以及关联规则等。
5.2、分类发现
分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。分类和回归都可用于预测。预测的目的是从利用历史数据纪录中自动推导出对给定数据的推广描述,从而能对未来数据进行预测。和回归方法不同的是,分类的输出是离散的类别值,而回归的输出则是连续数值。
要构造分类器,需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成,每个元组是一个由有关字段(又称属性或特征)值组成的特征向量,此外,训练样本还有一个类别标记。一个具体样本的形式可为:( v1, v2, …, vn; c );其中vi表示字段值,c表示类别。
分类器的构造方法有统计方法、机器学习方法、神经网络方法等等。统计方法包括贝叶斯法和非参数法(近邻学习或基于事例的学习),对应的知识表示则为判别函数和原型事例。机器学习方法包括决策树法和规则归纳法,前者对应的表示为决策树或判别树,后者则一般为产生式规则。神经网络方法主要是BP算法,它的模型表示是前向反馈神经网络模型(由代表神经元的节点和代表联接权值的边组成的一种体系结构),BP算法本质上是一种非线性判别函数。另外,最近又兴起了一种新的方法:粗糙集(rough set),其知识表示是产生式规则。
不同的分类器有不同的特点。有三种分类器评价或比较尺度:1 预测准确度;2 计算复杂度;3 模型描述的简洁度。预测准确度是用得最多的一种比较尺度,特别是对于预测型分类任务,目前公认的方法是10番分层交叉验证法。计算复杂度依赖于具体的实现细节和硬件环境,在数据挖掘中,由于操作对象是巨量的数据库,因此空间和时间的复杂度问题将是非常重要的一个环节。对于描述型的分类任务,模型描述越简洁越受欢迎;例如,采用规则表示的分类器构造法就更有用,而神经网络方法产生的结果就难以理解。
另外要注意的是,分类的效果一般和数据的特点有关,有的数据噪声大,有的有缺值, 有的分布稀疏,有的字段或属性间相关性强,有的属性是离散的而有的是连续值或混合式的。目前普遍认为不存在某种方法能适合于各种特点的数据。
5.3、聚类
聚类是把一组个体按照相似性归成若干类别,即”物以类聚”。它的目的是使得属于同一类别的个体之间的距离尽可能的小,而不同类别上的个体间的距离尽可能的大。聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。
在统计方法中,聚类称聚类分析,它是多元数据分析的三大方法之一(其它两种是回归分析和判别分析)。它主要研究基于几何距离的聚类,如欧式距离、明考斯基距离等。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。这种聚类方法是一种基于全局比较的聚类,它需要考察所有的个体才能决定类的划分;因此它要求所有的数据必须预先给定,而不能动态增加新的数据对象。聚类分析方法不具有线性的计算复杂度,难以适用于数据库非常大的情况。
在机器学习中聚类称作无监督或无教师归纳;因为和分类学习相比,分类学习的例子或数据对象有类别标记,而要聚类的例子则没有标记,需要由聚类学习算法来自动确定。很多人工智能文献中,聚类也称概念聚类;因为这里的距离不再是统计方法中的几何距离 ,而是根据概念的描述来确定的。当聚类对象可以动态增加时,概念聚类则称是概念形成。
在神经网络中,有一类无监督学习方法:自组织神经网络方法;如Kohonen自组织特征映射网络、竞争学习网络等等。在数据挖掘领域里,见报道的神经网络聚类方法主要是自组织特征映射方法,IBM在其发布的数据挖掘白皮书中就特别提到了使用此方法进行数据库聚类分割。
5.4、关联规则发现
关联规则是形式如下的一种规则,”在购买面包和黄油的顾客中,有90%的人同时也买了牛奶”(面包+黄油 ( 牛奶 )。用于关联规则发现的主要对象是事务型数据库,其中针对的应用则是售货数据,也称货篮数据。一个事务一般由如下几个部分组成:事务处理时间 ,一组顾客购买的物品,有时也有顾客标识号(如信用卡号)。
由于条形码技术的发展,零售部门可以利用前端收款机收集存储大量的售货数据。因此,如果对这些历史事务数据进行分析,则可对顾客的购买行为提供极有价值的信息。例如,可以帮助如何摆放货架上的商品(如把顾客经常同时买的商品放在一起),帮助如何规划市场(怎样相互搭配进货)。由此可见,从事务数据中发现关联规则,对于改进零售业等商业活动的决策非常重要。
如果不考虑关联规则的支持度和可信度,那么在事务数据库中存在无穷多的关联规则。事实上,人们一般只对满足一定的支持度和可信度的关联规则感兴趣。在文献中,一般称满足一定要求的(如较大的支持度和可信度)的规则为强规则。因此,为了发现出有意义的关联规则,需要给定两个阈值:最小支持度和最小可信度。前者即用户规定的关联规则必须满足的最小支持度,它表示了一组物品集在统计意义上的需满足的最低程度;后者即用户规定的关联规则必须满足的最小可信度,它反应了关联规则的最低可靠度。
在实际情况下,一种更有用的关联规则是泛化关联规则。因为物品概念间存在一种层次关系,如夹克衫、滑雪衫属于外套类,外套、衬衣又属于衣服类。有了层次关系后,可以帮助发现一些更多的有意义的规则。例如,”买外套,买鞋子”(此处,外套和鞋子是较高层次上的物品或概念,因而该规则是一种泛化的关联规则)。由于商店或超市中有成千上万种物品,平均来讲,每种物品(如滑雪衫)的支持度很低,因此有时难以发现有用规则;但如果考虑到较高层次的物品(如外套),则其支持度就较高,从而可能发现有用的规则。另外,关联规则发现的思路还可以用于序列模式发现。用户在购买物品时,除了具有上述关联规律,还有时间上或序列上的规律,因为,很多时候顾客会这次买这些东西,下次买同上次有关的一些东西,接着又买有关的某些东西。
3. 宇宙有边吗
宇宙没有边界。
霍金坚称,宇宙是没有边界的。
从本质上来讲,时空曲面是可以跟地球进行比较的。在霍金看来,人们可以将虚时间和实时想象成南极的起源,那里是时空的一个平滑点,而这受到物理定律支持,由于南极的南面没有任何东西,所以以此类推大爆炸之前也不存在任何东西。
(3)明考斯基计算方法扩展阅读:
根据爱因斯坦相对论,空间和时间由物质和能量形成连续曲线。在霍金看来,宇宙的起源最好用欧几里得算法来展开描述。“普通的实时被虚时间取代。”霍金表示,虚时间就像是空间的第四方向。他和欧几里得都相信虚时间是一个像地球表面那样的四维曲面。
爱因斯坦提供的“宇宙球”模型推想,在宇宙任意一点上发出的光,都将会沿着时空曲面在100亿年后返回它的出发点。人类目前的认识,实际上是把宇宙作为在时间上有起点,在空间上有限度的想象模型来对待的。
4. 什么是逼近于理想解排序法
TOPSIS法(Technique for Order Preferenceby Similarity to Ideal Solution,)逼近理想解排序法、理想点法 TOPSIS (Technique for Order Preference by Similarity to an Ideal Solution )法是 C.L.Hwang 和 K.Yoon 于1981年首次提出, TOPSIS法根据有限个评价对象与理想化目标的接近程度进行排 序的方法,是在现有的对象中进行相对优劣的评价。理想化目标( Ideal Solution)有两个,一个是肯定的理想目标( positive ideal solution)或称最优目标,一个是否定的理想目标( negative ideal solution)或称最劣目标, 评价最好的对象应该是与最优目标的距离最近,而与最劣目标最远, 距离的计算可采用明考斯基距离, 常用的欧几里德几何距离是明考斯基距离的特殊情况。
5. 明考斯基距离如何计算
那得看你规定的权是多少啊,(x1, ... , xn)和(y1, ... ,yn)间权p的minkowski距离就是[|x1-y1|^p+...+|xn-yn|^p]^{1/p}
意义么,得看你的空间是什么。一般这个范数是用在函数空间上的,比如L^p([0,1]),它与向量(这时是[0,1]区间上的L^p函数)的模长是相容的。
6. 数据挖掘中分类和聚类有什么区别
你好,
简单地说,分类(Categorization or Classification)就是按照某种标准给对象贴标签(label),再根据标签来区分归类。
简单地说,聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。
区别是,分类是事先定义好类别 ,类别数不变 。分类器需要由人工标注的分类训练语料训练得到,属于有指导学习范畴。聚类则没有事先预定的类别,类别数不确定。 聚类不需要人工标注和预先训练分类器,类别在聚类过程中自动生成 。分类适合类别或分类体系已经确定的场合,比如按照国图分类法分类图书;聚类则适合不存在分类体系、类别数不确定的场合,一般作为某些应用的前端,比如多文档文摘、搜索引擎结果后聚类(元搜索)等。
分类的目的是学会一个分类函数或分类模型(也常常称作分类器 ),该模型能把数据库中的数据项映射到给定类别中的某一个类中。 要构造分类器,需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成,每个元组是一个由有关字段(又称属性或特征)值组成的特征向量,此外,训练样本还有一个类别标记。一个具体样本的形式可表示为:(v1,v2,...,vn; c);其中vi表示字段值,c表示类别。分类器的构造方法有统计方法、机器学习方法、神经网络方法等等。
聚类(clustering)是指根据“物以类聚”原理,将本身没有类别的样本聚集成不同的组,这样的一组数据对象的集合叫做簇,并且对每一个这样的簇进行描述的过程。它的目的是使得属于同一个簇的样本之间应该彼此相似,而不同簇的样本应该足够不相似。与分类规则不同,进行聚类前并不知道将要划分成几个组和什么样的组,也不知道根据哪些空间区分规则来定义组。其目的旨在发现空间实体的属性间的函数关系,挖掘的知识用以属性名为变量的数学方程来表示。聚类技术正在蓬勃发展,涉及范围包括数据挖掘、统计学、机器学习、空间数据库技术、生物学以及市场营销等领域,聚类分析已经成为数据挖掘研究领域中一个非常活跃的研究课题。常见的聚类算法包括:K-均值聚类算法、K-中心点聚类算法、CLARANS、 BIRCH、CLIQUE、DBSCAN等。
希望回答对您有帮助.
7. 聚类分析中的空间和距离概念
聚类分析的意义Cluster Analysis
在经济和社会学研究中,聚类分析是比较常用的多元统计分析方法,是将大量复杂多维的数据和变量进行分组分析的方法。
例如采集1个亿微信用户样本,他们的特征变量不太一样,例如年龄、收入、性格、学历、职业、兴趣、生活作息习惯等等进行初步的量化转化,作为输入变量进行假设分析。
那么这一个亿样本里面,哪些人是能够做为中产阶级,哪些人是可以作为文艺青年?
可以建立文艺青年分类指标,然后分析每个样本个体之间的接近或相似程度,分组建立关联函数。
从直观和简单的分组概念出发,对于庞大的数据,也可以进行客观的统计学分组划分。
这里就会用到聚类分析方法,首先是测量样本个体之间的差异或相似程度。
这里引入空间几何概念,即将每个样本当作一个点,分布在n维空间里,每个维度分别是年龄、收入、性格等。
如果两个变量越接近,我们定义为两个点之间的越相似或亲密,这里使用“距离”的概念进行定义。
如果变量是数值型的变量,而非函数变量。那么可以使用如下几个空间和距离进行量化样本之间的亲密程度。
欧式空间的欧式距离。Euclidean Distance in Euclidean Space.
定义为变量个体差值的平方和的平方根。
平方欧式距离 Squared Euclidean Distance
定义为变量个体差值的平方和,即欧式距离的平方和。
切比雪夫距离Chebychev Distance
定义为变量差值的绝对值得最大值
块距离Block Distance
定义为变量差值的绝对值的总合
明考斯基距离Minkowski Distance
定义为变量差值绝对值的p次方的总和的p次根
夹角余弦距离Cosine Distance
定义为变量乘积的平方的和,除以(单独每个变量自身平方的和,再相乘)
如果变量是计数的离散变量,那么距离就需要用以下方法定义
卡方距离Chi-Square Measure Distance
x,y变量之间的距离定义为x变量的第i个变量与期望值(这里也成为期望频数,例如一个人每天去咖啡馆的平均次数)的差值的平方,除以期望值之后进行汇总计算,再加上y变量的第i个变量与期望值(这里也成为期望频数,例如一个人每天去咖啡馆的平均次数)的差值的平方,除以期望值之后进行汇总计算。然后再开平方。
Phi方距离Phi-Square Measure Distance
和卡方距离的区别在于,是在最后一个开平方之前,先除以总频数n。即加入了总频数的数学考量。
如果变量是二项式数值,即0或1,有或无,是或非的选择,那么距离可以用以下方法定义
简单匹配系数Simple Matching
将2个选择变量进行矩阵组合,然后将一个变量为0,另一个变量为1的频数相加,作为分子,除以分母。分母为矩阵中所有频数的总和。
Jaccard系数
和简单匹配系数的区别在于,分母减去了2个变量都为0的频数,即去掉了同时为0的数据的影响。
有了距离以后,下一步是划分小组,或空间中的小球体,小集合
每个小组或小集合里面有n个样本个体,可以按照不同的原则进行最优分组。例如最近邻距离原则,组内平均链锁距离原则,重心距离,离差平方和距离方法等方法使得分组合理化和优化。
形象点说,就是科学合理的通过数据统计方法将真正的文艺青年分成一组,伪文青分成一组,另类文青分成一组。。。
如果应用于经济学领域,可以将100个国家按照发达指数、开放指数等做分类分层,按照聚类分析碎石图,可以划分层次,将这些国家分为3组、4组或更多组。
分组工具可以使用SPSS等统计分析软件的聚类分析模块来实现。
聚类分析先到这里,我们对空间和距离概念进一步引申
数学上,空间、距离等概念在应用和研究中,进行了进一步的抽象化。
我们常识上或直观上理解的多为欧几里得空间,也就是欧式空间,最常见的是三维欧式空间。即XYZ三个轴是相互垂直的关系,所有点可以通过三个轴对应映射关系进行三点定位。而欧式空间的距离,是两点之间的实际距离。
进一步引申,将三维空间抽象化之后,进行4维、5维乃至n维空间,即有n个相互垂直的坐标系,而每个点可以用n个轴上的映射进行n点定位,这个空间的两点之间的距离定义为两个点第i个坐标上映射的差值的平方和之后再开方。即我们前面提到的欧式空间距离概念。
明考斯基距离是欧式空间距离的进一步推广,如果p设定为2,则为欧式距离,如果p设定为无穷大,则为切比雪夫距离。
从以上数学定义推广过程,我们可以看出,对于数值型的空间概念,是基于欧式空间的引申推广而产生的不同定义,可以应用在合适的场合和情景下。
而距离基于线性结构八大定律之后,构成的向量空间概念,是进一步的抽象,而这个空间里,每个点到空间坐标轴原点的距离,定义为范数norm。如果向量空间定义了范数,则这个空间成为赋范向量空间。
然后进一步抽象:
赋范空间+线性结构⟶>线性赋范空间
如果在线性赋范空间上增加添加内积运算概念,即,使空间中向量在n个维度上映射的分别乘积的和,和向量之间的角度有关,则这个空间称为内积空间。
如果在这个内积空间里,所有的运算的极限运算,仍然在这个空间内,即收敛,那么这个空间就定义为希尔伯特空间Hilbert Space。
如果是基于线性赋范空间+收敛(完备性),则这个空间称为巴拿赫空间Banach Space。
回归到聚类分析,我们进一步将聚类概念进行抽象化
如果是将函数或向量进行聚类,那么函数或向量之间的距离概念,则可以通过以上范数的概念进行进一步分析,而线性赋范空间的概念,为我们为更抽象的点和集合的分组聚类提供了可供探索的工具。
聚类分析或聚类算法在机器学习、数据挖掘等人工智能领域应用较广,它的一个重点特点是通过机器或计算机将大量数据进行自动统计分类,不需要人工参与。
关于希尔伯特空间、巴拿赫空间的聚类问题,可以继续阅读相关文献。
深入阅读:
下面文献可以通过高校邮箱进行注册账号,阅读公开论文。
Clustering via Hilbert space
Clustering in Banach Spaces
8. 原始黑洞是否可能是暗物质
英国着名物理学家斯蒂芬·霍金提出过一个观点:看不见的“原始”黑洞可能是隐藏的暗物质。这一理论已经失宠了几十年,但一系列新的研究显示,这一理论或许可以解释许多东西。
黑洞是一种优雅、简洁的天体,但在大众的想象中,它们有时会显得十分可怕。在许多方面,它们就像一个理想的黑体(能吸收全部外来电磁辐射,没有任何反射和透射的物体),使得我们很难估计宇宙中存在多少黑洞,以及它们的大小。因此,2015年9月,当激光干涉仪引力波天文台(LIGO)的探测器第一次探测到引力波时,的的确确给物理学界带来了惊喜。在此之前,最大的恒星黑洞——大质量恒星引力坍缩后形成的黑洞——的质量大约是太阳的20倍;而这些新发现的黑洞都有大约30倍太阳质量,这并非不可思议,只是非常奇怪。此外,当LIGO启动并立即开始听到这类物体相互融合的信号时,天体物理学家就意识到,一定还有更多的黑洞潜伏在那里,也许远远超过他们的想象。
这些奇怪黑洞的发现给一个旧观点注入了新的活力,近年来,这种观点已经逐渐边缘化。我们知道,垂死的恒星可以产生黑洞,但黑洞或许也能在宇宙大爆炸中诞生。这些“原始”黑洞可能隐藏了起来,并构成了暗物质。毕竟,尽管经过了几十年的 探索 ,研究者仍然没有探测到暗物质粒子。或许我们可以大胆地假设,如果黑洞一直就在我们的眼皮底下,情况又会如何?
美国约翰·霍普金斯大学的宇宙学家马克·卡米奥考斯基(Marc Kamionkowski)表示,这的确是一个疯狂的想法,但并不一定比其他观点更疯狂。事实上, 探索 这方面可能性的论文已经有很多。2016年,卡米奥库斯基所在的研究小组也发表了一篇令人瞩目的论文。
可惜的是,纽约大学天体物理学家亚辛•阿里-海蒙德(Yacine Ali-Haimoud)在2017年发表了一篇论文,对这种类型的黑洞将如何影响LIGO的探测率进行了检验,在此之后,暗物质与原始黑洞的关系开始受到质疑。阿里-海蒙德计算出,如果新生宇宙产生的黑洞足够多,能够解释暗物质,那么随着时间的推移,这些黑洞将形成双黑洞系统,彼此环绕并越来越近,其合并速度甚至比LIGO观测到的合并事件高数千倍。他呼吁其他研究人员使用其他方式,继续研究这个想法。但许多人失去了希望。卡米奥考斯基指出,阿里-海蒙德的论点是如此戳中要害,以至于他自己对这个假说的兴趣都被浇灭了。
然而现在,随着最近一系列论文的发表,原始黑洞的观点似乎又复活了。不久前,法国蒙彼利埃大学的宇宙学家卡尔斯顿·让达齐克(Karsten Jedamzik)在《宇宙学和天体粒子物理学杂志》(Journal of Cosmology and Astroparticle Physics)上发表了最新的研究报告,其中阐述了大量的原始黑洞会如何导致与LIGO观测结果完全吻合的碰撞。“如果他的结果是正确的——看起来他做的是相当仔细的计算——那就将给我们的计算画上休止符,”阿里-海蒙德说,“这将意味着它们实际上可能就是所有的暗物质。”他在后续的论文中也继续对原始黑洞的观点展开研究。
英国苏塞克斯大学的宇宙学家克里斯蒂安·伯恩斯(Christian Byrnes)表示,这一结果非常令人兴奋,“他比以前任何人都走得更远”。伯恩斯为让达齐克的一些论点提供了帮助。
这一论点的最初想法可以追溯到20世纪70年代斯蒂芬·霍金和伯纳德·卡尔(Bernard Carr)的工作。他们推断,在宇宙最初的几分之一秒内,密度的微小波动可能会赋予某些区域过多的质量。每一个这样的区域都会坍缩成黑洞,而黑洞的大小将由该区域的视界决定。所谓视界,便是以光速可到达的任何点周围的空间。视界内的任何物质都会感受到黑洞的引力并坠入黑洞。霍金的粗略计算表明,如果黑洞的大小超过较小的小行星,那么它们可能仍潜伏在今天的宇宙中。
20世纪90年代取得了更大的进展。那时,理论物理学家们还提出了宇宙暴胀理论,认为宇宙在大爆炸之后经历了一次极端膨胀。暴胀理论可以解释最初的密度涨落从何而来。在密度涨落的基础上,物理学家们还考虑了一个沿着坍缩方向进行的关键跃迁。
宇宙刚形成时,其所有的物质和能量都在难以想象的高温等离子体中沸腾。在最初的十万分之一秒左右之后,宇宙冷却了一些,等离子体中的松散夸克和胶子得以结合在一起,形成更重的粒子。当一些闪电般快速运动的粒子被束缚在一起时,压力也随之下降。这可能有助于更多的区域坍缩成黑洞。
但在20世纪90年代,没有人对夸克和胶子流体的物理学有足够的了解,因此无法准确预测这种转变将如何影响黑洞的产生。理论物理学家还说不清楚原始黑洞的质量应该有多大,或者其数量应该有多少。
此外,宇宙学家似乎并不是真的需要原始黑洞。巡天调查对天空的一小块区域进行了扫描,希望能找到大量像黑洞一样稠密的暗物体漂浮在银河系的外围,但并没有多少收获。相反,大多数宇宙学家开始相信,暗物质是由极端“不合群”的大质量弱相互作用粒子(WIMP)组成的。这是一种仍然停留在理论阶段的粒子,只通过弱核力和引力产生相互作用,基本上不与普通物质发生相互作用。专门建造的WIMP探测器,以及即将上线的大型强子对撞机或许将很快找到它们存在的确凿证据。希望如此吧。
暗物质的问题看似即将取得突破,而且没有观察结果表明有其他选项,于是,原始黑洞在学术上就成了一潭死水。“一位资深宇宙学家似乎在嘲笑我研究这个,”让达齐克说,“所以我停下了,因为我需要一个永久的职位。”他在这方面的研究兴趣可以追溯到20世纪90年代。
当然,科学家在那之后的几十年里没有发现WIMP,也没有发现任何新的粒子(除了很久之前就预测存在的希格斯玻色子)。暗物质谜题的解答仍然遥遥无期。
然而,关于可能产生原始黑洞的环境,我们现在知道得更多了。物理学家已经可以计算出宇宙诞生之初的夸克-胶子等离子体如何演化出压力和密度。伯恩斯表示,物理学界花了几十年时间才取得了这些成果。利用这些信息,伯恩斯和马德里自治大学的胡安加西亚-伯利多(Juan García-Bellido)等理论物理学家,在过去几年中发表了一系列论文,预测早期宇宙产生的黑洞可能不仅仅只有一种大小,而是有一系列不同的大小。
一开始,夸克和胶子结合在一起形成质子和中子。这导致了压力下降,并可能产生了一组原始的黑洞。随着宇宙持续冷却,π介子等粒子形成,造成另一次压力骤降和可能的黑洞爆炸。
在这两个时期之间,空间本身也在膨胀。最初的黑洞可以从自身周围的视界吸入大约相当于太阳质量的物质。第二轮则可能吸入大约30倍太阳质量的物质,就像LIGO第一次探测到的奇怪物体一样。“引力波拯救了我们,”加西亚-伯利多说道。
2016年,在LIGO团队宣布了探测到第一个引力波后的几周内,原始黑洞假说又复活了。但是第二年,阿里-海蒙德提出了他的观点,认为原始黑洞会过于频繁地碰撞,这给原始黑洞假说的支持者带来了巨大的挑战。
让达齐克接受了挑战。在哥斯达黎加的一次长假中,他对阿里-海蒙德的说法进行了仔细研究。阿里-海蒙德是通过方程进行分析的,但是当让达齐克对同样的问题进行数值模拟时,他发现了一个转折。
原始黑洞确实会形成双黑洞系统,但让达齐克的结论是,在一个充满黑洞的宇宙中,第三个黑洞通常会接近最初的一对黑洞,并与其中的一个黑洞交换位置。这一过程将一再重复。
随着时间的推移,这种从一对黑洞到另一对黑洞的变换会使双黑洞系统的轨道几乎变成圆形。这些成对黑洞的碰撞速度会非常慢。即使存在大量的原始黑洞,其合并也不会如此地频繁。这就使整个假设仍然符合LIGO观测到的合并率。
2020年6月,让达齐克在网上发表了自己的研究成果,回答了阿里-海蒙德等外界专家提出的问题。他说:“尽一切可能让学术界相信,你不是在胡言乱语,这是非常重要的。”
他还预测,原始黑洞将位于暗星团中,后者的直径大约相当于太阳和最近恒星之间的距离。每一个星团可能都包含了大约1000个挤在一起的黑洞。质量为30个太阳的巨型黑洞将位于中心;更普通的小一些的黑洞则填满剩下的空间。这些星系团会潜伏在天文学家认为暗物质存在的任何地方。就像星系中的恒星,或者绕太阳旋转的行星一样,每个黑洞的轨道运动将阻止它吞噬另一个黑洞——除非发生一些不寻常的合并事件。
在第二篇论文中,让达齐克精确计算了这些合并事件的罕见程度。他计算了LIGO观测到的大黑洞和未观测到的小黑洞(小黑洞会发出微弱而尖锐的信号,只有在离它很近的地方才能探测到)。“当然,当我一个接一个地得出合并率的正确数值时,我感到非常震惊,”让达齐克说道。
原始黑洞假说的支持者们还有许多事情要做,才能更具有说服力。大多数物理学家仍然相信,暗物质是由某种基本粒子构成的,而这种粒子极其难以探测。此外,如果LIGO探测到的黑洞来自普通恒星,那么它们与我们预期的黑洞并没有太大不同。“这在某种程度上填补了理论中一个实际上并不存在的漏洞,”美国卡耐基梅隆大学的天体物理学家卡尔·罗德里格斯(Carl Rodriguez)说,“一些LIGO光源有些奇怪的地方,但我们可以通过正常的恒星演化过程来解释目前为止我们所看到的一切。”
哈佛大学的天体物理学家塞尔玛•德•明克(Selma de Mink)则更为直言不讳,他说:“我认为天文学家对此可以一笑了之。”他曾提出恒星如何独自形成LIGO所观测到的大型双黑洞系统的理论。
根据原始黑洞假说,发现一个亚太阳质量的黑洞应该是比较常见的,而且这种黑洞不能由恒星形成。如果这一观点是正确的,那将会改变整个争论。在未来的每一次观测中,随着LIGO灵敏度的提高,它最终要么能发现这些小型的黑洞,要么将对可能存在的黑洞数量设定严格的限制。“这个假说不同于弦理论,十年或三十年后,我们可能仍在讨论弦理论是否正确,”伯恩斯说道。
与此同时,其他天体物理学家也在 探索 这个理论的不同方面。例如,也许对原始黑洞最强烈的限制来自微引力透镜搜索。微引力透镜是20世纪60年代就提出的概念,描述的是发生在恒星级天体中的引力透镜现象,对这些现象的调查同样开始于20世纪90年代。天文学家通过这些调查监测明亮但遥远的光源,等待暗物体从它们前方经过。长期以来的研究排除了均匀分布的小型黑洞存在的可能性。
但加西亚-伯利多表示,如果原始黑洞以一系列大小不同的质量存在,如果它们被压缩成密集的大质量星团,那以上这些结果可能就没有研究人员想象的那么重要。接下来的观测或许能最终解决这个问题。欧洲空间局最近同意为美国国家航空航天局即将推出的罗曼太空望远镜(原名大视场红外巡天望远镜)提供一项关键的额外功能,这将使它能够进行突破性的微引力透镜研究。
这项功能是在欧洲空间局科学主任冈瑟·哈辛格(Gunther Hasinger)的指令下推出的,他曾提出,原始黑洞可以解释多个谜团。在哈辛格看来,这是个很吸引人的想法,因为没有引入新的粒子或新的物理理论,而只是重新利用了旧元素。“我相信,也许有些悬而未决的谜题其实可以自己解决,只要你用不同的眼光看,”他说道。(任天)
9. 看重过程,看淡结果的作文素材
经典素材
美国的愚公故事
(漫长过程缔造伟大结果)
“愚公移山”是中国古代的一个寓言故事。当今,美国南达科他州也出现了一位“愚公”,他要把一座高183米的山变为世界最大的雕像。这虽然是为了实现一些印第安人的梦想,却使这位波裔美国雕塑家科尔切克·索奥尔考斯基发展了极为庞大的家族事业。
科尔切克曾协助拉什莫尔山总统纪念像的雕塑工作,后来印第安人领袖要求他创作一尊19世纪苏语印第安族长“马迷”骑马的塑像,科尔切克答应了,当时他的口袋里只有174美元及几支炸药,时为1948年。 科尔切克婚后有10个子女,后来又添了18个孙儿,他的财产亦发展至500万美元及大量炸药。72岁的科尔切克1982年逝世后,他的家族继承了他的事业。7岁已开始协助父亲炸石的卡西米尔表示,他的4个子女会像他一样,继续在“马迷”山完成雕刻工程。
卡西米尔监督雕像工程进展,其弟迈克在山区伐木,亚当管理家场,妹妹莫妮克负责度量计算炸去及削去的位置,安管理印第安博物馆,玛丽嘉为纪念品店制作画及雕塑,杰特维嘉管理餐厅,唐管理一切征询邮件,而科尔切克的63岁遗孀鲁丝则负责整个企业的运作。雕像纪念人物“马迷”在33岁时被谋杀,而他的雕像工程已进行了40多年,比他的寿命还长,但现在还只能看到雕像的雏形。 素质教育是一个探索的过程 (教育要重视过程)
素质教育重在过程而不完全在于结果,即主要不着眼于学什么内容,而是怎样学习、消化、理解并运用这些知识,形成自己的能力和素质。这里,不能局限于、停滞于学会某些知识,要让学生明白和把握的,是与这一个个结果和一类类事实密切相关的完整过程,并思考和探索这个过程。这正如爱因斯坦所说:“科学就是一些有趣的探索”,实际上展现给学生的科学作为一个探索的过程,是一种鲜活的、动态的自然、社会如何运动的行为的过程。这就绝不是应试教育的那种僵化、静止的知识传授。
素质教育过程,是情境的、愉快的、过程性的,淡化结果,给学生留有讨论的空间和思考的时间,激发、培养学生关注这个过程的浓厚兴趣和足够的好奇心,让学生去发现造成某一结果的过程这个现实。这样的素质教育所要做的,无论是怎样的内容组合,都紧紧抓住过程。如
思想素质教育让学生弄明白究竟怎样做人,身心素质让学生学会维护自己的身心健康,文化素质教育指导学生有能力积累和丰富自己的综合文化底蕴,这样,知识才能成为学生的精神财富。
由知识上升为能力和素质,在学生身上真正实现从应试教育向素质教育的转变,这样培养出的学生,才有潜力、有能力、有素质靠自己的力量长大和生存,谋求发展和有利于社会。 启功先生“文革”中一事 (把苦难看成人生的一段过程)
启功先生是我国着名的书法家、文物鉴赏家、文献学家、教育家。启老已年过九旬,但精神依然矍铄,言谈之间充满乐观豁达的精神。他回忆起自己50多岁时处于劳改之中,妻子亡故,生活极度艰难,自己为自己做了一则墓志铭。但是尽管当时心境苍凉,墓志铭里却还是充满幽默。
启功先生的学生曾向外界提及启功先生“文革”时候扫厕所的事。那时很多文艺工作者和他一起被劳动改造。大部分人都是愁眉苦脸,唉声叹气。启功先生却依然乐观。有一次启功先生和另一个先生打扫公共厕所,启功先生一边打扫一边谈论起扫厕所的方法诀窍来,另一个先生深深叹服启功先生做任何事情都乐在其中的精神。 扫厕所而从中总结经验,这真是懂得重视过程的典型啊。 中医治病的过程需要明朗化 (过程很重要)
中医是我们民族文化的精华之一。但是与西医相比,它在世界范围内的影响还是太小了。究其不能被广泛接受的原因,就是因为过程太晦涩。
现代科学技术突飞猛进,日新月异,人们的受教育程度普遍提高,因此西医在技术层面上的问题通过科普宣传和患者的自身感受,容易被人理解和接受。本来治病是应该注重结果的,但关系到自身的生命安危时,人们也就多投入了几分精力,不但要看结果,还要看过程。 这一看过程,西医就明显地占有了优势。检测手段,复杂仪器让患者感到满足——现代科学技术在支撑着他;高烧不退,频繁换药他心里都觉得踏实。因为他明白高烧是由病毒和细菌引起的,而不同的药是针对不同的菌群,细菌也具有耐药性,新药会杀灭耐药菌群,病毒还会变异,等等,不一而足。
看中医治病的过程就非常的难,难以科普宣传,难以让外行明了。而且简单的诊病手段也让患者感到忐忑不安。你能让一个接受过现代科技教育的人接受阴阳五行吗?你能让一个普通患者明白脉象的浮滑沉涩?我曾在医院里听一患者问医生:中医怎样消炎?医生回答:中医没有这个概念,比较相近的是清热。医生的回答应该说也没有错,可这样的解释患者是难以接受的。
所以,在向世界推广的过程中,我们的中医应该有一些调整,让过程变得明朗一些,便于理解一些。
爱迪生的发明过程
(任何成功都需要一个过程) 爱迪生为了研制灯丝,试验了1600多种材料。研制蓄电池整整花了9年的时间,试验了9000多种材料,经历了无数次失败。最后连他最好的助手也都坚持不下去了,但是他却坚忍不拔,毫不动摇,终于获得了成功。他的每项发明都有一个艰辛的、充满心血和汗水的过程。 他除了有一颗好奇的心,一种亲自试验的本能,就是他具有超乎常人的艰苦工作的无穷精力,敢于面对漫长艰辛过程的精神。 杰出作品的形成过程 (过程是一种苦涩的历练)
历史上的着名作品,大多经历了一个漫长的创作过程。
西汉司马迁写《史记》,花了18年。西晋左思写《三都赋》,写了10年。宋代司马光写《资治通鉴》,前后共用了19年。明代的李时珍写《本草纲目》,共花了30年。清代的孔尚任写《桃花扇》,前后花了15年,易稿5次。清代的曹雪芹写《红楼梦》,花了10年,前后增删5次。
显微镜之父列文·虎克的故事 (过程可以多样化)
条条大路通罗马,追寻成功的过程是多种多样的,事在人为,关键是选择一条属于自己的路去走。经过不懈的努力过程,一定会有一个满意的结果。
发明显微镜从而发现细菌的列文·虎克在青少年时代,由于家境不好,中途就辍学了,在荷兰一个市政府做看门人。
他没有受过系统的自然科学教育,但他对生物学非常感兴趣。他喜欢大自然中的一草一木、花鸟虫鱼。他觉得生物世界奥妙无穷,有一种巨大的魅力让他着迷。在这种兴趣的引导下,他长期钻研,1665年,列文·虎克研制出了一台显微镜,对他来说,这无异于如虎添翼,仿佛有了一张走向微观世界的通行证。列文·虎克用显微镜观察一些肉眼很难看清楚的东西,比如苍蝇的翅膀、蜘蛛的脚爪、羊毛的纤维。微观世界的精彩令他兴奋不已,他不停地观察,不停地记录。
1673年,他将观察记录材料整理成《列文·虎克用自制的显微镜观察皮肤、肉类以及蜜蜂和其他虫类的若干记录》一文,寄给英国皇家学会。这篇文章并没有得到学术界的承认。许多人对文章中的内容抱怀疑态度。因为文中所述的微观世界谁也没有见过。列文·虎克并不气馁。他想只有更有力的证据,才能扫除权威们的偏见。他继续用显微镜观察各种动植物。并在一个偶然的机会发现了细菌。
1680年,列文·虎克被选为英国皇家学会会员。这是对他20年来刻苦钻研的最好褒奖。 发现煤气的过程
(成功的过程是多样的)
今天,在日常生活和生产中,人们已经普遍使用煤气作为能源。把煤变成煤气的实现,给人类带来了诸多的方便。与此同时,人类也将永远记住煤气的发现者,英国化学家威廉·梅尔道克。
威廉·梅尔道克小时候有一天,在山坡上挖到一些页岩。当地人都知道,这种石头可以用火点着。然而,小梅尔道克突发奇想,把这块石头带回了家。之后,他找来一个水壶,把页岩放进壶里,然后给水壶加热。
“把它加热后,会变成什么呢?还能点着吗?”小梅尔道克边想边认真观察水壶里的变化。 过了一会儿,水壶嘴里开始向外冒出气体。小梅尔道克打开了壶盖,然后划了一根火柴,想看看页岩还能不能点着。没想到燃烧的火柴刚一伸到水壶上面,火焰就猛地往上蹿了起来,气体燃烧了!
20年以后,1792年的一天,梅尔道克在研究煤矿物质时,想起了童年时代玩煤的游戏。他想:“能使火焰突然蹿高,说明气体燃烧了。这种气体也许有些利用价值。”就这样,人类运用煤气的时代开始了。 吴士宏:从小护士到董事长 (成长的过程)