【数据】1.数据分析与数据解释:揭示并解释趋势
数据的收集、分析、解释:天气与气候
数据分析:一个复杂且具有挑战性的过程
数据解释:发现和解释数据的趋势
科学共同体存在不同解释 关于数据解释的争论激发了进一步的研究
为他人提供数据
共享数据的技术推动科学发展
你知道么?
数据收集是对信息的系统性记录;数据分析涉及发现数据的规律和趋势;数据解释涉及解释这些模式和趋势。
科学家根据自己的背景知识和经验解释数据;因此,不同的科学家可以用不同的方式解释相同的数据。
通过发布数据以及用来分析和解释这些数据的技术,科学共同体提供审查数据并将其用于未来研究的机会。
数据的收集、分析、解释:天气与气候
好的数据就像一个宝库——科学家可以随时打开——因此准确且一致的数据记录以及用于收集这些数据的方法对任何科学研究都很重要。十九世纪50年代以来所收集的天气数据就是这样一个宝库,这要感谢莫里制定的标准。这些标准为数据收集和记录提供了指导方针,确保了数据收集的一致性。当年的船长能够利用这些数据来确定,那条线路穿越海洋最可靠。到了现代,许多研究气候变化的科学家利用同一组数据集来了解最近全球气温的变化。走哪条航道、全球气候如何变化,都不能简单靠查看数字和观察结果来回答,这两个问题都需要对数据进行分析和解释。
【考考自己】怎样收集的数据最有价值?
a.基于统一标准
b.很多人收集
利用150年的气温数据来描述全球气候的变化,虽然听起来简单,实际上分析和解释这些数据的过程却相当复杂。比如任意一天世界各地的气温范围(见图2):南非约翰内斯堡正值夏季,气温可达35°C (95°F),而阿拉斯加州费尔班克斯的气温同一时间正值隆冬,气温为-35°C (-31°F),而广阔的海洋没有前后统一的测量结果。要想获得当天的全球气温平均值,我们可以简单地取一天所有测量值的平均值,但这个平均值没有考虑到:自然会随时间变化很快,且测量值再空间上的分布并不均匀。
图2:某一日全球平均气温(摄氏度)的卫星图像合成图
早期的 SST(海面温度)是使用未隔热的帆布桶中收集的水进行测量的。而最近的数据来自隔热桶或冷却水进水测量(cooling water intake measurements)。后者比未隔热的桶测量温度高0.3-0.7°C。
数据解释:发现和解释数据趋势
然后,我们就可以对分析的数据进行解释。通常,当科学家解释数据时,他们试图解释通过分析发现规律和趋势,利用他们所有的背景知识、经验和技能来解决问题,并将他们的数据与现有的科学观点联系起来。考虑到他们利用的知识每个人都不一样,这一步骤具有主观性,但这种主观性将通过同行评审过程进行审查(请参阅“科学同行评审”模块)。根据平滑曲线,琼斯、威格利、赖特将数据解释为气候有长期变暖趋势。他们指出,整个数据集中最热的三个年份是1980年、1981年、1983年。然而,他们并没有进一步解释可能导致温度升高的原因,而只是指出“考虑最近提出的关于气候变化原因的观点,这些数据看起来非常有趣。”
科学界有不同解释
关于数据解释的争论激发了进一步的研究
气候系统变暖是明确的。现在明显看到:全球平均空气和海洋温度上升、冰雪大范围融化、全球平均海平面上升。
自二十世纪中叶以来观察到的全球平均气温升高,很可能是由于观察到的人为温室气体浓度增加所致。
数据解释并不是混战,并不是所有解释都同样有效。解释涉及构建解释数据的逻辑科学论证。科学解释既不是绝对真理,也不是个人观点:它们是基于科学知识和个人专业知识的基础上对数据含义的推论、建议、假说。当科学家开始解释他们的数据时,他们会利用个人和集体知识,经常与走廊另一头或另一个大洲的同事讨论结果。他们利用经验、逻辑和简约来为数据构建一种或多种合理的解释。与任何人类活动一样,科学家可能会犯错误,甚至故意欺骗同行(请参阅“科学伦理”模块),但绝大多数科学家提出了他们认为最合理且有数据支持的解释。
【考考自己】如果科学家对如何解释一组数据存在分歧,这通常
a. 意味着数据无效并且研究是浪费时间。
b. 导致额外的数据收集和研究。
数据收集、分析、解释的过程可长可短。在一天、一年或很多年的过程中,可能有一名或多名科学家参与,他们的优先事项随着时间推移而改变。因此,科学实践最重要的组成部分之一是科学文献中数据的出版(请参阅“利用科学文献”模块)。随着新研究问题的出现,正确收集、存储的数据仍然有用。事实上,一些研究会使用新技术、用不同的方法来查看数据,或者结合多项研究的结果来重新分析数据。
例如,1997年,乳腺癌激素因素合作小组在著名医学杂志《柳叶刀》上发表了一项广为宣传的研究,题为“乳腺癌和激素替代疗法:对51项流行病学研究数据的协同再分析,研究对象为52705名患有乳腺癌的女性和 108411名未患乳腺癌的女性”(乳腺癌激素因素协同小组,1997年)。乳腺癌与激素替代疗法 (HRT) 之间可能存在的联系,已被科学家研究多年,但结果好坏参半:早在1981年,一些科学家就认为HRT会导致癌症风险小幅增加(Brinton 等,1981),但后来研究表明风险不会增加(Kaufman 等,1984)。通过汇总大量研究的结果并重新分析数据,研究人员得出结论,接受激素替代疗法的女性更容易患乳腺癌。作者解释为什么使用重新分析数据:
在许多情况下,科学家解决新问题用到的数据是出于其他目的收集的。例如,收集天气数据的最初原因是为了更好地预测风和风暴,帮助确保商船的安全航行。直到最近,人们的兴趣才转向天气的长期变化,但相同的数据很容易有助于回答这两个问题。
当今科学最令人兴奋的进步之一,是公共信息数据库的开发,让数据能被所有人访问和使用。例如,获取气候和海洋数据通常非常昂贵,因为它们需要大规模作业,如钻探冰芯、建立跨太平洋的浮标网络。这些数据通过机构运营(例如美国能源部运营的二氧化碳信息分析中心)维护与分发,并通过几个网站在线共享(请参阅“基于资源的研究”模块)。任何人都可以下载这些数据来进行分析和解释。同样,人类基因组计划有一个可搜索的人类基因组数据库,研究人员可以在其中上传和下载数据(请参阅“基于资源的研究”模块)。
共享数据库的数量相当庞大。出于需要,美国国家标准与技术研究院维护着一个关于这些数据库的数据库。一些机构要求参与者公开数据,例如美国地震学联合研究机构 (IRIS)是这么做的:IRIS的仪器部门通过提供地震仪器、设备维护和培训、实验的后勤现场支持,来为研究人员提供支持。任何人都可以申请使用这些仪器,只要向IRIS提供他们在地震实验中收集的数据即可。然后,IRIS将这些数据向公众公开。
向其他科学家提供数据并不是一个新概念,但以可搜索的格式在互联网上提供这些数据彻底改变了科学家与数据交互的方式,让以前无法进行的研究工作成为可能。这种数据的汇集有助于在全球范围内和长时间内进行新的分析和解释。此外,让数据容易获取有助于促进跨学科研究,为许多领域的不同科学家打开探索之门。
资料来源:
Anne E. Egger, Ph.D., Anthony Carpi, Ph.D. “Data Analysis and Interpretation” Visionlearning Vol. POS-1 (1), 2008.
https://www.visionlearning.com/en/library/process-of-science/49/data-analysis-and-interpretation/15
我们不需要英雄
但我们需要榜样
References
Brinton, L. A., Hoover, R. N., Szklo, M., & Fraumeni, J. F. J. (1981). Menopausal estrogen use and risk of breast cancer. Cancer, 47(10), 2517-2522.
Collaborative Group on Hormonal Factors in Breast Cancer. (1997). Breast cancer and hormone replacement therapy: Collaborative reanalysis of data from 51 epidemiological studies of 52,705 women with breast cancer and 108,411 women without breast cancer. The Lancet, 350(9084), 1047-1059.
IPCC. (2007). Climate change 2007: The physical science basis. Contribution of Working Group I to the Fourth Assessment Report of the Intergovernmental Panel on Climate Change. New York: Cambridge University Press.
Jones, P. D., Wigley, T. M. L., & Wright, P. B. (1986). Global temperature variations between 1861 and 1984. Nature, 322(6078), 430-434.
Kaufman, D. W., Miller, D. R., Rosenberg, L., Helmrich, S. P., Stolley, P., Schottenfeld, D., & Shapiro, S. (1984). Noncontraceptive estrogen use and the risk of breast cancer. Journal of the American Medical Association, 252(1), 63-67.
Lindzen, R. S. (1990). Some coolness concerning global warming. Bulletin of the American Meteorological Society, 71(3), 288-299.
Mann, M. E., Bradley, R. S., & Hughes, M. K. (1998). Global-scale temperature patterns and climate forcing over the past six centuries. Nature, 392(6678), 779-787.
微信扫码关注该文公众号作者