《Scientific Data》:The European Upper Palaeolithic Palaeoecological and Archaeological Dataset for sites north of 50°N
编辑推荐:
北纬50°以北遗址的欧洲旧石器时代晚期古生态与考古数据集(EUPPAD)系统收集了北纬50°以北欧洲旧石器时代晚期遗址的古生态和考古数据。该数据集跨越约47,000–14,000 cal BP(校正后的距今),整合了遗址、石制品组合、动物群、植物群和背景记录,
北纬50°以北遗址的欧洲旧石器时代晚期古生态与考古数据集(EUPPAD)系统收集了北纬50°以北欧洲旧石器时代晚期遗址的古生态和考古数据。该数据集跨越约47,000–14,000 cal BP(校正后的距今),整合了遗址、石制品组合、动物群、植物群和背景记录,以支持在显著气候波动期间人类-环境相互作用的荟萃分析。EUPPAD涵盖了八个主要旧石器时代晚期技术复合体(technocomplexes),包括Lincombian-Ranisian-Jerzmanowician(LRJ)、Aurignacian、Gravettian、Epigravettian、LGM-forieren、Magdalenian、Hamburgian和Creswellian。数据通过广泛的文献综述和已发表数据集汇编,并辅以实地记录。每条条目包含详细的背景、人工制品和古生态变量,支持对定居模式、资源开发以及对格陵兰间冰段(Greenland Interstadials)和冰段(Stadials)适应的多样化和细致研究。FAIR(可查找、可访问、可互操作、可重用)数据原则确保了开放访问和互操作性。EUPPAD是一个综合资源,促进了关于晚更新世气候以及生态变异性和人类适应的跨学科研究。
### 研究背景与问题
末次冰期期间,北纬50°以北的欧洲位于芬诺斯堪的亚冰盖与不列颠-爱尔兰冰盖南缘附近,直接暴露于冰缘过程,包括冰川进退、冰湖溃决洪水、海平面变化和严重永久冻土。该区域景观在冷期以干冷风成沙漠-草原为主,间冰期则出现周期性淹没的低地(如多格兰德),对人群流动性和资源分布产生深远影响。北纬50°以北作为气候敏感区,对微小气候振荡尤为脆弱,导致显著的人口波动、反复的废弃与再殖民事件,以及人类与动物群落的强大适应压力。然而,现有研究缺乏一个系统化、标准化的数据整合平台,使得跨区域、跨时段的古生态与考古数据难以被有效整合用于人类-环境互动的定量分析。为此,研究人员在“北方气候变化与早期人类(CCEHN)”项目框架下,创建了欧洲旧石器时代晚期古生态与考古数据集(EUPPAD),旨在填补这一空白。该数据集遵循FAIR数据原则,提供开放获取与互操作性,发表在《Scientific Data》期刊上。
### 关键方法
研究人员采用了以下主要技术方法:1) 文献综述与实地记录:通过广泛检索已发表文献和已出版数据集,并补充实地挖掘记录(如Abri Stendel XVIII、Friedrichsdorf-Seulberg等遗址),收集遗址信息。2) 放射性碳测年筛选:遵循Pedersen等(2022)的协议,仅保留来自修改后动物遗存或可靠地层(如篝火)的测年数据,以排除不可靠日期。3) 站点排名:基于
14C测年数据和发掘证据,将遗址分为A至E五个等级,以反映数据质量差异。样本队列覆盖英国、法国北部、荷兰、比利时、德国北部、丹麦、波兰、瑞典南部、立陶宛和捷克北部共803个遗址。
### 研究结果
**Folder structure(文件夹结构)**:研究人员将数据集组织为多个CSV文件,包括主文件“euppad_complete”以及按类别分开的文件(如人工制品、石器原料、宏观动物群、微观动物群、鸟类、鱼类、软体动物、两栖动物、木炭/花粉),另有放射性碳测年文件“euppad_radiocarbon_dates_all”和“euppad_radiocarbon_dates_selected”。所有文件均包含EUPPAD_id和遗址名称,便于跨表链接与二次平台(如R或GIS)的数据传输。参考文献存储在Zotero群组中,并附有Word文件。通过这种结构,研究人员实现了数据的系统化组织与可访问性。
**Metadata(元数据)**:元数据涵盖通用信息(EUPPAD_id、遗址名称、行政区划、参考文献)、空间信息(WGS 84坐标及坐标精度1=精确/2=近似/3=边缘)、年代归属(技术复合体与
14C测年)、背景信息(土壤类型、发掘日期、遗址类型1=洞穴/2=岩厦/3=露天遗址)。对于信息存在但缺乏精确细节的情况,使用二进制TRUE或FALSE;无法获取信息则标注NA。通过设计这套元数据,研究人员确保了每个遗址位置的空间、年代与基础背景信息的标准化记录。
**Handling of typological and ecological parameters(类型学与生态参数处理)**:对于石制品,分类为毛坯(5类)和工具(22类),并记录所有雕刻器为“burins”(因类型学变迁难以重分类)。骨尖数量也被收集。石器原料(52种)记录用于未来流动性重建。对于古生态参数(538个变量),动物群按宏观动物(>2kg)、微观动物(<2kg)、鸟类、鱼类、软体动物、两栖动物细分,并记录标本数(NISP)和最小个体数(MNI)。植物证据按花粉或木炭分类。采用TRUE表示存在但数量未知,NA表示无信息,FALSE仅用于已发掘遗址的石器原料(表示不存在),而对动物群避免使用FALSE(因无法排除保存问题)。对于已灭绝物种,使用“TIME”标记(如Hamburgian文化中的洞穴熊Ursus spelaeus)。通过这样的分类系统,研究人员最大程度保留了数据的可解释性,同时避免误判。
**Handling of radiocarbon dates(放射性碳测年处理)**:从123个遗址收集了579个
14C测年数据,并通过原始文献和二次文献交叉验证。严格筛选仅保留来自人类修改动物遗存或人工堆积物(如篝火)的测年数据,排除地层不明确或不可靠的日期。最终在“euppad_radiocarbon_dates_selected”表中,对每个遗址保留标准偏差最小的测年数据(通常为最新预处理结果)。通过这一严谨的筛选协议,研究人员确保了测年数据的可靠性。
**Technical Validation(技术验证)**:研究人员引入了基于
14C测年与发掘证据的站点排名指数:等级A最可靠(有多个可靠
14C数据并有系统发掘),等级E最不可靠(地表采集品,背景信息少)。建议在后续分析建模中采用此排名以校正数据质量差异。通过此验证方法,研究人员为不同数据质量的遗址提供了使用指南。
**Perspective on data usage(数据使用视角)**:研究人员展望数据集可用于多种探索性和推理性分析,包括回归模型(LM/GLM/GLMM)、多元排序分析以及基于放射性碳测年的贝叶斯年代模型,用于研究空间、时间和分类尺度上的丰度、出现及群落组成模式。
### 讨论与结论
讨论部分强调,EUPPAD数据集虽涵盖150余年研究历程的遗址,数据质量参差不齐,但通过标准化分类、严格测年筛选和站点排名,最大程度保障了数据的可用性与可靠性。未来计划进行时间(加入末次冰期末期)和空间(扩展到北纬50°以南)的扩展,并开发R包以便快速访问与整合。研究结论部分指出,EUPPAD是一个综合性资源,促进了关于晚更新世气候、生态变异性以及人类适应的跨学科研究。