Rootless hair as a reliable source of forensic genetic information

无根毛发作为可靠的法医遗传信息来源

阅读:3

Abstract

The small amount of fragmented DNA present in rootless hair shafts is unsuitable for many assays, including most PCR-based assays. Thus, rootless hair DNA is often overlooked in biomedical and forensic analysis. Here we apply methods for efficient recovery and sequencing of minute quantities of short, fragmented DNA to single human hair shafts. Using this approach, we characterize DNA fragments in hair shafts. Despite the small quantities of fragmented DNA, we find multi-fold genome coverage can be generated from a few centimeters of most hair shafts - enough to generate accurate genotype calls and statistically compelling evidence for identity or non-identity.

文献解析

1. 领域背景与文献引入

文献英文标题:Evaluation of Nuclear DNA from Rootless Hairs for Forensic Purposes;发表期刊:未公开;影响因子:未公开;研究领域:法医遗传学

法医DNA鉴定是刑事司法体系中的核心技术,其发展经历了两个关键阶段:早期以短串联重复序列(STR)分析为核心,该技术依托完善的刑事罪犯数据库,具备隐私保护机制完善、检测方法成熟快速的优势,成为法医身份鉴定的标准方案,但该方法的局限性在于无法识别不在数据库中的嫌疑人,导致大量冷案难以推进。近年来,调查遗传系谱学(IGG)技术兴起,通过单核苷酸多态性(SNP)分析构建基因型文件,利用公共遗传数据库寻找嫌疑人的亲属,为冷案侦破提供了新路径,但该技术要求样本具备足量高质量的DNA。

犯罪现场常见的无根毛发,因核DNA高度片段化,无法通过PCR扩增STR进行分析,仅能进行线粒体DNA检测,而线粒体DNA的母系遗传特性使其无法提供足够的个体特异性信息,也难以满足系谱分析的需求。当前领域的核心空白在于缺乏针对无根毛发碎片化核DNA的有效利用方案,无法将这一常见现场样本转化为可用于IGG或身份鉴定的有效证据。本研究正是针对这一问题,开发了一套适用于无根毛发碎片化DNA的提取、建库及分析流程,旨在评估其在法医鉴定中的可行性与实用性。

2. 文献综述解析

作者按法医DNA鉴定技术的发展脉络,将现有研究分为传统STR分析与新兴IGG技术两类,系统梳理了两类技术的优势、局限性及应用场景,明确了无根毛发核DNA利用的技术瓶颈。

传统STR分析技术的核心优势包括:依托维护完善的刑事罪犯数据库(如美国CODIS),可快速匹配嫌疑人;STR位点的选择最大限度减少了非身份鉴定用途的信息泄露,具备良好的隐私保护特性;检测方法经过广泛验证,快速且灵敏。但该技术的核心局限性在于,当嫌疑人不在刑事数据库中时,无法提供有效线索,导致大量案件陷入僵局。新兴IGG技术则通过SNP基因型分析,利用公共用户贡献的遗传数据库寻找嫌疑人的亲属,突破了STR技术的数据库限制,已成功解决多起冷案,但该技术对DNA的质量和数量要求较高,需要未高度片段化的DNA样本。

对于无根毛发这一常见现场样本,现有研究仅证实其存在碎片化核DNA,但因片段长度过短(多小于100bp),无法满足STR PCR扩增的需求(扩增子通常数百bp),仅能进行线粒体DNA分析,而线粒体DNA的母系遗传特性使其无法提供足够的个体特异性信息,也难以用于系谱分析。本研究的创新价值在于,首次开发了针对无根毛发碎片化核DNA的高效建库与分析流程,实现了从这类样本中获取核SNP基因型数据,为法医鉴定提供了新的样本利用途径,填补了无根毛发核DNA用于SNP分析的技术空白。

3. 研究思路总结与详细解析

本研究的核心目标是评估无根毛发核DNA用于法医身份鉴定及调查遗传系谱学的可行性,围绕“如何从高度碎片化的无根毛发DNA中获取可靠的SNP数据并验证其鉴定效能”这一核心科学问题,构建了“样本收集-核酸提取与建库-测序与特征分析-基因型匹配验证-系谱适用性评估”的完整技术路线,通过与唾液样本的对照分析,系统验证了方法的可靠性与实用性。

3.1 样本收集与预处理

实验目的:获取标准化的无根毛发样本及对照唾液样本,为后续实验提供统一的研究材料。
方法细节:从50名匿名志愿者处收集50根头发、30根阴毛及50份唾液样本;对毛发样本进行预处理,去除可见根部,将头发修剪至5cm、阴毛修剪至3cm,通过显微镜测量毛发直径并计算体积;唾液样本采用标准方法收集。
结果解读:共获取80份无根毛发样本(50根头发、30根阴毛)及50份唾液样本,样本量满足后续提取、建库及验证实验的需求。
产品关联:文献未提及具体实验产品,领域常规使用样本收集管、光学显微镜、图像分析软件等。

3.2 毛发DNA提取与测序文库构建

实验目的:从无根毛发中高效提取碎片化核DNA,并构建适用于高通量测序的文库。
方法细节:采用0.5%次氯酸钠清洁毛发表面以去除外源DNA污染;使用含2% SDS、蛋白酶K的专用裂解液在55℃下过夜裂解毛发,补充DTT和蛋白酶K后继续孵育1小时;采用硅磁珠法(参考Rohland等方法)提取DNA,提取产物直接用于文库构建,无需定量;采用优化后的单链文库构建流程,每个毛发样本的DNA提取物分为3份,分别构建Illumina测序文库,建库过程包含末端修复、接头连接、PCR扩增等步骤,部分步骤采用自动化平台(Agilent Bravo)操作;通过qPCR确定最佳PCR循环数,扩增后进行SPRI纯化并定量。
结果解读:尽管毛发DNA提取物的浓度低于荧光检测下限,但成功为80根毛发构建了240个测序文库(每根3个),文库质量满足测序要求。
产品关联:实验所用关键产品:NEB的ET SSB、PNK(多聚核苷酸激酶)、T4 DNA连接酶,Thermo Scientific的Maxima SYBR Green Master Mix,Applied Biosystems的Amplitaq Gold 360 Master Mix,Qubit 1X dsDNA HS Assay Kit,Agilent Bravo自动化液体处理平台。

3.3 唾液样本处理与测序

实验目的:获取志愿者的高质量DNA作为阳性对照,用于验证毛发DNA基因型的准确性。
方法细节:采用prepIT-L2P试剂提取唾液样本DNA;选取44份唾液样本进行Illumina Infinium Global Screening Array芯片分型;对所有50份唾液样本采用NEBNext Ultra II FS DNA Library Prep Kit构建测序文库,进行全基因组测序。
结果解读:成功获取了唾液样本的芯片分型数据及全基因组测序数据,为毛发DNA的基因型验证提供了金标准对照。
产品关联:实验所用关键产品:DNA Genotek的prepIT-L2P试剂,NEB的NEBNext Ultra II FS DNA Library Prep Kit,Illumina Infinium Global Screening Array芯片。

3.4 测序数据处理与DNA片段特征分析

实验目的:解析无根毛发DNA的片段化特征,明确其无法用于STR分析的原因,并为后续基因型分析提供基础。
方法细节:采用SeqPrep2合并毛发样本的测序读长,使用bwa aln将合并后的读长比对到人类参考基因组(GRCh38);采用bwa mem比对唾液样本的测序读长;统计DNA片段长度分布、核DNA与线粒体DNA比例、片段与核小体的关联特征等。
结果解读:毛发DNA片段长度多小于100bp,远短于STR PCR扩增子长度(数百bp),这是其无法用于STR分析的核心原因;毛发中核DNA占比平均为96.94%,线粒体DNA占比平均为3.06%;毛发DNA片段富集于核小体结合区域,其断裂位点与核小体结构相关,呈现出特定的序列偏好性;每根头发平均实现2.18倍基因组覆盖度(n=50,文献未明确提供P值),每根阴毛平均实现2.64倍基因组覆盖度(n=30,文献未明确提供P值),所有毛发样本的线粒体基因组单倍型与对应唾液样本完全一致。


产品关联:文献未提及具体实验产品,领域常规使用生物信息学分析软件(如bwa、Picard)、高性能计算平台等。

3.5 身份匹配验证(IBDGem分析)

实验目的:验证毛发DNA用于个体身份匹配的准确性与可靠性。
方法细节:分别采用GATK、GLIMPSE2及自定义工具astrea-impute2从唾液样本测序数据中调用基因型;使用IBDGem软件对80根毛发与50份唾液样本进行两两比对,计算似然比以判断毛发与唾液样本是否来自同一人,其中包含80组阳性对照(同一人)与3920组阴性对照(不同人);分析染色体臂水平的似然比统计量,评估身份匹配的效能。
结果解读:无论采用哪种基因型调用工具,所有阳性对照与阴性对照均能得到明确的匹配结果,阳性对照的似然比显著支持身份一致,阴性对照的似然比显著支持身份不一致;即使将毛发测序数据随机下采样至0.2倍覆盖度,仍能准确区分同一人与不同人,证明方法具备高灵敏度与特异性。


产品关联:实验所用关键产品:IBDGem软件、GATK软件、GLIMPSE2软件、自定义astrea-impute2软件。

3.6 IGG基因型文件生成与评估

实验目的:评估毛发DNA生成的基因型文件用于调查遗传系谱学的适用性。
方法细节:从毛发测序数据中调用常见直接面向消费者(DTC)基因型平台的SNP位点,构建IGG可用的基因型文件;计算毛发基因型与对应唾液基因型的一致性,评估不同覆盖度下的基因型准确性。
结果解读:毛发样本的基因型准确性随覆盖度提升而提高,当覆盖度>1倍时,基因型与唾液样本的一致性>99.4%(n=77,文献未明确提供P值),该准确性水平足以满足IGG分析中亲属匹配的需求。
产品关联:文献未提及具体实验产品,领域常规使用系谱分析数据库(如GEDMatch)、基因型转换工具等。

4. Biomarker研究及发现成果解析

本研究中的Biomarker为无根毛发核DNA中的单核苷酸多态性(SNP)位点,通过“公共数据库筛选-测序数据验证-临床样本匹配”的完整逻辑,验证了其作为法医身份鉴定及系谱分析标记的可行性与可靠性。

Biomarker定位:本研究聚焦的Biomarker是广泛存在于人类基因组中的单核苷酸多态性(SNP)位点,筛选逻辑为:从1000 Genomes数据库中选取常见DTC基因型平台上的双等位基因SNP位点,经过多轮过滤(包括坐标唯一性、等位基因有效性等),最终确定1,013,317个位点作为目标标记;验证逻辑为:通过毛发全基因组测序检测这些位点的基因型,与唾液样本的金标准基因型进行比对,评估身份匹配效能及系谱分析适用性。

研究过程详述:Biomarker的来源为无根毛发中的核DNA,提取自志愿者的头部及阴部无根毛发样本;验证方法包括:全基因组测序检测SNP位点的基因型,IBDGem软件计算似然比评估身份匹配的准确性,直接比对毛发与唾液样本的基因型一致性;特异性与敏感性数据显示:在80组阳性对照中,所有样本均能得到支持身份一致的似然比,3920组阴性对照均能得到支持身份不一致的似然比,即使在0.2倍覆盖度下仍能准确区分;当毛发样本覆盖度>1倍时,基因型与唾液样本的一致性>99.4%(n=77,文献未明确提供P值,基于图表趋势推测)。

核心成果提炼:该SNP Biomarker的功能关联在于,可作为个体身份鉴定的核心标记,同时能用于构建IGG基因型文件以寻找亲属,为冷案侦破提供线索;创新性在于首次实现了从高度碎片化的无根毛发核DNA中获取可靠的SNP基因型数据,突破了无根毛发仅能用于线粒体DNA分析的局限;统计学结果显示,身份匹配的似然比在阳性与阴性对照中呈现显著差异,具备极高的鉴定准确性(文献未明确提供具体P值,基于图表趋势推测)。该研究成果为法医鉴定提供了新的样本资源,有望推动大量冷案的侦破进程。

特别声明

1、本页面内容包含部分的内容是基于公开信息的合理引用;引用内容仅为补充信息,不代表本站立场。

2、若认为本页面引用内容涉及侵权,请及时与本站联系,我们将第一时间处理。

3、其他媒体/个人如需使用本页面原创内容,需注明“来源:[生知库]”并获得授权;使用引用内容的,需自行联系原作者获得许可。

4、投稿及合作请联系:info@biocloudy.com。