Q1:如何评估研究物种基因组大小?
在进行基因组de novo项目前,首先是需要了解基因组大小,已确定基因组复杂性,常见几种方法如下:
1.数据库查询;
植物基因组大小查询:http://data.kew.org/cvalues
动物基因组大小查询:http://www.genomesize.com
换算关系:1pg=978Mb。
2.流式细胞仪测定评估基因组大小;
3.基因组Survey,相对前两种方法,可准确评估基因组大小,除此,可了解基因组重复序列比例及杂合率等,进一步评估基因组复杂情况,再制定后续高性价比的基因组de novo测序策略。
Q2: HiFi在基因组组装中有什么优势?
1.组装周期快、资源消耗少;
2.组装连续性好、完整性高;
3.精准基因分型;
4.适用于复杂基因组、超大基因组、多倍体组装;
Q3: 如何评估基因组组装结果?
从头组装基因评价通常包含三个方面:连续性、完整性和准确性。
一般用contig N50和scaffold N50 来衡量连续性,N50是指把组装出的contigs或scaffolds从大到小排列,当其累计长度刚刚超过全部组装序列总长度50%时,最后一个contig或scaffold的大小即为N50的大小。BUSCO(Benchmarking Universal Single-Copy Orthologs)在基因含量层面来评估其基因组完整性。序列一致性评估旨在利用高质量的二代测序数据来评估三代测序数据组装结果在单碱基水平上的准确性。