群体结构与群体混杂
Structured population 1)从若干个遗传群体内抽取部分个体,合并到一起即可构建一个混杂群体,这是抽样造成的混杂。
2)群体遗传学中的群体混杂/群体结构,一般是指由于recent admixture,群体之间存在基因交流而造成的。
主成分方法(PCA)和STRUCTURE/Admixture是常用的检测群体结构的方法。 与PCA相比,STRUCTURE/Admixture基于群体遗传的模型,更贴切群体遗传结构的分析要求。假定K个祖先群体,计算现有群体中各个祖先群体来源遗传成分的比例。STRUCTURE/Admixture计算结果类似。
fastStructure是STRUCTURE的快速版本,下载地址和参考文档:https://rajanil.github.io/fastStructure/
Admixture,计算速度同样比STRUCTURE快很多,下载地址和参考文档:https://www.genetics.ucla.edu/software/admixture/download.html
以Admixture为例,假定K=2~10,分别计算
for ((k=2;K<11);K++);do ./admixture --cv example.bed $k|tee example_${k}.log;done
得到的结果文件为example.${k}.Q
提取cross validation error结果
grep -h CV example*.log>CV.out
使用structurePlot.R绘制K=3时的结果(example.3.Q
)