Nature - 通过全球宏基因组解锁功能 “暗物质”

劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory)Nikos Kyrpides等研究人员通过不依赖参考基因组的大规模宏基因组分析,挖掘无法和参考基因组以及已知蛋白家族匹配的新宏基因组蛋白家族(novel metagenome protein families (NMPFs)),探索功能 “暗物质” [1]。

研究人员通过新的计算分析流程从来自海洋、淡水、土壤、人相关菌群、非人哺乳动物相关菌群、植物相关菌群、其它宿主(昆虫等)相关菌群以及人工生态系统(城市以及农田等)菌群的26,931组宏基因组数据集[2]–[4]鉴定约11.7亿条不能和参考基因组以及已知蛋白家族匹配的序列(35 aa+)。进一步结合基于序列相似性的蛋白聚类分析,研究人员解析106,198个成员超过100个的新蛋白家族,并进一步结合AlphaFold结构预测与比对发现一系列新结构/折叠[1]。

通过宏基因组解析新蛋白家族流程[1]。


来自不同生态系统的蛋白家族之间的关联概览[1]。


结合AlphaFold结构预测以及与已知结构比对解析新结构/折叠[1]。


该项工作2023年10月11日在线发表在nature[1]。

Comment(s):

“宏大”的工作,特别是对发现的新家族从生态系统地理分布到新折叠分析到位,并持续与已知的蛋白/蛋白家族进行比对。

这些新折叠新结构结合其生态分布,或能带来蛋白折叠与功能特性新见解。

后续最关键的还是扩大样本与结合更敏感可靠的微生物基因组测序方法扩展对“暗物质”的探索。

新宏基因组蛋白家族挖掘远未饱和[1]。


Last Author Info:

https://scholar.google.com/citations?user=0FuZRPYAAAAJ&hl=en


参考文献:

[1] G. A. Pavlopoulos et al., “Unraveling the functional dark matter through global metagenomics,” Nature, pp. 1–9, Oct. 2023, doi: 10.1038/s41586-023-06583-7.

[2] A. J. Enright, S. Van Dongen, and C. A. Ouzounis, “An efficient algorithm for large-scale detection of protein families,” Nucleic Acids Res., vol. 30, no. 7, pp. 1575–1584, 2002, doi: 10.1093/nar/30.7.1575.

[3] A. Azad, G. A. Pavlopoulos, C. A. Ouzounis, N. C. Kyrpides, and A. Buluç, “HipMCL: a high-performance parallel implementation of the Markov clustering algorithm for large-scale networks,” Nucleic Acids Res., vol. 46, no. 6, p. E33, 2018, doi: 10.1093/nar/gkx1313.

[4] I. M. A. Chen et al., “The IMG/M data management and analysis system v.6.0: New tools and advanced capabilities,” Nucleic Acids Res., vol. 49, no. D1, pp. D751–D763, 2021, doi: 10.1093/nar/gkaa939.

原文链接:

https://www.nature.com/articles/s41586-023-06583-7

展开阅读全文

页面更新:2024-04-29

标签:宏基   暗物质   劳伦斯   基因组   研究人员   序列   解锁   生态系统   蛋白   家族   结构   功能   全球

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top