看啥推荐读物
专栏名称: 生信媛
生信媛,从1人分享,到8人同行。坚持分享生信入门方法与课程,持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。
今天看啥  ›  专栏  ›  生信媛

数据中心化、scaling以及转换

生信媛  · 公众号  · 生物  · 2020-11-04 08:00
今天给大家分享一篇关于代谢组中数据预处理(中心化、缩放和转换)的文章,但是同样适用于其他类似数据。Berg, Robert A van den, Huub CJ Hoefsloot, Johan A Westerhuis, Age K Smilde, and Mariët J van der Werf. “Centering, Scaling, and Transformations: Improving the Biological Information Content of Metabolomics Data.” BMC Genomics 7 (June 8, 2006): 142. https://doi.org/10.1186/1471-2164-7-142.代谢组数据中不同代谢物浓度差异高达5000倍,与代谢物的生物学相关性不成比例。但是数据分析方法是无法区分的。通过数据预处理可以纠正这个问题。作者将代谢物数据的变化分为induced biological variation和induced biological variation的变化:induced biological variation:代谢物浓度在数量级上存在差异;例如,信号分子的平均浓度远低于ATP这类含量很 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照