看啥推荐读物
专栏名称: 生信媛
生信媛,从1人分享,到8人同行。坚持分享生信入门方法与课程,持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。
今天看啥  ›  专栏  ›  生信媛

像学R一样学Python(高级数据管理)

生信媛  · 公众号  · 生物  · 2017-08-12 20:03
温故在基本数据管理部分,主要是涉及到如何新建数据集,并且对数据集中的变量和观测值进行提取和操作。基本上用到了如下函数,可以根据函数名回忆一下用法:import pandas as pd import numpy as np from pandas import Series, DataFrame pd.read_table() # 假设新建一个数据框为df df.head(), df.tail(), df.shape(), df.dtypes() df['var'] = values # 新建变量 np.where(), np.logical_and, np.less, np.greater # 变量重编码 df.index, df.columns, df.index.map, df.columns.map, df.index.rename, df.index.reanme # 变量重命名 df.isnull, df.notnull, df.dropna, df,fillna #  缺失值处理 pd.to_datetime# 日期值 df.astype # 数据类型转换 df.sorte_index df.sort.values # 排序 pd.merge, pd.concat, pd.appedn # 合并数据集 df.ix[], df[], df.loc[] # 数据取子集 df.sample # 抽样知新,一个实际 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照