关于SQL和python数据预处理
关于SQL需要掌握:
1、提取特定情况下的数据,比如提取2017年的数据,提取前100个顾客的数据等
2、数据库的增、删、查、改,这些命令都很简单,记住即可
3、数据的分组聚合、如何建立多个表之间的联系,这在处理多维度、多个数据集时很有用
对于以上,需要掌握一些基本的操作,找一些数据集练习一下即可
****************************************************************************
关于python进行数据预处理,对于数据预处理,学会 pandas (Python包)的用法,应对一般的数据清洗就完全没问题了。需要掌握的知识点如下:
选择:数据访问(标签、特定值、布尔索引等)
缺失值处理:对缺失数据行进行删除或填充
重复值处理:重复值的判断与删除
异常值处理:清除不必要的空格和极端、异常数据
相关操作:描述性统计、Apply、直方图等
合并:符合各种逻辑关系的合并操作
分组:数据划分、分别执行函数、数据重组
Reshaping:快速生成数据透视表
以上是 关于SQL和python数据预处理 的全部内容, 来源链接: utcz.com/z/387753.html