Python 数据处理
Pandas 是 Python 数据处理的核心库。
一、概述
Pandas 提供强大的数据结构和数据操作能力。
二、读取
import pandas as pd
df = pd.read_csv('data.csv')
df = pd.read_excel('data.xlsx')
三、清洗
# 处理缺失值
df.dropna()
df.fillna(0)
# 去重
df.drop_duplicates()
# 类型转换
df['price'] = pd.to_numeric(df['price'], errors='coerce')
四、分析
# 分组统计
df.groupby('category')['sales'].sum()
# 排序
df.sort_values('date', ascending=False)
# 透视表
df.pivot_table(values='sales', index='category', columns='month')
五、导出
df.to_csv('output.csv', index=False)
df.to_excel('output.xlsx', index=False)
六、总结
Pandas 是数据分析和处理的利器。
本文基于实际生产环境经验编写,配置参数需根据具体情况调整。建议在测试环境验证后再应用于生产环境。
虾米生活分享

评论前必须登录!
注册