Pandas知识点-合并操作combine
一combine_first()实现合并
二combine()实现合并
other参数传入被合并的DataFrame,func参数传入合并的规则函数,两个参数都是必传参数。
三调用已有函数和自定义函数
1. 调用numpy中的函数
2. 自定义实现combine_first()相同功能
四合并时填充空值
五不处理缺少的列
overwrite: 如果调用combine()方法的DataFrame中存在的列,在传入combine()方法的DataFrame中不存在,则先在传入的DataFrame中添加一列空值。overwrite参数默认为True,如第四部分的例子中df4的填充原理如下。
如果将overwrite参数设置成False,则不会给传入combine()方法的DataFrame添加不存在的列,并且合并时不会处理调用combine()方法的DataFrame中多出的列,多出的列直接原样返回。原理如下图。
六总结
> 参考文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.combine.html
评论