Pandas.DataFrame.query()函数
2023年第2篇文章。
Pandas.DataFrame.query()函数根据逻辑表达式(单个或者组合式)选择行以返回一个新的数据框,通过设置参数inplace=True,可以在原有数据框完成更新。
Pandas.DataFrame.query()函数的语法形式。
DataFrame.query(expr, inplace=False, **kwargs)
1)expr:逻辑表达式
2)inplace:默认值是False,不更新原有数据框,若是要更新,设置为True
3)**kwargs:使用eval()的关键字参数
举例说明:
第一步:创建数据框
technologies = {
'Courses': ["Spark", "PySpark", "Hadoop", "Python", "Pandas"],
'Courses Fee': [22000, 25000, 23000, 24000, 26000],
'Duration': ['30days', '50days', '30days', None, np.nan],
'Discount': [1000, 2300, 1000, 1200, 2500]
}
df = pd.DataFrame(technologies)
print(df)
输出结果:
第二步:使用query函数,选择目标行
# 1)选择Python课程
df2 = df.query("Courses == 'Python'")
print(df2)
# 2) 使用变量操作
value = "Python"
df3 = df.query("Courses == @value")
print(df3)
# 3)多条件操作
df4 = df.query("Courses in ('Spark','PySpark')")
print(df4)
df5 = df.query("`Courses Fee` >= 23000 and `Courses Fee` <= 24000")
print(df5)
输出结果:
我最近喜欢使用VSCode阅读和编写Python代码,被它的简洁性、灵活性、便利性、延展性深深吸引了。
我在文章《VSCode,一款好用的编程开发工具,提升Python开发效率》,介绍我是如何使用VSCode。我会继续给大家分享VSCode和Python的有趣故事。
我是谁?
我叫王路情,是一名数据科学家,同时,也是一名讲师。
我通过公众号、知乎等网络媒体,向大众传播和分享Python语言和数据科学的知识。到目前为止,受众已经超过5万人。
我认为“数据创造价值”应该是数据科学家的首要任务。我通过各种途径向世人传播数据科学知识,就是希望帮助更多客户用好数据。
请多多关照。
我的Python语言社群?
我创建了多个Python语言社群,聚焦于Python语言和数据科学的讨论、交流和分享。
这些R语言社群受众2000+人,来自各行各业,大家都在使用Python语言解决问题。
欢迎大家加入我的Python语言社群,我的微信shushengya360,加我时,请备注:姓名-入群。
评论