Python读取数据小技巧分享
Chenrs
共 1347字,需浏览 3分钟
· 2021-04-04
各位看客,早中晚好。
今日随笔,介绍python读取数据的一些小技巧。
重要的事说三遍:
做数据分析/挖掘/处理,一定要熟练使用pandas!简单方便快捷!
做数据分析/挖掘/处理,一定要熟练使用pandas!简单方便快捷!
做数据分析/挖掘/处理,一定要熟练使用pandas!简单方便快捷!
pandas读取csv、txt、excel文件、数据库数据:
import pandas as pd
# ======== 读取csv
df = pd.read_csv("data.csv")
# ======== 读取txt
df = pd.read_csv("data.txt",sep = "\t")
# ======== 读取excel
df = pd.read_excel("data.xlsx")
# ======== 读取数据库
import sqlalchemy as create_engine
# 建立连接
con = create_engine('mysql+pymysql://user_name:password@127.0.0.1:3306/database_name')
# 通过查询读取
df = pd.read_sql_query('select * from table', con)
读取txt文本数据:
# 打开文件
with open(r"data.txt", "r",encoding='utf8') as f:
# 一次性全部 读取
# data = f.read()
# print(data)
# 读取成一个list
# data = f.readlines()
# 一行一行读取
line = f.readline()
while line:
line = f.readline()
print(line)
读取较大的csv文件,最快的方式如下:
import dask.dataframe as dd
import pandas as pd
# 读取csv
df = dd.read_csv("D:/df.csv")
# 转为DataFrame 操作
df = df.compute()
做数据的持久化,我选择采用python 的pickle包,读写速度较快:
import pickle
# 读取pkl文件
def read_pkl(data_path):
with open(data_path, 'rb') as f:
return pickle.load(f)
# 写数据到pkl文件
def save_file(data,data_path):
with open(data_path, 'wb') as f:
pickle.dump(data, f)
到这。
共勉,感谢查看。
更多干货敬请期待!
扫描二维码关注我吧!
热门文章:
python实战:
评论
金融研究 | 使用Python测量关键审计事项的「信息含量」
Tips: 公众号推送后内容只能更改一次,且只能改20字符。如果内容出问题,或者想更新内容, 只能重复推送。为了更好的阅读体验,建议阅读本文博客版, 链接地址https://textdata.cn/blog/2023-01-13-information-content-of-critical-aud
大邓和他的Python
0
CVPR 2024|大视觉模型的开山之作!无需任何语言数据即可打造大视觉模型
↑ 点击蓝字 关注极市平台作者丨科技猛兽编辑丨极市平台极市导读 本文提出一种序列建模 (sequential modeling) 的方法,不使用任何语言数据,训练大视觉模型。>>加入极市CV技术交流群,走在计算机视觉的最前沿本文目录1 序列建模打造大视觉模型(来自 U
极市平台
1
金融研究(更新) | 使用Python构建关键审计事项的「信息含量」
Tips: 公众号推送后内容只能更改一次,且只能改20字符。如果内容出问题,或者想更新内容, 只能重复推送。为了更好的阅读体验,建议阅读本文博客版, 链接地址https://textdata.cn/blog/2023-01-13-information-content-of-critical-aud
大邓和他的Python
0
轻松掌握开源项目的二次开发技巧
大厂技术 高级前端 Node进阶点击上方 程序员成长指北,关注公众号回复1,加入高级Node交流群本文作者:@方长_beezen 原文链接:https://juejin.cn/post/7358647992608489535前言随着软件行业的迅速
程序员成长指北
0
谷歌员工爆料 Python 基础团队原地解散
转自 | 机器之心编辑 | 蛋酱什么?谷歌解雇了整个 Python 基础团队?「当与你直接共事的每个人,包括你的主管,都被裁员 —— 哦,是职位被削减,而你被要求安排他们的替代者入职,这些人被告知在不同的国家担任同样的职位,但他们并不为此感到高兴,这是很艰难的一天。」发布这一动态的 Tho
机器学习算法与Python实战
0
五一抢票难,Github上这几个Python项目,你可以试试
又到五一长假啦(虽然其实就放了1天),大家是打算家里蹲or出去玩,又或者是在公司加班呢...今天给大家介绍三个和12306相关的项目,看看你是否用得上。/01/ py12306py12306购票助手,顾名思义,12306买票的~需要在python 3.6以上版本运行程序。1. 安装依赖gi
Crossin的编程教室
0
谷歌员工爆料Python基础团队原地解散
机器之心报道编辑:蛋酱什么?谷歌解雇了整个 Python 基础团队?「当与你直接共事的每个人,包括你的主管,都被裁员 —— 哦,是职位被削减,而你被要求安排他们的替代者入职,这些人被告知在不同的国家担任同样的职位,但他们并不为此感到高兴,这是很艰难的一天。」发布这一动态的 Thomas Wouter
机器学习初学者
0
Python加速运行技巧
Python 是一种脚本语言,相比 C/C++ 这样的编译语言,在效率和性能方面存在一些不足。但是,有很多时候,Python 的效率并没有想象中的那么夸张。本文对一些 Python 代码加速运行的技巧进行整理。 0. 代码优化原则 本文会介绍不少的 Python 代码加速运行的技巧。在深入代码优化细
机器学习算法与Python实战
0