TFRecorder将数据转换为 TFRecord 格式

联合创作 · 2023-09-26 05:40

TFRecorder 用于将 Pandas DataFrame 或 CSV 文件转换为 TFRecord。TFRecord 是一种简单的二进制文件格式。


目前,TFRecorder 支持以“图像 csv 格式”存储的数据,类似于 GCP AutoML Vision。


用法示例


From Pandas DataFrame


本地运行



import pandas as pd
import tfrecorder

df = pd.read_csv(...)
df.tensorflow.to_tfr(output_dir='gs://my/bucket')

在 Cloud Dataflow 运行



import pandas as pd
import tfrecorder

df = pd.read_csv(...)
df.tensorflow.to_tfr(
output_dir='gs://my/bucket',
runner='DataFlowRunner',
project='my-project',
region='us-central1')

From CSV


使用 Python 解释器



import tfrecorder

tfrecorder.create_tfrecords(
input_data='/path/to/data.csv',
output_dir='gs://my/bucket')

使用命令行



tfrecorder create-tfrecords \
--input_data=/path/to/data.csv \
--output_dir=gs://my/bucket



 

浏览 21
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报