TFRecorder将数据转换为 TFRecord 格式
TFRecorder 用于将 Pandas DataFrame 或 CSV 文件转换为 TFRecord。TFRecord 是一种简单的二进制文件格式。
目前,TFRecorder 支持以“图像 csv 格式”存储的数据,类似于 GCP AutoML Vision。
用法示例
From Pandas DataFrame
本地运行
import pandas as pd import tfrecorder df = pd.read_csv(...) df.tensorflow.to_tfr(output_dir='gs://my/bucket')
在 Cloud Dataflow 运行
import pandas as pd
import tfrecorder
df = pd.read_csv(...)
df.tensorflow.to_tfr(
output_dir='gs://my/bucket',
runner='DataFlowRunner',
project='my-project',
region='us-central1')
From CSV
使用 Python 解释器
import tfrecorder
tfrecorder.create_tfrecords(
input_data='/path/to/data.csv',
output_dir='gs://my/bucket')
使用命令行
tfrecorder create-tfrecords \
--input_data=/path/to/data.csv \
--output_dir=gs://my/bucket
评论
