TFRecorder将数据转换为 TFRecord 格式
TFRecorder 用于将 Pandas DataFrame 或 CSV 文件转换为 TFRecord。TFRecord 是一种简单的二进制文件格式。
目前,TFRecorder 支持以“图像 csv 格式”存储的数据,类似于 GCP AutoML Vision。
用法示例
From Pandas DataFrame
本地运行
import pandas as pd import tfrecorder df = pd.read_csv(...) df.tensorflow.to_tfr(output_dir='gs://my/bucket')
在 Cloud Dataflow 运行
import pandas as pd import tfrecorder df = pd.read_csv(...) df.tensorflow.to_tfr( output_dir='gs://my/bucket', runner='DataFlowRunner', project='my-project', region='us-central1')
From CSV
使用 Python 解释器
import tfrecorder tfrecorder.create_tfrecords( input_data='/path/to/data.csv', output_dir='gs://my/bucket')
使用命令行
tfrecorder create-tfrecords \ --input_data=/path/to/data.csv \ --output_dir=gs://my/bucket
评论