Attention center人类注意力预测模型
Attention center 是一个机器学习模型,这个仓库包含:
- 一个 TensorFlow Lite 模型,可用于预测图像的注意中心,即图像中最突出的部分所在的区域
 - 一个 Python 脚本,可用于使用注意力中心对图像进行批量编码。这可以和子模块 libjxl 一起使用,以便创建 JPEG XL 图像,这样解码图像将从由模型决定的注意中心开始。
 
Google Attention center 模型的一些预测实例,其中绿点是模型预测的图像注意力中心点。
如何使用
请确保你已经安装了 Python 和 Tensorflow:
- 从 GitHub 上克隆它,包括子模块
 - 构建 libjxl,按照 libjxl repo 中给出的说明
 - 运行 encode_with_centers.py 脚本。
 
git clone https://github.com/google/attention-center --recursive --shallow-submodules cd attention-center/libjxl mkdir build cd build cmake -DCMAKE_BUILD_TYPE=Release -DBUILD_TESTING=OFF .. cmake --build . -- -j$(nproc) cd ../../ python encode_with_centers.py --lite_model_file=./model/center.tflite \ --image_dir="${INPUT_IMAGE_DIR}" --output_dir="${OUTPUT_IMAGE_DIR}"
有以下标志:
  --[no]dry_run: If true, only do a dry run, do not write files.
    (default: 'false')
  --encoder: Location of th encoder binary.
  --image_dir: Name of the directory of input images.
    (default: './libjxl/build/tools/cjxl')
  --lite_model_file: Path to the corresponding TFLite model.
  --new_suffix: File extension of the compressed file.
    (default: 'jxl')
  --output_dir: Name of the directory of the output images.
  --[no]verbose: If true, prints info about the commands executed.
    (default: 'true')
 
评论
