脑洞大开!这个简易命令行工具,输入文字可生成的奇特图像
开源前哨
共 4841字,需浏览 10分钟
· 2021-04-19
【导语】:使用文本生成图像的简单命令行工具。
“mist over green hills” 生成的图片
雾气朦胧的青山
简介
deep-daze 是一个使用 OpenAI 的 CLIP 和 Siren 的,使用文本生成图像的命令行工具,使用简单的语言描述图像内容,即可生成对应的图片。
项目地址是:
https://github.com/lucidrains/deep-daze
下载安装
deep-daze是一个Python命令行工具,所以使用的环境中需要先安装Python,然后执行以下命令即可安装:
$ pip install deep-daze
简单使用
deep-daze的使用也非常简单,记住一个imagine命令即可,如:
$ imagine "a house in the forest"
在Windows中需要使用管理员打开CMD窗口。
如果内存足够大,可以添加--deeper选项来获得更高质量的图片:
$ imagine "shattered plates on the ground" --deeper
deep-daze有以下选项可供选择:
--img=IMAGE_PATH
默认值:无。
用以优化png/jpg图像或PIL图像的路径。
--encoding=ENCODING
默认值:无。
用户创建的自定义CLIP编码。如果使用,则替换使用的任何文本或图像。
--create_story=CREATE_STORY
默认值:False。
如果启用此功能,则可以使用比77个字符更长的文本,用于创建图片故事。
--story_start_words=STORY_START_WORDS
默认值:5。
仅在create_story为True时使用。
--story_words_per_epoch=STORY_WORDS_PER_EPOCH
默认值:5。
仅在create_story为True时使用。
--story_separator:
默认值:无
仅在create_story为True时使用。定义一个类似.的分隔符。
--lower_bound_cutout=LOWER_BOUND_CUTOUT
默认值:0.1
每批SIREN图像的随机切口的大小的采样下限。应小于0.8。
--upper_bound_cutout=UPPER_BOUND_CUTOUT
默认值:1.0
每批SIREN图像的随机切口的大小的采样上限。应该保持在1.0。
--saturate_bound=SATURATE_BOUND
默认值:False
如果为True,则在训练期间将LOWER_BOUND_CUTOUT线性增加至0.75。
--learning_rate=LEARNING_RATE
默认值:1e-05
神经网络的学习率。
--num_layers=NUM_LAYERS
默认值:16
Siren神经网络的隐藏层数量。
--batch_size=BATCH_SIZE
默认值:4
计算损失之前传递到Siren图像的数量。减小此值可能会降低内存和准确性。
--gradient_accumulate_every=GRADIENT_ACCUMULATE_EVERY
默认值:4
计算出n个样本的加权损耗。增加此值有助于以较小的批次大小提高准确性。
--epochs=EPOCHS
默认值:20
要运行的次数。
--iterations=迭代
默认值:1050
在给定时期内计算和反向传播损耗的次数。
--save_every=SAVE_EVERY
默认值:100
生成图像的每一次迭代是这个数的倍数。
--image_width = IMAGE_WIDTH
默认值:512
所需的图像分辨率。
--deeper=DEEPER
默认值:False
使用具有32个隐藏层的Siren神经网络。
--overwrite=OVERWRITE
默认值:False
是否覆盖现有的同名生成图像。
--save_progress=SAVE_PROGRESS
默认值:False
是否保存在Siren训练之前生成的图像。
--seed=SEED
类型:可选
默认值:无
要使用的种子用于确定性的运行。
--open_folder=OPEN_FOLDER
默认值:True
是否打开生成的图像的文件夹。
--save_date_time=SAVE_DATE_TIME
默认值:False
保存文件具有时间戳。例如`%y%m%d-%H%M%S-my_phrase_here`
--start_image_path= TART_IMAGE_PATH
默认值:无
首先在原始图像上训练生,然后再转向文本输入
--start_image_train_iters=START_IMAGE_TRAIN_ITERS
默认值:50
在初始图像上进行初始训练的次数
--theta_initial=THETA_INITIAL
默认值:30.0
描述色彩空间频率的参数。仅适用于网络的第一层。
--theta_hidden = THETA_INITIAL
默认值:30.0
描述色彩空间频率的参数。仅适用于网络的隐藏层。
--save_gif = SAVE_GIF
默认值:False
是否保存生成过程的GIF动画。仅在save_progress设置为True时有效。
更多
基于一张图片进行训练合成
$ imagine 'a clear night sky filled with stars' --start_image_path ./cloudy-night-sky.jpg
原始图片:
合成图片:
使用Python进行调用
from deep_daze import Imagine
imagine = Imagine(
text = 'cosmic love and attention',
num_layers = 24,
)
imagine()
每迭代四次就保存,以该格式保存图片:insert_text_here.00001.png,insert_text_here.00002.png,...
imagine = Imagine(
text=text,
save_every=4,
save_progress=True
)
创建带有时间戳和序列号的文件
imagine = Imagine(
text=text,
save_every=4,
save_progress=True,
save_date_time=True,
)
- EOF -
更多优秀开源项目(点击下方图片可跳转)
开源前哨
日常分享热门、有趣和实用的开源项目。参与维护10万+star 的开源技术资源库,包括:Python, Java, C/C++, Go, JS, CSS, Node.js, PHP, .NET 等
关注后获取
回复 资源 获取 10万+ star 开源资源
分享、点赞和在看
支持我们分享更多优秀开源项目,谢谢!
评论
真高!比亚迪员工爆料比亚迪在越南的薪资水平:基本工资480万,全勤奖35万,交通补助20万,餐补110万,每周6天,每天10小时
上一篇:某大公司为逼迫员工离职,竟然把他的工位安排到厕所旁,没想到他直接开始记录领导的如厕时间,还发到公司大群...对此,你怎么看?--完--PS:欢迎在留言区留下你的观点,一起讨论提高。如果今天的文章让你有新的启发,欢迎转发分享给更多人。全文完,感谢你的耐心阅读。如果你还想看到我的文章,请一定给本
开发者全社区
0
私人影院 “美女陪侍” 被曝光!摸胸摸腿可外出…
在中国,我们都清楚黄赌毒一直是严打对象。尤其是那些涉黄活动,虽然禁止,但还是有人铤而走险。最近,长沙的一家私人影院被曝光涉及黄色事件。这到底怎么了?一个叫王某的消费者揭露了这一事件。他一直单身,看到影院推出的“恋爱体验”套餐就心动不已,结果去了之后发现踩空了,令人心寒。听说,基础服务要369元,包括
逆锋起笔
0
太敢穿了!透视纱裙!性感火辣的身材
绝了呀今天的厂花:吴宣仪1995年1月26日,吴宣仪出生于海南省海口市,中国内地流行乐女歌手、影视演员。2016年2月,吴宣仪随宇宙少女发行首张迷你专辑正式出道。2018年4月,她参加《创造101》综艺选秀,获得第二名,成功加入火箭少女101组合。吴宣仪的颜值一直备受称赞,她的五官立体精致,皮肤白皙
逆锋起笔
0
某大公司为逼迫员工离职,竟然把他的工位安排到厕所旁,没想到他直接开始记录领导的如厕时间,还发到公司大群...
上一篇:字节的跳动职级与薪资(2024年)我们与公司间的合作,宛如两艘船只在茫茫大海上相互依靠,共同抵御风浪,携手驶向成功的彼岸。然而,当航向开始产生分歧,或是波涛汹涌的风浪改变了我们的初衷,我们或许应当冷静地选择和平分手,而非在风雨中硬撑。最近,一位网友的遭遇引起了广大职场人的关注和热议。这位网友
开发者全社区
0
金融研究 | 使用Python测量关键审计事项的「信息含量」
Tips: 公众号推送后内容只能更改一次,且只能改20字符。如果内容出问题,或者想更新内容, 只能重复推送。为了更好的阅读体验,建议阅读本文博客版, 链接地址https://textdata.cn/blog/2023-01-13-information-content-of-critical-aud
大邓和他的Python
0
我看阿里的年终奖总算发了!
到4月底了,这两天看朋友圈,发现阿里的年终奖终于发了,问了问老同学,也从网上检索了不少信息,基本搞清楚了阿里今年的年终奖情况。近来来阿里一些集团对绩效等级做了较大的调整,以前的旧绩效系统中,绩效分为3.25、3.5、3.75、4和5五个等级,其中4和5是较高绩效等级,较少见。而且之前3.5绩效内部划
公子龙
0
CVPR 2024|大视觉模型的开山之作!无需任何语言数据即可打造大视觉模型
↑ 点击蓝字 关注极市平台作者丨科技猛兽编辑丨极市平台极市导读 本文提出一种序列建模 (sequential modeling) 的方法,不使用任何语言数据,训练大视觉模型。>>加入极市CV技术交流群,走在计算机视觉的最前沿本文目录1 序列建模打造大视觉模型(来自 U
极市平台
1
金融研究(更新) | 使用Python构建关键审计事项的「信息含量」
Tips: 公众号推送后内容只能更改一次,且只能改20字符。如果内容出问题,或者想更新内容, 只能重复推送。为了更好的阅读体验,建议阅读本文博客版, 链接地址https://textdata.cn/blog/2023-01-13-information-content-of-critical-aud
大邓和他的Python
0