3 个令人惊艳的 GitHub 开源项目,诞生了!

FightingCoder

共 2377字,需浏览 5分钟

 · 2023-08-17

这是「进击的Coder」的第 859  篇技术分享 作者:小 G 来源:GitHubDaily

阅读本文大概需要 5 分钟。


d87dff042a2a4755a68f3940c234b26d.webp

2023 上半年在科技圈中,随着 ChatGPT 的面世,让 AI 领域这个看似沉浸已久的科技行业,重新回到了人们的视野中。各种 AI 工具层出不穷,无数网友惊叹技术进步之快。

作为目前拥有诸多开发者受众的技术社区,GitHub 在过去这段时间,也陆陆续续诞生了不少实用的 AI 工具。

这些工具都有着相同的特点,简单易用且高效,主打一个新奇亮眼,顺便解放你的个人生产力。

今天就给大家推荐几个 GitHub 上比较热门的 AI 工具,让大家体验一下人工智能的神器与强大之处。

AI 生成专属头像

去年 Midjourney 和 Stable Diffusion 这两款 AI 绘画神器一经发布,让诸多专业摄影师、设计师、艺术创作者都倍感震撼。大家都没想到,能够抢自己饭碗的,不是同行,而是 AI。

那些经 AI 之手创作的图像,艺术风格极具创意且逼真形象。当中有一些作品,甚至还拿到了艺术博览会的冠军,或卖到了 40 万美元的高价。

随着今年这波 AI 风口的兴起,让这两款神器再次走进人们的视野,但与上次不同的是,这次很多普通网友都开始上手学习,并参与创作,再利用工具能力进行变现。

前阵子有不少朋友帮人做 AI 头像专属定制,也能时不时赚几杯奶茶钱。

其实想做头像定制,也没那么难,今天给大家推荐一个在 GitHub 上开源的 AI 工具:Photoshot

用户将自己的个人头像上传后,可借助 Stable Diffusion 模型进行训练,并生成一款拥有不同风格的个人头像。

GitHub:https://github.com/shinework/photoshot

该项目在 GitHub 上开源半年多,里面用到的一些技术栈,放到今天,依然不会过时。下面我整理一下,供大家参考学习:

  • Next.js 开发 webapp;

  • Chakra UI 开发 UI 组件;

  • Prisma 作为数据库;

  • Replicate 机器学习模型云托管平台;

  • Stripe OpenAI 联合创始人做的第三方支付;

  • Stable Diffusion 当下最为流行的文生图开源模型;

AI 一键实现图像处理

今年 Meta 在 GitHub 开源 Segment Anything Model(SAM)以后,图像领域真正做到了「万物皆可分割」,开发者处理图像分割任务的流程进一步简化,成本大幅下降。

作为计算机视觉中尤为重要的一个研究方向,图像分割在近几年一直倍受业界关注。现在技术已经足够成熟,我们也能做出更多有趣的 AI 应用。

比如结合图像分割与图像处理,让 AI 实现照片水印去除,老照片一键修复,图像中的物品对象替换等等。

今天给大家推荐一款开源的图像修复工具:Lama Cleaner,基于 SOTA AI 模型构建,功能颇为齐全。

该工具可用于快速去除图像中各种物品、人物、字体、水印等对象,并支持老照片修复、文本替换图像内容等。

GitHub:https://github.com/Sanster/lama-cleaner

项目免费开源,支持自托管。如果担心数据隐私安全的话,可以把项目托管到自己的服务器上,让数据 under control。

另外,该工具还内置了插件系统,如果机器配置跟得上,你可以往里面再集成一些类似 RealESRGAN(生成高分辨率图像)、GFPGAN(人脸修复)等开源模型,为工具增添更多功能。这整得就跟开菜馆一样,丰俭由人04ba94012a5ba68e818e675d1fadea7d.webp

AI 实现视频自动剪切

近几年,短视频的风口一直在持续,各大社交网站也都针对短视频流量进行大力扶持。身边陆陆续续有朋友从大厂离职,加入自媒体行业,大多首选的内容创作类型,便是短视频。

短视频制作流程,一般主要分为制定主题、脚本构思、素材拍摄、视频剪辑。其中视频剪辑对技术要求颇高,不过一旦熟练掌握,不少流程也能实现自动化。

曾任亚马逊首席科学家的李沐老师,从两三年前便开始在 B 站授课,向大众科普 AI 技术知识,拆解主流论文中的技术实现原理与应用方向。

在此过程中,他根据自己的视频剪辑需求,随手做出了一款视频剪辑工具:AutoCut,可通过字幕快速剪切视频,现已开源至 GitHub。

该工具支持自动生成字幕,用户无需使用视频编辑软件,仅需编辑文本文件,即可完成剪切。

952d84ed8b02e081a6adbd30f70e3bbd.webp

GitHub:https://github.com/mli/autocut

项目采用的是 OpenAI 开源的自动化语音识别(ASR)系统,使用从网络收集的 68 万小时的多语言和多任务监督数据进行训练。

它能够根据视频语音,自动批量化生成字幕文件,其中英文语音的生成质量最高。

利用 Whisper 能够自动生成字幕的视频,对一些空白字幕内容配合脚本,进行视频自动剪切,便能够节省很多视频剪辑的时间。

以上,就是本期为大家推荐的几个 GitHub 项目,希望对大家有所帮助。

25a5a93d6c9d2f18a00cf2bcbbc678e9.webp

End

欢迎大家加入【ChatGPT&AI 变现圈】,零门槛掌握 AI 神器!我们带你从小白到高手,解锁智能问答、自动化创作、技术变现的无限可能。与我们共同成长,开启 AI 新征程!立即行动,未来已来!(详情请戳:知识星球:ChatGPT&AI 变现圈,正式上线!

扫码加入:

507a4cf9d90768b378219c0dfbd8a503.webp


好文和朋友一起看~
浏览 55
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报