人工智能周刊#20:主流 llm 性能、速度和价格一览

共 7249字,需浏览 15分钟

 ·

2024-05-27 14:41








本期目录:


大模型



Google 发布生成式 AI 视频模型 Veo


一览主流 llm 性能、速度和价格的对比网站


国内外AI大语言模型API价格对比
工具

开源的 AI 导航站模板


2024 GitHub 加速器:开源 AI 11 个项目


一个帮助你思考的集合工具&框架:


AI 智能图像分割


一个只做渐变色的CSS库


一款专为英语学习打造的视频播放器
知识库

Phi-3 CookBook


生成式人工智能常识科普图


LaTeX 入门与进阶 


前端开发的知识总结


手把手带你从头实现 LLaMa 3


什么是 GPT?工作原理动画展示


OpenAI 前首席科学家分享30 篇顶级 AI 论文
轻阅读




  冷知识:2024 年已过 40%

unsetunset大模型unsetunset


Google 发布生成式 AI 视频模型 Veo[1]


Google 在 I/O 开发者大会上宣布了它的生成式 AI 视频模型 Veo,能以不同视觉和电影风格生成长度超过 1 分钟的 1080p 分辨率视频。


Google 称,Veo 具有自然语言的高级理解能力,能理解“延时拍摄(timelapse)”或“空中镜头(aerial shots of a landscape)”等电影术语,用户可用文本、图像或基于视频的提示导向他们想要的输出。


Veo 的视频输出更一致和连贯,能展现人和物的更真实运动。类似 OpenAI 的 Sora,Veo 将首先提供给电影制作人和内容创作者试用。


![[veo_example_014_jellyfish 1.mp4]]


Prompt: A lone cowboy rides his horse across an open plain at beautiful sunset, soft light, warm colors


一览主流 llm 性能、速度和价格的对比网站[2]


分享一个可以一览主流 llm 性能、速度和价格的对比网站,方便大家选择适合自己的模型


性能最好:gpt-4o 速度最快:gemini 1.5 flash 价格最低:llama 3-8b,主要 deepseek 没做评测。





国内外 AI 大语言模型 API 价格对比[3]


AIGCRank 大语言模型 API 价格对比是一个专门汇总和比较全球主要 AI 模型提供商的价格信息的工具。可以轻松查找和比较 OpenAI、Claude、Mixtral、Kimi、星火大模型、通义千问、文心一语、Llama 3、GPT-4、AWS 和 Google 等国内外主要 API 提供商的最新价格,确保找到最适合您项目的模型定价。


unsetunset工具unsetunset


开源的 AI 导航站模板[4]


Tap4 AI Web UI 是一款开源的 AI 导航站模板,项目非常轻量级,维护简单,可一键部署到 Vercel!


功能





  • 国际化



  • SEO 友好(支持 i18n)



  • 动态 sitemap.xml(支持 i18n)



  • 快速发布



  • 使用 NEXT 14 和 app 路由(react 服务器组件)



  • Supabase serverless 数据库


这两年 AI 导航站的流量非常大,大家如果也想做 AI 导航站,不妨拿去白嫖吧!


2024 GitHub 加速器:开源 AI 11 个项目[5]


GitHub 加速器宣布了 2024 年入选的 11 个开源 AI 项目,它们代表了全球开源 AI 领域的创新和加速发展。项目包括机器学习和 AI 框架、生物学和疾病发现、模型训练和微调工具、仿真、部署和全生产化系统、多模态和 3D AI 能力,以及从可穿戴设备到 AI 驱动机器人的新兴接口和设备。


11 个入选的开源 AI 项目:





  • Unsloth AI@UnslothAI 由 Daniel Han 和 Michael Han 创立,旨在使自定义 AI 模型更易访问。Unsloth 通过新兴技术和能力,使其比竞争对手快 2-5 倍,内存使用减少 70%,同时保持模型的性能和准确性。





  • Giskard@giskard_ai  由 Alex Combessie 和 Weixuan XIAO 创立,是一个用于测试和评估 LLMs 的开源库。Giskard 旨在提高开源 AI 模型的质量,推动整体采用、研究、透明度和问责性。





  • A-Frame@aframevr 由 Diego Marcos 共同创建和维护,是一个框架,旨在使任何人在网络浏览器中都能轻松开发 AR/VR 和 3D 内容。A-Frame 专注于集成 AI 工作流程,例如 3D 高斯溅射和生成性 AI,以创建图像和环境。





  • Nav2 由机器人专家 Steve Macenski 创立,是 Robot Operating System (ROS) 导航框架的先驱。Nav2 是全球部署最广泛的自主移动机器人(AMR)导航解决方案,被 100 多家公司信赖。





  • OpenWebUI@OpenWebUI 由 Tim Baek 创立,旨在为 AI 和 LLMs 构建最佳用户界面,为那些互联网访问受限的人提供利用 AI 技术的机会。OpenWebUI 通过 Web 界面本地运行 LLMs,使 AI 和 LLMs 更安全、更私密。





  • LLMware AI 由 Namee Oberst 创立,她与 CEO Darren Oberst 和 Stefan Bachhofner 一起,旨在为金融和法律机构构建安全和敏感的 LLM AI Agent 和 RAG 模型。





  • LangDrive 由 Michael Vandi 和 Spmatika 创立,他们在 CMU 攻读硕士学位期间构建了一个 LLM 电子邮件代理。LangDrive 是一个简单的框架,通过 API 和配置文件训练和部署生产级别的微调语言模型。





  • HackingBuddyGPT 由 Andreas Happe 和 Jurgen Cito 创立,旨在帮助道德黑客和安全专业人员利用 LLMs 使世界更安全。HackingBuddyGPT 是一个自主的黑客伙伴,具有人在环路中的基础设施。





  • Web-Check 由 Alicia Sykes 创立,她是一位开源倡导者,旨在通过基于任何网站或服务器的开放数据提供 AI 驱动的安全洞察,使互联网更安全。





  • Marimo@marimo_io 由 Akshay Agrawal 和 Myles Scolnick 共同创立,旨在解决数据科学和机器学习 Notebook 使用中的所有问题。Marimo 是一个下一代 Python Notebook,为 AI/ML 开发者提供可复现、可维护和可生产的 Notebook。





  • Talkd AI @talkd_ai  由 Vinicious Mesel 创立,他开始兼职开发 Talkd AI,以构建一个统一的 LLM 聊天 API,为多个 LLMs 和上下文提供抽象层。Talkd AI 旨在促进和传播 LLMs 中 RAG 技术的使用方法。




一个帮助你思考的集合工具&框架:[6]





一个只做渐变色的 CSS 库[7]


Ulgradients 是一个主打渐变风网站,设计师可根据自己风格来选择搭配,直接获得对应渐变配色的 CSS 代码,相当方便对于大大提高了前端开发的效率。


一款专为英语学习打造的视频播放器[8]


为英语学习者量身打造的视频播放器,助你通过观看视频、沉浸真实语境,轻松提升英语水平。





unsetunset知识库unsetunset


Phi-3 CookBook[9]


Phi-3 是微软开发的一系列开放 AI 模型,是目前功能最强大、性价比最高的小型语言模型,分为 mini、small、vision 和 medium 等版本。


关于 Phi-3 入门的 Phi-3 CookBook,主要内容:· Phi-3 介绍和快速上手 · Phi-3 推理、微调和评测


生成式人工智能常识科普图[10]


https://cartography-of-generative-ai.net/genai_cartography.pdf


这张图非常有意思!


把生成式人工智能 GenAI 的核心内容 & 高频议题,绘制在了一张可视化图里。通过这张图,你可以感受到整个 GenAI 世界的运转逻辑,也会大致明白大模型是如何生成文字和图片的~


LaTeX 入门与进阶[11]





前端开发的知识总结[12]









手把手带你从头实现 LLaMa 3[13]


llama3 implemented from scratch 最近在 GitHub 社区非常出圈,Star 狂飙!


这个项目用 图示 + 代码 的方式,从头演示了如何理解和实现 LLaMa 3 的完整过程,非常生动、详细且硬核 👍


什么是 GPT?工作原理动画展示[14]


3Blue1Brown 是一个专注于数学教育的 YouTube 频道,视频制作精良且非常擅用直观的动画和图表,讲清楚复杂抽象的数学话题,以及由此拓展的机器学习、深度学习等等。


3Blue1Brown 在 B 站也有官方账号,而且有 200 多万粉丝啦!最近更新的视频都与大模型有关,整个系列还在持续更新中。


如果你想直观地搞清楚 GPT 原理,那 3Blue1Brown 这个系列的视频,应该是全球最好的学习资料了,甚至没有之一。


@arthurchiao  做了另一件非常有意义的工作 —— 将视频整理成了「动图 + 文字」的可视化版本,而且还是中文!!相当于一份学霸的要点笔记,帮助你能更清晰地 get 到原视频的要点,彻底搞清楚 Transformer 内部工作原理。





OpenAI 前首席科学家分享 30 篇顶级 AI 论文[15]


OpenAI 前首席科学家 Ilya sutskever 大佬分享的约 30 篇顶级 AI 研究论文清单爆火🔥💥,据说看完可以掌握当前人工智能最为关键的 90% 的知识!


包括 Transformer 架构、RNN、LSTM、神经网络复杂度、计算机视觉等领域





unsetunset轻阅读unsetunset


公开写作的好处和坚持不懈[16]





近期学到的一个技能:相信别人已经做过。很多问题的解决方案,这个世界上已经存在过。一定有这个世界上某个团队某个人已经思考的非常透彻,可能在书籍里,在历史里,在故事里,或者藏在互联网深处。如果找信息带来的价值远大于自己思考实践才能验证,那就先思考我应该在哪里找到这个解决方案。By Nin19536@X


12 亿人没有护照、10 亿人没做过飞机、但有近 11 亿人可以上网。大学文化水平人数 2.18 亿,包含本科大专高职。理解这些数据,可以避免很多无意义的争吵。今天把上面数据都溯源了一下,都是官方发布的数据。截止 19 年底中国普通护照人数有 2 亿左右,也就是 12 亿人没有护照。23 年 9 月民航局公布的粗略数据表示中国乘坐过飞机的人仅为 3 亿多,也就是 10 亿多人没有坐过飞机。截止 23 年底,中国网民数量是 10.92 亿。2020 年人口普查,大学文化程度的人口为 21836 万人,包含高职、大专、本科及以上。By 熊猫学经济@weibo





参考资料


[1]

Google 发布生成式 AI 视频模型 Veo: https://deepmind.google/technologies/veo/

[2]

一览主流 llm 性能、速度和价格的对比网站: http://artificialanalysis.ai

[3]

国内外 AI 大语言模型 API 价格对比: https://aigcrank.cn/llmprice/

[4]

开源的 AI 导航站模板: https://github.com/6677-ai/tap4-ai-webui

[5]

2024 GitHub 加速器:开源 AI 11 个项目: https://github.blog/2024-05-23-2024-github-accelerator-meet-the-11-projects-shaping-open-source-ai/

[6]

一个帮助你思考的集合工具&框架:: https://untools.co/

[7]

一个只做渐变色的 CSS 库: https://uigradients.com/#RainbowBlue

[8]

一款专为英语学习打造的视频播放器: https://github.com/solidSpoon/DashPlayer?tab=readme-ov-file

[9]

Phi-3 CookBook: https://github.com/microsoft/Phi-3CookBook

[10]

生成式人工智能常识科普图: https://cartography-of-generative-ai.net/

[11]

LaTeX 入门与进阶: https://latex.lierhua.top/zh/

[12]

前端开发的知识总结: https://spacexcode.com/

[13]

手把手带你从头实现 LLaMa 3: https://github.com/naklecha/llama3-from-scratch

[14]

什么是 GPT?工作原理动画展示: https://arthurchiao.art/blog/visual-intro-to-transformers-zh/

[15]

OpenAI 前首席科学家分享 30 篇顶级 AI 论文: https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE

[16]

公开写作的好处和坚持不懈: https://www.usmacd.com/cn/public_writing/






知识管理王者,我的第二大脑,Obsidian配置指南


本地运行“小型”大模型,配合笔记应用王者Obsidian做知识管理


116页PDF小册子:机器学习中的概率论、统计学、线性代数


可能是全网最全的速查表:Python Numpy Pandas Matplotlib 机器学习 ChatGPT














浏览 66
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报