机器学习算法工程师
3获赞1粉丝0关注
老黄又赢麻了!英伟达亲自下场推出 FlashAttention-3:H100利用率飙升至75%!
点蓝色字关注“机器学习算法工程师”设为星标,干货直达!740 TFLOPS!迄今最强 FlashAttention 来了。随着大型语言模型(LLM)加速落地,扩展模型上下文窗口变得越来越重要。然而,Transformer 架构的核心 —— 注意力层的时间复杂度和空间复杂度与输入序列长度的平方成正比。
机器学习算法工程师
0
RNN再次卷土重来:斯坦福新改进超越Transformer和Mamba!
点蓝色字关注“机器学习算法工程师”设为星标,干货直达!一觉醒来,超越Transformer和Mamba的新架构诞生了?斯坦福、UCSD、UC伯克利和Meta的研究人员提出了一种全新架构,用机器学习模型取代RNN的隐藏状态。论文地址:https://arxiv.org/abs/2407.04620这个
机器学习算法工程师
1
OpenAI凉了?超过GPT-4o的Claude 3.5 Sonnet发布了!
点蓝色字关注“机器学习算法工程师”设为星标,干货直达!OpenAI最大的对手公司AnthropicAI发布了最新模型Claude 3.5 Sonnet,它在各方面评测集上超过之前最大的模型Claude 3 Opus,但速度却提升了两倍,而且成本也只有后者的五分之一。特别地,Claude 3.5 So
机器学习算法工程师
0
欢迎 Stable Diffusion 3 加入 🧨 Diffusers
作为 Stability AI 的 Stable Diffusion 家族最新的模型,Stable Diffusion 3(SD3) 现已登陆 Hugging Face Hub,并且可用在 🧨 Diffusers 中使用了。Stable Diffusion 3https://stability.ai
机器学习算法工程师
0
【留言送书 5 本】AI绘画系统实战代码
AI绘画系统的构成包括前端和后端,我们这里前端采用微信进行登录注册,因前端相对简单,我们这里只详细介绍后端代码。微信用户登录与注册1.前端 调用微信的 wx.login API 获取 code:wx.login({ su
机器学习算法工程师
0
OpenAI的Sora竟然造假:生成的AI大片只有1%的AI,剩下的99%是人工!
点蓝色字关注“机器学习算法工程师”设为星标,干货直达!啊?Sora火爆短片《气球人》,也“造假”了???背后艺术家团队的最新揭秘,可谓一石激起千层浪:原来,视频画面并非完全由AI生成,其中有大量视觉效果需要人类后期实现。be like:这下网友不干了,合着大家伙儿跟OpenAI玩真心,OpenAI背
机器学习算法工程师
1
纪不懂法,云浩止耕:要种地,先交钱
“我是建华镇党委副书记,我姓纪叫纪云浩,听懂了吗?等会车我们一定要扣走,地不属于你们的…”、“别找我,我不懂法“。。。“纪不懂法,云浩止耕”所说的就是最近非常火的内蒙古自治区通辽市开鲁县建华镇党委副书记、政法委员:纪云浩,而他还是一位90后,07年入伍,09年转业。。。春耕,农民的希望与挑战。又到一
机器学习算法工程师
0
Llama 3恐怖如斯,400B+版本即将到来!还有文生图Imagine Flash三步成图!
点蓝色字关注“机器学习算法工程师”设为星标,干货直达!简单总结一下:Llama 3包含8B和70B两个版本(包含预训练模型和Instruction tuning模型),性能相比Llama 2有明显提升,其中最大的模型Llama 3 70B人工评测超过GPT-3.5,未来还会推出参数量更大(400B+
机器学习算法工程师
10
文末送书|AIGC+机器人新时代的智能革命
文末留言送书8本 从早期的ChatGPT到现在的Sora,人工智能模型已经从单模态跃迁到多模态,全球人工智能领域正经历一场前所未有的创新浪潮。这一技术革命不仅极大地拓宽了人工智能的应用场景,更提升了其理解和处理复...
机器学习算法工程师
0
扩散模型全新课程:扩散模型从0到1实现!
前言 于 11 月底正式开课的扩散模型课程正在火热进行中,在中国社区成员们的帮助下,我们组织了「抱抱脸中文本地化志愿者小组」并完成了扩散模型课程的中文翻译,感谢 @darcula1993、@XhrLeokk、@hoi2022、@SuSung-b...
机器学习算法工程师
0