多模态可控扩散模型综述
来源:专知本文约1500字,建议阅读5分钟本综述提供了一个全面的分类框架,总结了扩散模型图像合成中各种形式的控制技术和策略,并探讨了可控生成在不同应用场景中的实践。研究背景 近年来,人工智能领域经历了跨越式发展,其中生成模型在计算机视觉、自然语言处理和强化学习等多个领域取得了长足进步。生成
数据派THU
0
独家 | 线性代数:每个数据科学家的必知概念(下)
作者:Benedict Neo翻译:陈之炎校对:ZRX本文约2900字,建议阅读8分钟本文将探讨上述线性代数概念、视觉解释和代码示例。本文(上篇)目录向量单位向量向量操作向量相加标量相乘点积向量空间零空间(核)张成空间基线性独立本文(下篇)目录矩阵矩阵作为函数线性变换逆矩阵奇异矩阵单位矩阵对角矩阵&
数据派THU
0
快讯 | 2024中国高校计算机大赛——大数据挑战赛晋级复赛队伍揭晓
7月25日,经过初赛阶段的激烈角逐,2024中国高校计算机大赛——大数据挑战赛进入复赛的参赛队伍名单已经出炉。本次大赛旨在通过算法比拼激发数据处理与分析的新思路,探索气象大数据的奥秘,促进大数据技术的创新与应用。大赛吸引了来自全国各地的高校学生和企业在职人员的积极参与,共有386所高校的1777支队
数据派THU
0
彻底改变语言模型:全新架构TTT超越Transformer,ML模型代替RNN隐藏状态
来源:机器之心本文约3200字,建议阅读5分钟本文介绍了一种全新的大语言模型(LLM)架构有望代替至今在 AI 领域如日中天的 Transformer。从 125M 到 1.3B 的大模型,性能都有提升。难以置信,这件事终于发生了。一种全新的大语言模型(LLM)架构有望代替至今在 AI 领域如日
数据派THU
0
谷歌重磅:告别RAG,长上下文的大语言模型无需检索增强
来源:夕小瑶科技说 机器学习算法与自然语言处理本文约2600字,建议阅读10分钟长上下文语言模型通过LOFT基准测试,展现出无需检索增强(RAG)的强大能力。当今人工智能领域正在经历一场静默的革命。随着大语言模型(LLM)的快速发展,它们不仅能够处理更长的上下文,还展现出惊人的推理和检索能
数据派THU
0
独家 | 线性代数:每个数据科学家的必知概念(上)
作者:Benedict Neo翻译:陈之炎校对:ZRX本文约2500字,建议阅读8分钟本文将探讨上述线性代数概念、视觉解释和代码示例。你对线性代数有足够的了解吗?线性代数是所有数据科学和机器学习任务的基石, 它是将理论模型转化为实际解决方案的语言, 它体现了能够利用算法从数据中学
数据派THU
2
【阿姆斯特丹博士论文】深度学习在医疗数据中的应用
来源:专知本文为论文介绍,建议阅读5分钟这篇论文重新审视了深度学习的基本组成部分,并评估了它们在医学图像分析中的应用。这篇论文重新审视了深度学习的基本组成部分,并评估了它们在医学图像分析中的应用。论文指出了深度学习在这一领域的三个主要挑战:专家知识的整合、未标记数据的利用以及预测不确定性的估计。论文
数据派THU
0
年薪五十万起,大模型公司偏爱哪种毕业生 | AI光年
来源:深网ID:qqshenwang本文约4500字,建议阅读5分钟本文介绍了年薪50万大模型公司偏爱的毕业生。图片来源:视觉中国特约作者丨郑佳妮 编辑丨叶锦言出品丨深网·腾讯新闻小满工作室编者按:自从OpenAI打开了生成式AI的潘多拉魔盒,大模型依然是20
数据派THU
1
【SIGIR2024教程】基于大语言模型的信息检索代理
来源:专知本文为论文介绍,建议阅读5分钟在本教程中,我们将深入探讨LLM驱动代理在各种信息检索领域中的前沿技术。信息检索的核心目标已不仅仅是将用户与其搜索的相关信息连接起来,还包括丰富连接的多样性、个性化和互动性,确保信息检索过程在全球数字时代中尽可能无缝、有效和支持性。目前的信息检索系统通常面临一
数据派THU
0
效率高,无需标签,谷歌团队用AI挖掘临床数据,改善基因发现和疾病预测,登Nature子刊
来源:ScienceAI本文约2500字,建议阅读5分钟近日,Google Research 的基因组学团队在利用 HDCD 表征疾病和生物学特征方面取得了进展。现代医疗保健系统会产生大量高维临床数据 (HDCD),例如肺功能图、光体积变化描记图法 (PPG)、心电图 (ECG) 记录、CT 扫描和
数据派THU
0
【KDD2024】基础模型在AI加速器上的推理优化
来源:专知本文为论文介绍,建议阅读5分钟我们的教程提供了关于使用AI加速器进行推理优化的全面讨论。强大的基础模型,包括具有Transformer架构的大型语言模型(LLMs),在各个行业引领了生成式人工智能的新纪元。基础模型的出现催生了大量新应用,这些应用涵盖了问答系统、客户服务、图像和视频生成以及
数据派THU
0
ECCV 2024 | VideoMamba: 用于高效视频理解的状态空间模型
来源:PaperWeekly本文约2300字,建议阅读9分钟我们希望它可以为未来长视频的表征学习指明道路。一、介绍我们提出了一个仅基于状态空间模型 (SSM) 的高效视频理解架构 VideoMamba,并通过大量的实验证明了它具备一系列良好的特性,包括 1)Visual Domain Sc
数据派THU
0
大脑如何处理语言?普林斯顿团队对Transformer模型进行分析
来源:专知本文约1700字,建议阅读5分钟研究证明,由各个功能专门化的「注意力头」执行的紧急计算,会以不同的方式预测特定皮层区域的大脑活动。这些注意力头沿着与低维皮层空间中的不同层和上下文长度相对应的梯度下降。在处理语言时,大脑会部署专门的计算来从复杂的语言结构中构建含义。基于 Transforme
数据派THU
0
深度学习时间序列异常检测方法
本文约10000字,建议阅读15+分钟本文全面概述了深度学习用于时间序列异常检测的最新架构。本文全面概述了深度学习用于时间序列异常检测的最新架构,提供了基于策略和模型的方法,并讨论了各种技术的优点和局限性。此外,还举例说明了近年来深度学习在时间序列异常检测中各领域的应用。1 背景时间序列
数据派THU
0
清华类脑计算模型登Nature子刊,受大脑启发的人工树突网络,实现高能效AI
来源:专知本文约2800字,建议阅读5分钟在本论文中,我们旨在通过关注多模态智能的三个关键维度来推动该领域的发展:多模态对齐性、鲁棒性和泛化性。近期,清华大学类脑计算研究中心施路平团队,研发出全球首款类脑互补视觉芯片「天眸芯」,研究成果登上 Nature 封面。近日,该团队推出一种新的神经形态计算架
数据派THU
0
【KDD2024】大规模层次化工业需求时间序列预测中的稀疏性整合
来源:专知本文约1000字,建议阅读5分钟我们通过真实世界的需求预测数据集评估了我们方法的可扩展性和有效性。层次化时间序列预测(HTSF)在许多现实世界的商业应用中是一个重要问题,其目标是同时预测通过层次关系相互关联的多个时间序列。然而,近期的研究未能解决大型企业需求预测应用中通常出现的两个重要挑战
数据派THU
0
大神卡帕西强烈推荐:通过做项目来学习,坚持“1万小时定律”
来源:量子位本文约4300字,建议阅读9分钟本文介绍了大神Andrej Karpathy在伯克利黑客马拉松上的演讲再引热议。现场掌声雷动!大神Andrej Karpathy在伯克利黑客马拉
数据派THU
9
【KDD2024】大规模层次化工业需求时间序列预测中的稀疏性整合
来源:专知本文为论文介绍,建议阅读5分钟我们通过提出HAILS(层次化自适应稀疏时间序列模型)解决了这两个挑战。层次化时间序列预测(HTSF)在许多现实世界的商业应用中是一个重要问题,其目标是同时预测通过层次关系相互关联的多个时间序列。然而,近期的研究未能解决大型企业需求预测应用中通常出现的两个重要
数据派THU
0
AI从业者怎么做Science?清华大学AIR周浩:从文本生成到蛋白质设计的跨界探索
本文约3000字,建议阅读6分钟本文介绍了AI 人做蛋白质设计遇到的多重挑战,并从数据结构、生成算法、预训练 3 个方面讲述了目前蛋白质领域的前沿研究。清华大学智能产业研究院副研究员周浩在智源大会上,以计算机从业者的身份,向大家分享了 AI 人做蛋白质设计遇到的多重挑战,并从数据结构、生成算法、预训
数据派THU
0
数据派志愿者招募 | 寻找最志同道合的你!
When you learn, teach. When you get, give.— Maya Angelou 作为一个开放包容的团队,数据派本着分享与学习的目的欢迎各位志愿者的加入。我们是谁?数据派作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与
数据派THU
0
WWW 2024 | 华为、清华提出个性化多模态生成新方法,让AIGC更懂你
本文约3000字,建议阅读6分钟来自华为和清华的研究者率让多模态生成的内容个性化。Stable Diffusion、Midjourney 和 Sora 等文生图/视频模型获得惊人的效果,但他们对于不同的人生成的结果都一样,不具备个性化。下面这篇论文中,来自华为和清华的研究者率先让多模态生成的内容个性
数据派THU
0
CVPR 2024 | 迁移预训练生成模型中的知识到边缘小模型
本文约2900字,建议阅读6分钟本文介绍的是我们的一篇收录于 CVPR 2024 的论文。本文介绍的是我们的一篇收录于 CVPR 2024 的论文。为了解决某个机构或边缘设备上数据缺乏的问题,一方面我们通过联邦学习获得来自所有参与设备的任务相关的共享知识;另一方面我们将该共享知识作为预训练生成模型(
数据派THU
0
福利返场 | 一项人工智能法案,为何让硅谷陷入恐慌?
文中有数据派THU福利哦过去几个月里,硅谷的科技公司们持续发出警告,宣称一项即将通过的法案将摧毁美国在人工智能领域的领导地位。随着人工智能变得越来越复杂,政策制定者们正在采取行动,用来确保这项技术不会产生不可逆转的风险,加州 1047 号提案由此诞生。上个月,加州参议院正式通过了这项提案,该提案将被
数据派THU
0
1亿参数的细胞大模型来了!登Nature子刊,清华大学团队发布scFoundation:对2万基因同时建模
本文约4800字,建议阅读9分钟清华大学自动化系生命基础模型实验室和电子系/AIR 合作开展研究,构建了拥有 1 亿参数的 scFoundation 细胞大模型。近年来,大规模预训练模型正在引领新一轮人工智能浪潮。「大模型」通过从大规模、多来源的数据中提取深层次规律,进而能够作为「基础模型」服务不同
数据派THU
0
【剑桥大学博士论文】可识别的因果表示学习:无监督、多视图和多环境
来源:专知本文为论文介绍,建议阅读5分钟本论文将因果关系与表示学习的思想结合在一起。因果模型通过描述每个变量受其直接原因影响的机制,提供了对复杂系统的丰富描述。本论文将因果关系与表示学习的思想结合在一起。因果模型通过描述每个变量受其直接原因影响的机制,提供了对复杂系统的丰富描述。因果模型支持对系统部
数据派THU
0
HUSKY:一个优化大语言模型多步推理的新代理框架
来源:Deephub Imba本文约2000字,建议阅读5分钟本文介绍了优化大语言模型:HUSKY。推理被高度认可为生成人工智能的下一个前沿领域。通过推理,我们可以将任务分解为更小的子集并单独解决这些子集。例如以前的论文:思维链、思维树、思维骨架和反射,都是最近解决LLM推理能力的一些技术。此
数据派THU
0
快讯 | 首发!“天枢”系统在“华龙一号”机组开启试运行
近日,中国核电自主研发的首套全国产自主可控时序数据处理系统(“天枢”系统)在福清核电、漳州能源“华龙一号”机组开启试运行,解决了核电领域数字化转型路上的关键技术问题。时序数据是按照时间顺序排列的、随时间变化且相关联的数据序列,记录了核电机组的转速、功率、温度、压力等运行状态的核心参数。此前,中国核电
数据派THU
0
快讯|大数据挑战赛周周星评选获奖队伍公布,附赛事经验分享!
2024中国高校计算机大赛-大数据挑战赛初赛阶段周周星奖项评选环节开始啦,通过对参赛选手在线提交相关模型文件的系统自动评测得分(以7月3日18:00榜单排名为准),第一周周周星在校生队伍和在职队伍排名榜单已出炉,恭喜获奖的学生队伍!目前榜单前三名的队伍在参赛中有哪些实战的经验呢,让我们一起听听他们的
数据派THU
0