曝OpenAI将允许员工出售股份套现;Meta证实:Ray-Ban眼镜拍摄的照片和视频会被用于训练AI模型丨AI情报局

雷锋网

共 12116字,需浏览 25分钟

 ·

2024-10-08 08:32

要闻提示


NEWS REMIND

  1. Meta 证实:Ray-Ban 眼镜拍摄的照片和视频会被用于训练 AI 模型
  2. 最新 AI 生图模型 Flux1.1 隐藏玩法,添加单反相机文件名获得超写实图像
  3. 国内云原生公司DaoCloud道客与英伟达合力打造算力解决方案
  4. 前谷歌CEO施密特:应全力投资AI基础设施,气候目标太过崇高难以实现
  5. 全球首次,国星宇航完成卫星在轨运行 AI 大模型技术验证

今日头条


HEADLINE NEWS

消息称OpenAI将允许员工出售股份套现

美国科技媒体The Information援引一份公司备忘录称,OpenAI的员工可能很快就有机会出售他们在该公司的部分股份。

在OpenAI完成66亿美元的融资后,公司将允许员工套现。据报道,OpenAI首席财务官萨拉·弗莱尔(Sarah Friar)在备忘录中表示,该公司“有能力提供招标活动,为符合条件的员工提供流动性选择”。弗莱尔补充说,公司仍在解决细节问题,稍后将与员工分享信息。(新浪财经)

国内资讯


DOMESTIC NEWS

全球首次,国星宇航完成卫星在轨运行 AI 大模型技术验证

10 月 6 日,国星宇航宣布完成卫星在轨运行 AI 大模型技术验证,对国星宇航 AI 大模型在轨运行的空间适应性、算力卫星平台可靠性以及高性能算力载荷在轨有效算力进行了验证。

国星宇航官方称,全球首次卫星在轨运行 AI 大模型技术验证的成功标志着国星宇航推动“太空 AI”的发展迈出了坚实一步,将为后续建设实现自主可控的“ star-compute ”(“星算计划”) 组网,为“天数天算”和下一步的“地数天算”做好技术积累,让人类在太空走得更远。(IT之家)

国内云原生公司DaoCloud道客与英伟达合力打造算力解决方案

国内云原生操作系统公司 DaoCloud 道客近期宣布,与全球 AI 芯片巨头英伟达达成合作,双方将基于 NVIDIA GPU 和云原生技术为打造算力一体化解决方案。合作主要包括两方面:首先是商业合作层面,道客能够使用 NVIDIA GPU 和其自有调度软件搭建智算中心;其次,技术上,在大规模算力集群的创建和测试中,DaoCloud 道客的自主开源项目 KWOK 被 NVIDIA 采纳使用,并且 NVIDIA 也参与到大规模集群模拟测试 KWOK 项目当中。

DaoCloud 道客 CEO 齐彦表示,国内现在很难从英伟达那得到高端设备,也很难与英伟达建立起围绕大规模人工智能基础设施建设的经验。如果英伟达不与中国公司开展软件技术的合作交流,即便有英伟达的设备,也无法利用好 AI 基础设施,进而赋能 AI 产业发展。(爱集微)

中国科大、科大讯飞团队开发ChemEval:化学大模型多层次多维度能力评估的新基准

中国科学技术大学等研究团队开发了一个名为 ChemEval 的新评估框架,用于多层次、多维度地测试和评估大型语言模型在化学领域的能力。这个框架包含四个不同级别的评估,覆盖了从基础化学知识到高级化学概念,如分子结构理解和化学反应预测等多个方面。

ChemEval 旨在提供一个更全面的视角来衡量这些模型在化学研究中的实用性和准确性,同时为未来的模型优化提供指导。研究团队通过开源数据和化学专家的协助构建了评估任务和数据集,以确保评估的有效性。实验结果显示,虽然通用的大型语言模型在文献理解和遵循指令方面表现良好,但在需要深层化学知识的任务上则不如专门针对化学领域训练的模型。(新智讯)

英矽智能:首款AI药物得到概念验证

英矽智能宣布其 AI 药物 ISM001-055 在临床 IIa 期试验中取得了积极结果,显示出良好的安全性和超出预期的疗效,这在 AI 制药领域尚属首次。该药物用于治疗特发性肺纤维化,一种目前无法治愈的严重肺部疾病。在临床试验中,患者服用药物后肺功能有所改善,这可能意味着该药物具有改变疾病进程的潜力。这一成果对 AI 制药行业来说具有重要意义,因为尽管 AI 制药在提高药物研发效率和降低成本方面具有潜力,但目前还没有 AI 研发的药物成功上市。英矽智能的成功案例可能会改变市场对 AI 制药的预期。(新智讯)

云天励飞七年半亏损近27亿元,实控人身家一年半蒸发超88亿元

上市一年半,AI 大模型及芯片企业云天励飞仍未走出亏损泥潭。自 2023 年上市到 2024 年上半年,云天励飞的业绩亏损尚有扩大的趋势。从近几年公司经营及业绩表现来看,未来云天励飞想要扭亏为盈,并不容易。此外,由于数字城市运营管理竞争激烈,云天励飞盈利能力出现大幅下滑。在业绩持续亏损等众多不利因素影响下,云天励飞股价较高点已经跌超 83%,较公司发行价也跌超 50%。(新浪财经)

万兴科技旗下Wondershare Filmora 14发布,推出智能长剪短及十余项AI功能

AIGC 软件 A 股上市公司万兴科技(300624.SZ)旗下视频创意软件 Wondershare Filmora 桌面端,面向全球市场发布其 V14 版本。该版本进一步整合系列 AI 能力,推出智能长剪短功能,支持一键将原始视频素材全自动高光片段提取剪辑成多个精华短视频,满足高效短视频创作及分发需求,并一次性新增上线超十项 AI 功能,如智能切片、 AI 翻译唇形驱动、智能马赛克、发丝级抠像、AI 文生音效等创作增效功能,以及 AI 超清、AI 人声美化、精准仿色、AI 视频降噪等视频提质功能。同时,Wondershare Filmora 14 还上线多机位剪辑、平面追踪、关键帧路径曲线、主轨磁吸剪辑模式等高阶功能,全面满足专业视频剪辑需求。(证券时报)

奇瑞汽车王琅:AI是时代的新动力,也是汽车产品实现唯一性和差异性的重要工具

奇瑞汽车股份有限公司副总经理王琅出席并演讲。王琅指出, AI 是时代的新动力,也是汽车产品实现唯一性和差异性的重要工具。王琅表示,从技术角度来说,今天的汽车产业已经进入了全面电动化、智能化的时代。汽车本身从纯机械工程的复杂度来看,系数已经大幅度降低,但是芯片、软件等复杂系数和要求大幅度提高,智舱智驾、整车的电子架构、智能架构让汽车越来越像一个可以自我进化的智能体,需要 AI 大模型的全面融入,通过 AI 赋能可以实现千车千面,实现智能化。(新浪财经)

中国电信人工智能研究院:纯国产万卡集群炼出万亿参数大模型

近日,首个由万卡集群训练出来的万亿参数大模型由中国电信人工智能研究院解锁。据了解,训练使用的万卡集群由天翼云上海临港国产万卡算力池提供,并基于天翼云自研“息壤一体化智算服务平台”和电信人工智能公司自研“星海 AI 平台”的支持,可以实现万亿参数的常稳训练,平均每周仅有 1.5 次训练中断,集群训练稳定性达到国际领先水平。

而且基于此,TeleAI 还开源了由国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。TeleChat 是央企里首个开源的系列语义大模型,而 TeleChat2-115B 则在 TeleChat 的基础上,通过对训练数据量、数据质量和配比、模型架构等多维度的优化,取得了更进一步的效果提升。(量子位)

快手可灵 AI 新增“对口型”功能:生成人物口型与上传音频同步

近日,快手旗下可灵 AI 官方宣布,新增对口型功能,并面向所有用户开放 API 服务。在可灵 AI 生成人物视频后,上传音频,即可让视频人物口型和音频同步。可灵 1.0 及 1.5 模型生成的视频,只要满足视频画面的人脸条件,均支持对口型(目前仅支持人物类角色(真实 / 3D / 2D)进行对口型,动物类角色对口型暂不支持)。

可灵 AI 正式面向所有用户开放 API 服务,支持在平台自助购买 API 资源包。官方表示,API 的效果与平台效果完全一致,1.5 模型和运动笔刷目前暂不支持 API,会尽快迭代上线。(IT之家)

5秒内快速生成、直出工业级PBR资产,三维扩散模型3DTopia-XL开源

上海人工智能实验室等联合发布了一款名为 3DTopia-XL 的三维扩散模型,该模型能够快速从图片或文字描述生成具有物理渲染材质的高质量三维数字资产。3DTopia-XL 采用了一种新的三维表征技术 PrimX 和基于 DiT 的生成架构,能够在 5 秒内生成超写实的三维模型。这项技术关键创新在于 PrimX ,它将三维物体表示为一系列符号距离场的集合,每个集合仅对局部的几何、纹理和材质进行建模,从而高效地表示三维数据。3DTopia-XL 的参数规模达到 10 亿,但比之前的模型更小,运行时只需要 6GB 的显存。模型的生成结果可以无缝导入主流游戏引擎和工业设计软件,如 Blender 和 UE ,用于渲染和进一步的处理。(新智讯)

国际资讯


FOREIGN NEWS

前谷歌CEO施密特:应全力投资AI基础设施,气候目标太过崇高难以实现

据外电报道,谷歌前首席执行官埃里克施密特表示,现在是全力投资人工智能基础设施的时候了,因为气候目标无论如何都太过崇高而难以实现。拜登政府设定了一个目标,即到 2035 年电力行业实现碳中和,到 2050 年美国经济实现净零排放。但人工智能对能源的巨大需求促使一些人工智能高管转向化石燃料,这可能会威胁到这些净零目标。施密特在华盛顿特区举行的人工智能峰会上发表了上述言论,他在会上向与会者发表了讲话,并表达了他对人工智能未来的看法。施密特在活动上表示,有办法抑制人工智能对环境的负面影响,比如使用更好的电池和电力线来建设数据中心,但他认为人工智能的增长最终将超过这些预防措施。(鞭牛士)

Meta 证实:Ray-Ban 眼镜拍摄的照片和视频会被用于训练 AI 模型

据外媒报道,Meta 公司证实,用户用 Ray-Ban Meta 智能眼镜拍摄的照片和视频可能会被用于训练其 AI 模型。Meta 政策传播经理 Emil Vazquez 在一封电子邮件中表示:“在多模态 AI 可用的地区(目前为美国和加拿大),与 Meta AI 共享的图像和视频可能会被用于改进我们的 AI 模型,这符合我们的隐私政策。”此前,Meta 一位发言人澄清称,只要用户不将照片和视频提交给 AI,这些数据就不会被用于训练 Meta 的 AI 模型。然而,一旦用户要求 Meta AI 分析这些照片,它们就会受到不同的政策约束。换句话说,唯一避免这种情况的方法是不使用 Meta 的多模态 AI 功能。

这一做法引发了人们的担忧,因为 Ray-Ban Meta 用户可能并不了解他们正在向 Meta 提供大量图像用于训练其 AI 模型,这些图像可能包含他们的家庭内部、亲人或个人文件等信息。(IT之家)

最新 AI 生图模型 Flux1.1 隐藏玩法,添加单反相机文件名获得超写实图像

最新 AI 文生图模型 Flux1.1 一夜刷屏。只需一个简单技巧:在提示词中模仿单反相机的文件命名格式,就能去除图中的“ AI 味”,无论人物还是风景都能达到照片级效果。

比如“ CR2 ”就是佳能相机使用的原始图像文件格式,输入“ IMG ”+ 随机编号 +“ .CR2 ”,再加指定的内容,就能获得一张写实图像了。随着 FLUX1.1 的正式发布,此前在文生图模型排行榜上屡占榜首的两个无人认领的“蓝莓”模型的神秘面纱也被揭下,正是它。在 Artificial Analysis image arena 上,FLUX1.1 [pro] 以“ blueberry ”为代号,超越所有其它模型,获得最高的整体 Elo 评分。(量子位)

聊天机器人帮你“深入了解”约会对象,Grindr 将推出“AI 僚机”功能

据外媒 10 月 6 日报道,约会平台 Grindr 宣布推出专为用户设计的 AI 助手,预计在 2027 年前后完全上线,届时可为 1400 万名用户提供服务。

该 AI 助手可用于跟踪用户与心仪对象的对话,并为其提供适合的长期伴侣、为约会地点提供建议。具体来看,当两名用户匹配之后,用户各自的 AI 助手可以互相交流,以便在实际约会前对彼此有更深入的了解。Grindr 的首席执行官乔治・阿利森表示,机器人之间的对话不仅可以节省时间,还可以尽早发现约会中的潜在问题。这“我一直认为 AI 会成为一件大事,随着生成 AI 的发展,我意识到许多扩展功能可以由 AI 来实现。”(IT之家)

AI 赋能游戏开发:Valve 工程师借助 ChatGPT 改进《Deadlock》匹配算法

Valve 工程师 Fletcher Dunn 在社交媒体上分享了他使用 ChatGPT 改进《Deadlock》匹配算法的经历。他表示,ChatGPT 就像一个高级搜索引擎,能够帮助他找到所需的解决方案。Dunn 在《Deadlock》的测试阶段向 ChatGPT 提出了改进匹配算法的需求,ChatGPT 建议他使用匈牙利算法。

Dunn 认为,ChatGPT 的强大之处在于能够理解自然语言并提供相关信息。即使在专业领域如游戏开发,ChatGPT 也能迅速理解用户的问题并给出准确的答案。即使有时候会出现错误或幻觉,但通过验证和修正,可以很快解决问题。Dunn 表示,虽然可以通过传统的搜索引擎找到这种算法,但需要花费更多的时间和精力来寻找合适的搜索关键词。他表示,ChatGPT 能够直接理解他的问题并提供答案,这才是其真正的价值所在。(IT之家)

英伟达推出ACE虚幻引擎5插件,打造逼真数字人

10 月 7 日,英伟达 ACE(Avatar Cloud Engine)是一套可帮助开发者利用生成式 AI 创建栩栩如生的虚拟数字人物的技术。在 ACE 的加持下,普通的非玩家角色(NPC)可以摇身一变,成为能够发起对话或引导玩家找到新任务的动态交互式角色。在 2024 年西雅图虚幻节上,英伟达发布了适用于 Nvidia ACE 的新虚幻引擎 5 设备端插件,可以让开发者更轻松地在 Windows PC 上构建和部署 AI 驱动的 MetaHuman 角色。

值得一提的是,ACE 技术不仅能生成逼真的面部动画,还具备强大的上下文理解能力。借助检索增强生成(RAG)技术,数字人能够根据对话历史和上下文做出更自然、更符合逻辑的反应。此次与虚幻引擎 5 的集成,使得开发者能够更加便捷地将 ACE 技术应用于游戏开发中。英伟达还提供了示例项目,为开发者提供了一个清晰的指引,帮助他们快速上手。(IT之家)

谷歌为安卓用户推出盗窃检测锁定功能:AI识别手机被盗

据媒体 10 月 6 日报道,博主 Mishaal Rahman 在社交媒体上透露,谷歌正向美国的安卓用户推出一系列新功能,其中包括盗窃检测锁、离线设备锁定和远程锁定等。其中,盗窃检测锁定功能利用AI和设备传感器来检测与盗窃相关的常见动作。该模型能够识别出手机被抢走后的一些常见逃跑方式,例如奔跑、骑自行车或开车等,一旦检测到这种情况,手机会自动锁定,以防止小偷访问手机上的应用和数据。离线设备锁定则针对小偷可能采取的断网策略,如果手机长时间失去网络连接,系统将自动启动屏幕锁定,增加盗窃者的破解难度。而远程锁定功能则通过电话号码远程锁定手机屏幕,这一功能目前在多个手机品牌中已有所应用。(快科技)

微软新专利探索 Copilot AI 应用,匹配视频等生成音乐

近期,微软公司获得了一项新的专利,构想 Copilot 在未来能辅助用户创建和视频、文本、PowerPoint 等匹配的音乐或者背景音乐。微软该专利名为《Artificial intelligence model for composing audio scores》,主要探讨了基于输入内容,来创建音乐的方法。

Copilot 将通过这些特性进行训练,并利用关联系统,生成与新视频的视觉和文本特征相匹配的适当音频评分。在现实生活中,这项技术可以用于各种应用,例如:电影和视频制作、广告、游戏、虚拟现实、其它场景等。(IT之家)

苹果10月28日发布iOS 18.1,将搭载苹果智能;且有消息称其放弃开发智能戒指

据马克·古尔曼 (Mark Gurman)称,苹果打算在 10 月 28 日发布 iOS 18.1,其中包含第一组备受期待的 Apple Intelligence 功能。古尔曼在最新一期的 Power On 新闻通讯中表示,本月的发布日期比最初预期的要晚,因为据报道苹果需要额外的时间来确保顺利推出,并为增加的流量做好 AI 云服务器的准备。初始功能包括用于重写、总结和校对文本的增强型写作工具,以及新的 Siri 用户界面。用户还可以期待各种应用程序的通知摘要,包括信息和邮件,以及照片应用程序中的新“清理”工具,该工具可以使用生成式 AI 从图像中删除不需要的元素。

同时,古尔曼称,苹果公司已经放弃了开发智能戒指的计划。这一决定是在对概念进行多年内部探索之后做出的,但最终苹果选择不进行落地。(鞭牛士、创业邦)

字节跳动新抓取机器人比OpenAI机器人快25倍,面临美国监管审查

据外电报道,TikTok 的母公司字节跳动正在加大训练生成式 AI 模型的力度,推出了一款新的网页抓取工具。据报道,这款名为 Bytespider 的机器人于 4 月推出,现已成为最活跃的网页抓取工具之一。

机器人管理公司 Kasada 和机器人监控公司 Dark Visitors 的研究显示,字节跳动的 Bytespider 抓取网络数据的速度比 OpenAI 用于 ChatGPT 平台的网络抓取工具 GPTbot 快 25 倍。它的抓取速度也比 Anthropic 用于其 Claude 平台的抓取工具 ClaudeBot 快 3,000 倍。字节跳动积极抓取数据之际,该公司正受到严格审查,尤其是在美国。美国总统乔·拜登已签署立法,要求字节跳动出售 TikTok 或将其关闭,理由是出于国家安全考虑。(鞭牛士)

谷歌人工智能搜索摘要正式推出广告

据外电报道,谷歌正在 AI Overview 中推出广告,这意味着用户现在将开始在某些搜索引擎的 AI 生成的摘要中看到产品。这些产品将出现在“赞助”标题下,谷歌发言人 Craig Ewer 表示只有当问题具有商业角度时,它们才会出现。目前,广告仅在美国移动端的 AI Overviews 中出现。微软也在其 Copilot 聊天机器人中加入了广告,并最近改变了广告在响应中的显示方式。

谷歌还对 AI 概述的格式进行了一些调整。谷歌现在将在摘要的右侧更突出地显示引用的网页,因为它发现这与以前的设计相比,增加了支持网站的流量。它还推出了由人工智能组织的搜索页面——该功能会显示包含相关信息的自定义结果页面,而不仅仅是显示链接列表。(鞭牛士)

Claude AI 被曝正研发新功能,突破 20 万 tokens 文件处理上限

外媒于 10 月 5 日发布博文称 Anthropic 公司扩展了 Claude 功能,支持用户处理上下文窗口超过 20 万 tokens 的文件。Claude 当前在处理用户上传、超出限制的文件后,会跳出以下错误,显示当前文件的字符数量超过了 Claude 能处理的上限。不过 Anthropic 正在研发新的功能,通过分块提取内容与其进行交互,从而支持用户上传超过处理上限的文件。

这项改进意味着 Claude 扩展了处理文件的能力,可以和 Gemini 1.5 Pro(200 万 tokens)抗衡。如果 Claude 能够高效地查询这些参考文件,可能会大大增强其在编码和其他需要处理大量数据的应用中的实用性。(IT之家)
今日热门视频


//

近期热门文章

3D 视觉派:斯坦福具身智能人物关系图


7年的AI芯片销售,决定去开网约车


具身智能构型之争:人形、灵巧手、双足,谁是最终 C 位?

浏览 173
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报