有点慌了!ChatGPT 可能影响 80% 工作岗位!

FightingCoder

共 3966字,需浏览 8分钟

 ·

2023-03-29 00:16


这是「进击的Coder」的第 818  篇技术分享 作者:机器之心编辑部 来源:机器之心报道

阅读本文大概需要 9 分钟。


ChatGPT 的影响涵盖所有收入阶层,且高收入工作可能面临更大的风险。


ChatGPT 来了,失业还会远吗?前不久在 GPT-4 发布时,ChatGPT 第一时间上线了新版本,OpenAI 首席执行官 Sam Altman 表示他对自家这种技术「有点害怕」。


和很多专家一样,Altman 担心人工智能技术的强大能力会制造过多虚假信息,另一方面,新技术也将改变经济、劳动力和教育环境。

ae805ebc76ee6235443523ce9c4766e9.webp

有人开玩笑说 Sam Altman 每天背着的同一个包,里面有紧急关停 AI 的红色按钮。
此前,AI 作画已经让很多画师开始担忧自己的工作会被取代。昨天,OpenAI 研究人员提交的一篇报告引发了人们更加热烈的讨论,研究人员估计 ChatGPT 和使用该程序构建的未来应用可能影响美国大约 19% 的工作岗位,和他们至少 50% 的工作任务。
与此同时,80% 的美国劳动力至少有 10% 的工作任务在某种程度上将受到 ChatGPT 的影响。
该研究分析表明,像 GPT-4 这样的 LLM(大型语言模型)的影响可能是无处不在的。此外,工资较高的工作 —— 可能需要执行许多基于软件的任务 —— 会面临更多来自人工智能聊天机器人的潜在影响。
在职业影响方面,受影响最大的职业包括翻译工作者、作家、记者、数学家、财务工作者、区块链工程师等。

e8de86b8349fb894d4d53c303698a22b.webp



该研究还按行业细分了 ChatGPT 的影响。数据处理托管、出版业等行业最有可能受到影响。相比之下,体力劳动较多的行业 —— 食品、林业、社会援助等受到的潜在影响最小。

b9394a9c07fd68838a92d07c56ded596.webp



OpenAI 研究了美国超过 1000 个职业,并给他们贴上了执行这些工作所需的各种任务的标签。然后,研究人员使用人工注释器和 GPT-4 模型来评估访问由 ChatGPT 驱动的系统是否会将人类执行特定任务所需的时间减少至少 50%。
让我们看看这项研究具体在干什么:

be0a7bf54396c6e447ee1a670058c7cd.webp


论文地址:https://arxiv.org/pdf/2303.10130v1.pdf
研究介绍
我们先看总结,OpenAI 本次调查了 GPT 模型和相关技术对美国劳动力市场的潜在影响。他们根据人员职业与 GPT 能力的对应程度来进行评估,研究结果表明,大约 80% 的美国劳动力至少有 10% 的工作任务会受到 GPT 的引入影响,而大约 19% 的员工可能会看到至少 50% 的工作任务受到影响。这种影响涵盖所有工资水平,高收入工作可能面临更大的风险。值得注意的是,这种影响不仅限于近期生产率增长较高的行业。
通过分析他们发现,像 GPT-4 这样的大型语言模型带来的影响可能是普遍的。随着时间的推移,LLM 的能力不断提高,即使现在研究人员停止对新模型能力的开发,但它们带来日益增长的经济效应也会持续增长。该研究还发现,如果考虑到互补技术的发展,LLM 的潜在影响将显著扩大。这也恰恰说明了 GPT 正变得越来越通用。
为了分析,该研究还提出了一个新的标准来理解 LLM 的能力及其对工作潜在影响,该标准用来衡量关于 GPT 任务的总暴露数。
看完结论,接下来就该介绍数据集了。该研究使用 O*NET 27.2 数据集 (O*NET, 2023),该数据集包含 1016 个职业信息,表 1 提供了数据集示例,包含任务 ID、职位等。

8e126ce43dfa1e2822b3251e892625e6.webp


此外,数据集还包括他们从美国劳工统计局获得的 2020 年 - 2021 年员工就业和工资数据。该数据集包括职业头衔、每种职业的工人数量等。
在方法上,该研究根据 exposure rubric 来展示结果,Exposure rubric 定义为访问 GPT 或 GPT 驱动的系统是否会将人类执行特定 DWA 或完成任务所需的时间减少至少 50%。(注:DWA 全称 Detailed Work Activities ,可以将其理解为完成任务所需要的动作,例如表 1,对于计算机系统工程师,其 DWA 包括监控电脑系统性能,确保正常运作。)

bf6645c436630b64950fdf3d2d43c5ba.webp


该研究对每个 O*NET 数据集的 DWA 和所有 O*NET 任务的子集获得人工注释,然后在任务和职业级别上汇总这些 DWA 和任务得分。为了确保这些注释的质量,该研究亲自标记了大量任务和 DWA 样本,并招募了经验丰富的人工注释者,他们在 OpenAI 的对齐工作中广泛审查了 GPT 输出。
下表为模型与人的一致性比较与皮尔逊相关系数。一致性分数是通过观察两组人在注释上达成一致的频率来确定的 (例如 E0, E1 或 E2)。在本文中,该研究使用 GPT-4, Rubric 1。

e5ff28def5bc5a76e88516704dcb9027.webp


该研究为感兴趣的因变量构建了三个主要度量:(i) 𝛼,对应于上面 exposure rubric 中的 E1, (ii) 𝛽,是 E1 和 0.5*E2 的总和,以及 (iii) 𝜁,E1 和 E2 的总和。该研究在表 2 中总结了注释组和度量之间的一致性。
研究结果
OpenAI 的这项研究以 GPT 语言模型对经济具有普遍影响作为假设,我们来看一下具体的研究结果。
下表 3 是人类和 GPT-4 模型的总体 exposure 数据。其中,人类和 GPT-4 的数据表明平均 occupation-level 𝛼 值介于 0.14 和 0.15 之间,这表明对于中等职业,大约 15% 的任务直接受到 GPT 影响。对于 𝛽,这个数字增加到 30% 以上,对于 𝜁,这个数字则超过 50%。

b1e463075f7f7529c41c2b9eddbacd3c.webp


根据 𝛽 值,该研究估计 80% 的人属于至少一项工作任务受 GPT 影响的职业,而 19% 的人所处的职业有超过一半的工作任务被标记为受到 GPT 影响。
工资和就业
下图 3 描绘了 GPT 模型对经济的整体影响。

c99595d2f3628d40db36884b4066f77d.webp


下图 4 描绘了工作薪资与对 GPT 等语言模型接触使用情况的关系。

d6d176a684313df373cf1bead81d52d7.webp


然后,该研究又从不同的职业分类探究了 GPT 模型的影响,包括 ONET 数据库中的 5 个 Job Zone。其中,Job Zone 1 中的工作入职要求最低,Job Zone 5 则最高。

4a9bf6115443731cb1633018e885d425.webp


88cd611ce54f7e5e4cd7b07552716172.webp


总体来说,OpenAI 这项研究发现,工作对科学方法和批判性思维的依赖程度与 LLM 接触使用情况呈负相关,而编程和写作技能与 LLM 接触使用呈正相关。
不过,该研究也承认:试图通过使用简单的标签来描述工作任务并代表每个职业,这种方法本身存在固有的偏见,并且可能忽略了一些特有的技能或任务。
当然,还有一个非常重要的问题是 GPT 模型目前仍存在很多缺陷,包括编造虚假信息,这使得人工监督工作成为必要。
大模型的广泛应用,或许意味着许多人将失去工作,但 OpenAI 首席执行官 Sam Altman 认为这也将是个找到更好工作的机会:「我们可以拥有更高的生活质量。同时,人们需要时间来更新、做出反应、习惯这项新技术。」
参考内容: https://www.cnbc.com/2023/03/20/openai-ceo-sam-altman-says-hes-a-little-bit-scared-of-ai.html https://www.pcmag.com/news/openai-chatgpt-could-disrupt-19-of-us-jobs-is-yours-on-the-list c8052122c2aa0c54cd9fae2e7beba74e.webp

End

崔庆才的新书《Python3网络爬虫开发实战(第二版)》已经正式上市了!书中详细介绍了零基础用 Python 开发爬虫的各方面知识,同时相比第一版新增了 JavaScript 逆向、Android 逆向、异步爬虫、深度学习、Kubernetes 相关内容,‍同时本书已经获得 Python 之父 Guido 的推荐,目前本书正在七折促销中!

内容介绍:《Python3网络爬虫开发实战(第二版)》内容介绍


4f6cf554e39999926cbe15ed205595e0.webp


扫码购买




好文和朋友一起看~
浏览 41
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报