字节的豆包怎么样?

唐韧

共 2094字,需浏览 5分钟

 · 2023-08-23

字节上线了自然语言对话大模型产品,取名「豆包」。


按照字节的一贯风格,不知道这个名字是不是靠数据洞察出来的,但我总觉得有点怪怪的,可能是还不太习惯的原因。


目前产品已经可以开放注册了,你可以进入豆包官网使用抖音账号直接登录。


进入产品后,默认会给你提供四个对话窗口,第一个是豆包本包,后面依次是英语学习助手、聊天小宁、以及写作助手。



区分出来的这四个场景应该是有做一些提前参数预设,满足不同情况下的用户需求。


我分别测试了一下豆包在不同场景下的回答表现,一个总体感觉就是预期之中,但没有什么惊喜。


如果和 GPT-4 相比的话,还是有不小差距。


其实不只是豆包,目前国内各大厂商推出的对话式大模型产品和 OpenAI 的水平相比也依旧有差距。


我同时对比了豆包、文心一言以及 ChatGPT 在同一类问题上的表现,对于一些常规简单问题来说,大家的差距其实不是很大,回答的都是标准答案。



如果涉及一些数学计算或者逻辑性问题的话,明显感觉基于 GPT-3.5 以及 GPT-4 的 ChatGPT 更准确。


不过关于一些事实性错误的回答,其实各家目前也都存在,只不过程度不一样。


我觉得对于这类产品来说,更重要的还是和实际场景结合所产生的效率提升和价值创造,只不过现在绝大多数人还处于体验尝鲜阶段。


作为搜索引擎的潜在替代者,自然语言对话大模型显然还不具备完善的属性,至少在即时性上依旧有短板。


我问了豆包两个关于即时性的问题,它都没能给出回答。



其实类似的需求如今已经可以通过搜索引擎满足了,如果 AI 语言模型产品能满足,且能给出更具体的参考信息和行动指南,那效率就比搜索引擎高出不少,毕竟后者还需要用户去筛选。


不过把它们当做知识总结、建议咨询、效率创作工具的话,如今确实已经能升任生产生活工具。


如果你把这类产品当做一个学习工具,其实也是一个很好的应用场景,因为知识都是既有信息。


比如,我问了豆包一个关于产品需求优先级的问题,它的回答其实就比较全面。



说实话,现在的状态有点像一二十年前的互联网,当时大家都想做搜索引擎,然后又都想做电商,接下来又都想做社交网络。


结果也很明显,基本都是一家独大,其余玩家要么放弃要么优势互补。


不知道如今关于大模型的竞争结果会是一个怎样的状态,但现在的确有点百家争鸣的意思。


说不上谁更好,因为基础体验大差不差,没有惊喜,也没有失望。


当然,我觉得这类产品优先发挥价值的地方并非 C 端领域,而是对生产效率要求更高的企业服务和职能工种,比如文案创作、翻译、审核等岗位。


那问题来了,这些人会失业么?


显然,当效率提升后,原本的人员需求量一定会减少,10 个人干的活儿现在可以由 1 个人干,这是效率提升带来的。


但是,工具也需要人使用,掌握新生产力工具的人会成为优势占有者。


所以,一定会有人失业,但也一定会有人重新获得职业竞争力。


对于产品经理来说,这也会是一个提升工作效率的工具,但对于思考性和决策性的工作,技术依旧无法在短期内取代人。


但总有一天,我们也会迎来挑战和危机。


技术进步,不会给任何人留下面子。


推荐阅读:《小红书被大厂围攻了?
················· 唐韧出品 ·················

▲ 点击上方卡片进入发消息回复“w”,可加我个人微信
关注唐韧,用产品思维洞察现象背后的逻辑

安可时刻

如果你们还没体验豆包的可以直接进他们官网 doubao.com,感兴趣的可以同时打开其他家的同类产品,然后用同一个问题去测试。


今天七夕,或许你可以考验它几个人生终极问题。

浏览 4891
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报