就在北京时间昨天凌晨,全球最强大模型的称号再次易主!
由前 OpenAI 成员组成、谷歌亚马逊相继投资的大模型厂商 Anthropic 发布了全新一代模型—— Claude 3.5 Sonnet 。
据介绍,Claude 3.5 Sonnet 是其到目前为止最智能的模型。并在多项测试中不仅超过了前代最强的 Claude 3 Opus,甚至还有 OpenAI 发布刚刚一个月的 GPT-40。而其整体规模大小却与上一代中档的 Claude 3 Sonnet 相当。
这次的发布足够突然,也足够震撼。现在大模型的竞争,已然足够「卷」了。
速度比 Claude 3 Opus 提升两倍
Anthropic 表示本次的 Claude 3.5 Sonnet 升级,为包括 GPQA(研究生水平推理)、MMLU(本科生水平知识)与 HumanEval 等基准测试设立了全新的行业标准。
在理解细微差别、幽默和复杂指令等方面,Claude 3.5 Sonnet 都表现出了显著的进步,并且擅长以自然、亲切的语气撰写高质量的内容。
速度方面,Claude 3.5 Sonnet 的运行速度是 Claude 3 Opus 的两倍。Anthropic 也顺道推销说,这种性能的提升与实惠的价格综合在一起,使其成为目前处理复杂任务的理想选择,比如上下文相关的客户支持和协调多步骤工作流等等。
在内部智能体代码评估当中,Claude 3.5 Sonnet 能够解决 64%的问题,优于之前的 Claude 3 Opus(解决 38%)。
另外,他们还测试了在给出所需改进的自然语言描述情况下,让模型修复错误或向开源代码库添加功能的能力。结果在得到相关指导和工具后,Claude 3.5 Sonnet 则可以独立编写、编辑和执行代码,并具有复杂的推理和故障排除功能。它还可以轻松处理代码转换,使其特别适合更新旧版应用与迁移代码库等。
Anthropic 还放出了各项横向基准测试结果,发现除了数学能力之外,其他能力基本与 GPT-4o 超越或接近。
视觉能力再度进化
强大的视觉能力一直是 Claude 系列模型的卖点之一。而这次新升级的 Claude 3.5 Sonnet 则是他们迄今为止最强大的视觉模型。
本次升级也让其对解释图表与图形等任务,所需的视觉推理能力,有了大幅度的提升。此外,Claude 3.5 Sonnet 还可以准确地从不完美的图像中转录文本,而这正是零售、物流与金融服务的核心功能。在这些领域当中,AI 就可以帮助从图像、图形或者插图中获得比单从文本来的更多理解。
与其他多模态模型对比,Claude 3.5 Sonnet 在视觉数学推理、科学图表、图表 QA、文件视觉 QA 等项目超越 GPT-4o,在视觉问答方面较 GPT-4o 也仅仅是毫厘之间。
推出全新功能 Artifacts
此外,本次更新 Anthropic 还推出了全新工具 Artifacts,它能够拓展用户与 Claude 互动方式。比如当一个用户要求 Claude 生成代码片段、文本文档或者网络设计等内容时,这些 Artifacts 则会与对话一同显示在专用窗口当中,也就是说创建了一个动态的工作区。用户可以在其中实时查看、编辑与构建 Claude 的创作过程。
Anthropic 表示,这项升级将标志着 Claude 从对话式 AI 进化为了协作式工作环境。而这仅仅只是 Claude 系列模型更广阔愿景的开始,他们相信在不久的将来,一个团队,甚至可能最后一个组织,都将能够安全地将他们的知识、文档和手头上的工作集中在一个共享空间中,让 Claude 成为大家随时可用的队友。
总结
目前 Claude 3.5 Sonnet 已可以在网站 Claude.ai 与 iOS 端上线,并提供免费使用。而 Claude Pro 与 Team 版订阅者将可以以更高的速率下使用。此外,包括 Anthropic API、Amazon Bedrock 与 Google Cloud 的 Vertex AI 上使用。
Claude 3.5 Sonnet 模型将以每百万输入 Token 3 美元,每百万输出 Token 15 美元收费,且具有 200K Token 数的上下文窗口。
目前已经有众多海外博主第一时间上手体验了这款全新模型,他们的第一感受就是代码编写能力非常强大,可以在两分钟之内做一个简易玩法的小游戏等等。
Claude 还顺便预告了未来的计划:他们将每隔几个月就大幅地改善智能、速度与成本间的权衡曲线,并将在今年晚些时刻发布 Claude 3.5 Haiku(高速)与 Claude 3.5 Opus(高质量)。
除此之外,他们还在开发其他全新模式与功能,来支持更多的企业用例,包括与企业应用程序集成等。Anthropic 的研究人员还在探索包括长期记忆等功能,将能够让 Claude 模型记住用户的偏好与指定的交互历史记录等,从而使模型体验更加个性化与高效。
编译:刘嘉禾
本文链接:https://ki4.cc/Claude/52.html
GPT-4claudeai下载claudeai是谷歌研发的吗claude官网怎么登录claude官网下载claudeco官网claude官方网页版claude官网注册claude 100k 官网claude2官网无法访问
网友评论