引言:人工智能的发展正以惊人的速度推进,OpenAI 的劲敌 Anthropic 最近悄悄更新了 Claude 3.5 Sonnet,它在理解细微差别、幽默和复杂指令方面表现出显著改进,并且在用自然、亲切的语调撰写高质量内容方面表现出色。此外推出了 Artifacts,此预览功能标志着 Claude 从对话式 AI 向协作工作环境的演变。下面来看看 Anthropic 是怎么说的。
今天,我们推出了 Claude 3.5 Sonnet,这是即将发布的 Claude 3.5 模型家族的首个版本。Claude 3.5 Sonnet 提高了行业智能水平,在广泛的评估中表现优于竞争对手模型和 Claude 3 Opus,并且具备我们中档模型 Claude 3 Sonnet 的速度和成本。
Claude 3.5 Sonnet 现在可以在 Claude.ai 和 Claude iOS 应用上免费使用,而 Claude Pro 和 Team 计划订阅者可以以显著更高的速率限制访问它。它还可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 获得。该模型的费用为每百万输入 tokens 3 美元,每百万输出 tokens 15 美元,具有 200K token 的上下文窗口。
前沿智能,速度提高两倍
Claude 3.5 Sonnet 在研究生级推理(Graduate-Level Reasoning,GPQA)、本科级知识(Undergraduate-Level Knowledge,MMLU)和编码熟练度(Coding Proficiency,HumanEval) 方面设定了新的行业基准。它在理解细微差别、幽默和复杂指令方面表现出显著改进,并且在用自然、亲切的语调撰写高质量内容方面表现出色(实践过,是真的!没吹嘘)。
Claude 3.5 Sonnet 的运行速度是 Claude 3 Opus 的两倍。这种性能提升,加上成本效益,使 Claude 3.5 Sonnet 非常适合处理复杂任务,如情境敏感的客户支持和多步骤工作流程的协调。
在一次内部智能编码评估中,Claude 3.5 Sonnet 解决了 64% 的问题,优于解决了 38% 的 Claude 3 Opus。我们的评估测试模型在给定自然语言描述的情况下修复错误或为开源代码库添加功能的能力。在有指导并提供相关工具的情况下,Claude 3.5 Sonnet 能够独立编写、编辑和执行代码,具备复杂的推理和故障排除能力。它能够轻松处理代码翻译,特别适合更新遗留应用程序和迁移代码库。
最先进的视觉
Claude 3.5 Sonnet 是我们最强大的视觉模型,在标准视觉基准测试中超越了 Claude 3 Opus。这些跨越性改进在需要视觉推理的任务中最为显著,如解释图表和图形。Claude 3.5 Sonnet 还能够准确地从不完美的图像中转录文本,这是零售、物流和金融服务的核心能力,在这些领域,AI 可能比单纯从文本中获得更多的洞察力。
Artifacts——使用 Claude 的新方式
今天,我们还在 Claude.ai 上推出了 Artifacts,这是一项扩展用户与 Claude 互动的新功能。当用户要求 Claude 生成代码片段、文本文档或网站设计等内容时,这些 Artifacts 会出现在他们对话旁边的专用窗口中。这创造了一个动态工作区,用户可以实时查看、编辑和构建 Claude 的创作,将 AI 生成的内容无缝集成到他们的项目和工作流程中。
此预览功能标志着 Claude 从对话式 AI 向协作工作环境的演变。这只是 Claude.ai 更广泛愿景的开始,未来将扩展以支持团队协作。不久之后,团队——最终是整个组织——将能够在一个共享空间中安全地集中他们的知识、文档和正在进行的工作,Claude 将作为按需队友提供服务。
对安全性和隐私的承诺
我们的模型经过严格测试,并经过训练以减少误用。尽管 Claude 3.5 Sonnet 在智能方面有了飞跃,我们的红队评估表明 Claude 3.5 Sonnet 仍保持在ASL-2。更多细节请见模型卡附录。
作为我们对安全性和透明度承诺的一部分,我们与外部专家合作,测试和改进此最新模型中的安全机制。我们最近将 Claude 3.5 Sonnet 提供给英国人工智能安全研究所(UK AISI)进行部署前的安全评估。英国人工智能安全研究所完成了对 3.5 Sonnet 的测试,并将结果与美国人工智能安全研究所(US AISI)共享,这是今年早些时候宣布的美英人工智能安全研究所合作备忘录的一部分。
我们已经整合了外部主题专家的政策反馈,以确保我们的评估是全面的,并考虑到滥用的新趋势。这种合作帮助我们的团队提升了评估 3.5 Sonnet 对各种类型误用的能力。例如,我们使用来自Thorn的儿童安全专家的反馈来更新我们的分类器并微调我们的模型。
指导我们 AI 模型开发的核心宪法原则之一是隐私。我们不会在用户提交的数据上训练我们的生成模型,除非用户明确授权我们这样做。迄今为止,我们尚未使用任何客户或用户提交的数据来训练我们的生成模型。
即将推出
我们的目标是每隔几个月大幅改善智能、速度和成本之间的权衡曲线。为了完成 Claude 3.5 模型家族,我们将在今年晚些时候发布 Claude 3.5 Haiku 和 Claude 3.5 Opus。
除了开发下一代模型家族外,我们还在开发新模式和新功能,以支持更多的企业用例,包括与企业应用程序的集成。我们的团队还在探索诸如 Memory 之类的功能,使 Claude 能够记住用户的偏好和交互历史,从而使他们的体验更加个性化和高效。
我们不断努力改进 Claude,喜欢听取用户的意见。你可以在产品中直接提交对 Claude 3.5 Sonnet 的反馈,以告知我们的开发路线图,并帮助我们的团队改善你的体验。我们期待看到你用 Claude 构建、创造和发现的成果。
本文链接:https://ki4.cc/Claude/73.html
claudeai账号claudeaiminiclaude官网中文版claude 官网claude官网下载claude官网免费claudeco官网claude ai官网地址claude2官网打不开claude官网模型是哪个
网友评论