不要逼我出手,我疯起来连自己都打!
OpenAI最强竞争对手AnthropicAI深夜发布新一代模型:Claude-3.5-Sonnet,各方面性能超越了OpenAI的GPT-4o和自家旗舰模型Claude-3-Opus,成为目前最强商业大模型!
Claude-3.5-Sonnet的主要特点和改进包括:
性能提升:在各种评估基准中表现出色,超过了GPT-4o和自家的旗舰模型Claude-3-Opus,同时在保持了上个版本的的推理速度和成本。
更强的推理能力:该模型在 GPQA、MMLU 和HumanEval评估基准上取得了SOTA。
顶级的编程能力:在理解和执行复杂指令、编写高质量代码方面表现突出,在Aider排行榜上名列第一,超越了GPT-4o和自家旗舰模型。
视觉理解能力增强,在视觉理解任务上展现了显著提升,特别是在需要视觉推理的任务中。它还能够从图像中准确地提取文本。
UI增强:新增了Artifacts功能,允许用户在Claude.ai上实时查看、编辑和构建AI生成的内容,如代码片段、文本文档或网站设计,为用户提供了可协作的工作环境。
免费使用:可在 Claude.ai、Claude iOS app、Anthropic API、Amazon Bedrock 和 Google Cloud's Vertex AI 上免费使用,ChatGPT可以退订了。
API价格:每百万输入令牌 $3,每百万输出令牌 $15。
其它模型:今年晚些时候,AnthropicAI会发布性能更好的旗舰模型Claude-3.5-Opus和性价比更高的小模型Claude-3.5-Haiku。
Artifacts功能
新UI提供的Atifacts功能为用户创建了一个协同工作环境,可以像OpenAI的Code Interpreter一样完成各种复杂任务。下面两段视频展示了用Atifacts创建小游戏的过程。
代码生成能力
在最新的Aider排行榜上,Claude-3.5-Sonnet解决代码问题的正确率为78.2%,远超GPT-4o的72.9%。最近发布的开源国产大模型DeepSeek-Coder-V2正确率为75.2%,排名第二!
https://aider.chat/docs/leaderboards
大模型正在疯狂进化,短短一年时间,模型性能翻了近一倍,而这个过程似乎还在加速!OpenAI迫于压力会不会提前发布GPT-5,AGI会不会提前到来?
目前Claude-3.5-Sonnet已经加入Chatbot Arena,大家可以手动评测打个分。
也可以在poe.com免费试用:
https://poe.com/Claude-3.5-Sonnet
本文链接:https://ki4.cc/Claude/29.html
claudeai应用不可用怎么办claudeai.aiclaude官网claude官网下载claude2官网免费版claudeco官网claude下载 官网claude3官网入口claude2官网中文版claude2官网注册
网友评论