Anthropic 今日(6 月 21 日)推出了 Claude 3.5 Sonnet,这是 Claude 3.5 系列的首个模型版本,其性能在各项评估中优于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。Claude 3.5 Sonnet 在前代基础上迭代升级,具有更快的处理速度、更强的编码、视觉和自然语言理解能力。它属于中等尺寸模型,但性能甚至超过了顶级 Opus。据 Anthropic 称,Sonnet 的处理速度是 Opus 的两倍,在编码挑战方面超越了 Opus 模型,修复了 64% 的代码错误,而 Opus 只有 38%。基准测试结果显示,Sonnet 在 9 个总体类别中的 7 个类别、5 个视觉任务中的 4 个任务上击败了竞争对手。为确保安全,Anthropic 将 Sonnet 提交给英国和美国人工智能安全研究所进行外部评估,发现经过改进后,该模型仍处于 ASL 2 级水平,并利用儿童安全专业知识对助手进行了更新,以更好地预防潜在伤害。