Claude 3.5 Sonnet出炉,力压GPT-4o和Gemini 1.5 Pro。
时间:2024-06-21 11:29:46
标签:
435
0
Anthropic 今天(6 月 21 日)推出了Claude 3.5 Sonnet,这是 Claude 3.5 系列的首个模型版本,在各项评估中优于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。
Claude 3.5 Sonnet 在前代的基础上迭代升级,性能更快,编码、视觉和自然语言理解能力更强。
Claude 3.5 Sonnet 属于中等尺寸模型,介于小型 Haiku 和高端 Opus 之间,但 Anthropic 声称,根据内部基准测试,Sonnet 的性能甚至超过了顶级 Opus。

据 Anthropic 称,Claude 3.5 Sonnet 处理输入的速度是 Opus 的两倍。该公司称,在编码挑战方面,Sonnet 超越了之前的 Opus 模型,修复了 64% 的代码错误,而 Opus 只有 38%。
基准测试结果还显示,Sonnet 在 9 个总体类别中的 7 个类别、5 个视觉任务中的 4 个任务上击败了竞争对手。
IT之家翻译官方新闻稿如下:
Claude 3.5 Sonnet 是我们迄今为止最强大的视觉模型,在标准视觉基准测试中超过了 Claude 3 Opus,在解读图表等需要视觉推理的任务中,这些阶跃式的改进最为明显。
Claude 3.5 Sonnet 还能从不完美的图像中准确地转录文本,这是零售、物流和金融服务的核心能力,在这些领域,人工智能可能会从图像、图形或插图中获得比单纯从文本中获得更多的洞察力。
为确保安全,Anthropic 将 Sonnet 提交给英国和美国人工智能安全研究所进行外部评估。他们发现,经过改进后,该模型仍处于 ASL 2 级水平。Anthropic 还利用儿童安全专业知识对助手进行了更新,以更好地预防潜在伤害。
本站声明:网站内容来源于网络,如有侵权,请联系我们,我们将及时处理。
配查查作为开放的资讯分享平台,本内容由DeepSeek润色后改写,与配查查平台立场无关,且不构成任何投资理财建议。如若转载请标注文章来源:配查查。
热门专题
-
2026-04-022026年04月02日双鹭药业为什么涨停?002038双鹭药业首板涨停原因分析
-
2026-04-022026年04月02日大东南为什么涨停?002263大东南首板涨停原因分析
-
2026-04-022026年04月02日济民健康为什么涨停?603222济民健康首板涨停原因分析
-
2026-04-022026年04月02日合富中国为什么涨停?603122合富中国首板涨停原因分析
-
2026-04-022026年04月02日中油工程为什么涨停?600339中油工程首板涨停原因分析
-
2026-04-022026年04月02日巨星农牧为什么涨停?603477巨星农牧首板涨停原因分析
-
2026-04-022026年04月02日益佰制药为什么涨停?600594益佰制药2涨停原因分析
-
2026-04-022026年04月02日中工国际为什么涨停?002051中工国际首板涨停原因分析
-
2026-04-022026年04月02日西藏矿业为什么涨停?000762西藏矿业首板涨停原因分析
-
2026-04-022026年04月02日欧康医药为什么涨停?920230欧康医药首板涨停原因分析
-
2026-04-022026年04月02日康普顿为什么涨停?603798康普顿首板涨停原因分析
-
2026-04-022026年04月02日川能动力为什么涨停?000155川能动力首板涨停原因分析
最近更新
热点关注
金木集团遭投诉,消费者要求退货、停止侵权并核责。
2024-08-14
山西奥瑞公司涉黑市倒卖数千遗体,75人涉案。
2024-08-08
2023年6月5日易倍策略平台实盘验证记录
2023-06-05
2023年6月12日易倍策略平台实盘验证记录
2023-06-12
2023年5月22日易倍策略平台实盘验证记录
2023-05-22
2022年12月26日嘉多网实盘验证记录
2023-01-01
2022年7月22日正景网实盘验证记录
2023-01-01
2022年12月26日广升网实盘验证记录
2023-01-01

点赞






