当地时间星期一,Anthropic 发布了一组 Claude 3 一系列大型模型,称其功能最强大的模型在各种基准测试中均优于 OpenAI 的 GPT-4 和 Google 的 Gemini 1.0 Ultra。
然而,它可以处理更复杂的推理任务,更智能,更快的响应,这些都是大模型。 Top3 只有综合能力 Claude3 的基本功。
Anthropic 致力于成为企业客户的最佳伙伴。
第一个体现在这里 Claude3 这是一组模型:Haiku、Sonnet 和 Opus,使企业客户根据自己的场景选择不同性能、不同成本的版本。
其次,Anthropic 强调自己的模型是最安全的。Anthropic 总裁 Daniela Amodei 介绍,在 Claude3 在训练中引入了一种叫做的训练。「宪法人工智能」提高其安全性、可信度和可靠性的技术。
在看完 Claude3 爱丁堡大学大模型和推理方向博士生符尧在技术报告之后表示,Claude3 特别是在金融和医疗领域,在一些复杂推理的基准测试中,作为一个家庭, ToB 公司,Anthropic 对最赚钱的领域进行优化。
现在,Anthropic 在 159 一个国家开放使用 Claude3 两个系列模型(Haiku 和 Sonnet),最强版本 Opus 而且即将推出。与此同时,Anthropic 它还通过亚马逊和谷歌的云平台提供服务,后者分别向Anthropic提供服务注资 40 亿美元和 20 亿美元。
Darioo联合创始人 Amodei and Daniela Amodei 表示,Claude 3 发表再一次表明,「Anthropic 与消费者公司相比,更像是一家企业公司。」
01
更加智能,响应更快
Claude3 家族:
Opus、Sonnet 和 Haiku
根据Anthropic 网站,Claude3 这是一系列模型,包括三个最先进的模型:Claude 3 Haiku、Claude3 Sonnet 和 Claude 3 Opus,允许使用者选择智能、速度和成本的最佳平衡来进行特定的应用。
就模型的通用性而言,Anthropic 称 Claude 3 系列「为了建立一个新的行业基准,广泛的认知任务」,在分析和预测、详细内容的生成、代码的生成、西班牙语、日语和法语等非英语语言对话方面,我们可以实现更强的能力,更及时地响应任务。
Claude3 Opus 它是这个模型中最智能的模型,特别是在高度复杂的任务处理方面。Opus 大部分常见的评价基准都优于同行,包括本科专家知识。 (MMLU)、专家推理的研究生水平 (GPQA)、基础数学 (GSM8K) 等等。这是Anthropic目前的Anthropic,在复杂的任务中表现出接近人类水平的理解和流畅。探索通用智能的前沿,「生成人工智能的外部极限展示」。
Claude3 Sonnet 实现了智能水平和响应速度的理想平衡,尤其是企业场景中的任务。与同类产品相比,它以更低的成本提供了强大的性能,并专门为大规模人工智能部署中的高耐用性提供了(high endurance)而且设计。对大多数工作负荷来说,Sonnet 的速度比 Claude 2 和 Claude 2.1 快 2 倍数,而且智力水平更高。擅长执行知识检索或销售自动化等需要快速响应的任务。
Claude 3 Haiku 它是最紧凑的模型,也是最具成本效益的模型。而且它的响应速度也很快,可以在不到三秒的时间内阅读。 arXiv 上面包含图表、图形信息和数据密集的研究论文(约) 10k token)。
02
以企业客户迭代为目标
联合创始人 Daniela Amodei 简介,除通用智能进步外,Anthropic 特别关注企业客户的生成。 AI 整合到他们的业务中,面临着许多挑战。Claude3 家庭在视觉能力、准确性、长文本输入和安全方面都取得了进步。
许多企业客户的知识库有多种格式,PDF、过程图或演示幻灯片。现在,Claude 3 图片、图表、图形和技术图表可以处理各种视觉格式的内容。
Claude3 同时也优化了精度和长文本窗口的能力。
就准确性而言,Anthropic 针对目前模型中已知的弱点,使用了大量复杂的事实问题,将答案分为正确答案、错误答案(或幻觉)和不确定性。相应地,Claude3 这个模型意味着它不知道答案,而不是提供不正确的信息。最强版本 Claude 3 Opus 与具有挑战性的开放性问题(或正确答案)相比, Claude 2.1 在减少错误答案水平的同时,增加了一倍。
与此同时,由于语境理解能力的提高,Claude3 与以前的版本相比,家庭在应对用户任务时会做出更少的拒绝回答。
除更准确的回复外,Anthropic 称将在 Claude 3 带来「引用」功能性,可以指向参考资料中的准确句子来验证答案。
当前,Claude 3 将提供系列模型 200K token 上下文窗口。随后,所有这三种模型都可以接受。 100 万 token 输入,这部分能力将为需要提高处理能力的选择客户提供。Anthropic 简要阐述了技术报告 Claude3 上文窗口的能力,包括更长的上下文提示词的有效处理,以及回忆能力。
03
「宪法人工智能」,
应对「科学不准确」
值得注意的是,Claude3 可以输入图像作为多模态模型,但不能输出图像内容。联合创始人 Daniela Amodei 称重,这是因为「我们发现企业对图像的需求要少得多。」。
Claude3 在谷歌发布 Gemini 生成图片引发争议后发布,面向企业客户 Claude 也免不了在 AI 控制和平衡造成的价值观偏见等问题。
对此,Dario Amodei 强调人工智能模型控制的难度,称之为「科学不准确」。他说,该公司有一个专门的团队来评估和减少模型带来的各种风险。
另外一个联合创始人 Daniela Amodei 还承认,目前的方法可能无法实现完全无偏见的人工智能。「几乎不可能创建一个完全中立的生成人工智能工具,不仅在技术上,而且因为不是每个人都同意什么是中立。」她说。
尽管如此,Anthropic 用一种称为「宪法人工智能」方法可以使模型与人类广泛的价值观尽可能一致,模型遵循「宪法」调整和优化中定义的原则。
作为 OpenAI 曾是核心人发人员,Amodei 兄弟姐妹的离开,最近马斯克对 OpenAI 一纸诉状有相似之处,认为 OpenAI 不再是非营利组织,也不再遵循最初的使命造福人类。一位记者问 Amodei,Anthropic 是否符合您出走创业的愿景?
Amodei 说:「在人工智能发展的前沿,是引导人工智能发展轨迹为社会带来积极成果的最有效途径。」