OpenAI揭秘巨大破绽，Claude3率先追击

访客 2024-03-06 科技 2 0

　　作为 OpenAI GPT3 R&D负责人的创业项目，Anthropic 被认为是最有能力的 OpenAI 一家抗衡的创业公司。

　　当地时间星期一，Anthropic 发布了一组 Claude 3 一系列大型模型，称其功能最强大的模型在各种基准测试中均优于 OpenAI 的 GPT-4 和 Google 的 Gemini 1.0 Ultra。

　　然而，它可以处理更复杂的推理任务，更智能，更快的响应，这些都是大模型。 Top3 只有综合能力 Claude3 的基本功。

　　Anthropic 致力于成为企业客户的最佳伙伴。

　　第一个体现在这里 Claude3 这是一组模型：Haiku、Sonnet 和 Opus，使企业客户根据自己的场景选择不同性能、不同成本的版本。

　　其次，Anthropic 强调自己的模型是最安全的。Anthropic 总裁 Daniela Amodei 介绍，在 Claude3 在训练中引入了一种叫做的训练。「宪法人工智能」提高其安全性、可信度和可靠性的技术。

　　在看完 Claude3 爱丁堡大学大模型和推理方向博士生符尧在技术报告之后表示，Claude3 特别是在金融和医疗领域，在一些复杂推理的基准测试中，作为一个家庭， ToB 公司，Anthropic 对最赚钱的领域进行优化。

　　现在，Anthropic 在 159 一个国家开放使用 Claude3 两个系列模型（Haiku 和 Sonnet），最强版本 Opus 而且即将推出。与此同时，Anthropic 它还通过亚马逊和谷歌的云平台提供服务，后者分别向Anthropic提供服务注资 40 亿美元和 20 亿美元。

　　Darioo联合创始人 Amodei and Daniela Amodei 表示，Claude 3 发表再一次表明，「Anthropic 与消费者公司相比，更像是一家企业公司。」

　　更加智能，响应更快

　　Claude3 家族：

　　Opus、Sonnet 和 Haiku

　　根据Anthropic 网站，Claude3 这是一系列模型，包括三个最先进的模型：Claude 3 Haiku、Claude3 Sonnet 和 Claude 3 Opus，允许使用者选择智能、速度和成本的最佳平衡来进行特定的应用。

　　就模型的通用性而言，Anthropic 称 Claude 3 系列「为了建立一个新的行业基准，广泛的认知任务」，在分析和预测、详细内容的生成、代码的生成、西班牙语、日语和法语等非英语语言对话方面，我们可以实现更强的能力，更及时地响应任务。

　　Claude3 Opus 它是这个模型中最智能的模型，特别是在高度复杂的任务处理方面。Opus 大部分常见的评价基准都优于同行，包括本科专家知识。 (MMLU)、专家推理的研究生水平 (GPQA)、基础数学 (GSM8K) 等等。这是Anthropic目前的Anthropic，在复杂的任务中表现出接近人类水平的理解和流畅。探索通用智能的前沿，「生成人工智能的外部极限展示」。

　　Claude3 Sonnet 实现了智能水平和响应速度的理想平衡，尤其是企业场景中的任务。与同类产品相比，它以更低的成本提供了强大的性能，并专门为大规模人工智能部署中的高耐用性提供了（high endurance）而且设计。对大多数工作负荷来说，Sonnet 的速度比 Claude 2 和 Claude 2.1 快 2 倍数，而且智力水平更高。擅长执行知识检索或销售自动化等需要快速响应的任务。

　　Claude 3 Haiku 它是最紧凑的模型，也是最具成本效益的模型。而且它的响应速度也很快，可以在不到三秒的时间内阅读。 arXiv 上面包含图表、图形信息和数据密集的研究论文(约) 10k token）。

　　以企业客户迭代为目标

　　联合创始人 Daniela Amodei 简介，除通用智能进步外，Anthropic 特别关注企业客户的生成。 AI 整合到他们的业务中，面临着许多挑战。Claude3 家庭在视觉能力、准确性、长文本输入和安全方面都取得了进步。

　　许多企业客户的知识库有多种格式，PDF、过程图或演示幻灯片。现在，Claude 3 图片、图表、图形和技术图表可以处理各种视觉格式的内容。

　　Claude3 同时也优化了精度和长文本窗口的能力。

　　就准确性而言，Anthropic 针对目前模型中已知的弱点，使用了大量复杂的事实问题，将答案分为正确答案、错误答案(或幻觉)和不确定性。相应地，Claude3 这个模型意味着它不知道答案，而不是提供不正确的信息。最强版本 Claude 3 Opus 与具有挑战性的开放性问题(或正确答案)相比， Claude 2.1 在减少错误答案水平的同时，增加了一倍。

　　与此同时，由于语境理解能力的提高，Claude3 与以前的版本相比，家庭在应对用户任务时会做出更少的拒绝回答。

　　除更准确的回复外，Anthropic 称将在 Claude 3 带来「引用」功能性，可以指向参考资料中的准确句子来验证答案。

　　当前，Claude 3 将提供系列模型 200K token 上下文窗口。随后，所有这三种模型都可以接受。 100 万 token 输入，这部分能力将为需要提高处理能力的选择客户提供。Anthropic 简要阐述了技术报告 Claude3 上文窗口的能力，包括更长的上下文提示词的有效处理，以及回忆能力。

　　「宪法人工智能」，

　　应对「科学不准确」

　　值得注意的是，Claude3 可以输入图像作为多模态模型，但不能输出图像内容。联合创始人 Daniela Amodei 称重，这是因为「我们发现企业对图像的需求要少得多。」。

　　Claude3 在谷歌发布 Gemini 生成图片引发争议后发布，面向企业客户 Claude 也免不了在 AI 控制和平衡造成的价值观偏见等问题。

　　对此，Dario Amodei 强调人工智能模型控制的难度，称之为「科学不准确」。他说，该公司有一个专门的团队来评估和减少模型带来的各种风险。

　　另外一个联合创始人 Daniela Amodei 还承认，目前的方法可能无法实现完全无偏见的人工智能。「几乎不可能创建一个完全中立的生成人工智能工具，不仅在技术上，而且因为不是每个人都同意什么是中立。」她说。

　　尽管如此，Anthropic 用一种称为「宪法人工智能」方法可以使模型与人类广泛的价值观尽可能一致，模型遵循「宪法」调整和优化中定义的原则。

　　作为 OpenAI 曾是核心人发人员，Amodei 兄弟姐妹的离开，最近马斯克对 OpenAI 一纸诉状有相似之处，认为 OpenAI 不再是非营利组织，也不再遵循最初的使命造福人类。一位记者问 Amodei，Anthropic 是否符合您出走创业的愿景？

　　Amodei 说：「在人工智能发展的前沿，是引导人工智能发展轨迹为社会带来积极成果的最有效途径。」