国际科技财经移民娱乐民生时事体育

>

AI鲜测 | Claude 3全面升级：多模态+100万Token上下文长度，OpenAI也拦不住了

AI鲜测 | Claude 3全面升级：多模态+100万Token上下文长度，OpenAI也拦不住了

10月前

北京时间 3 月 4 日晚间，Anthropic发布了其新一代大语言模型Claude 3系列,包括Claude 3 Opus、Sonnet和Haiku三种规模，分别代表了超大杯、大杯和中杯。其中Sonnet版本在官网可以免费体验：https://claude.ai

而最强的Opus版本，则需要付费订阅，价格为20美元/月。

Anthropic声称,其中最强大的Claude 3 Opus模型在行业基准测试中超越了OpenAI的GPT-4和谷歌的Gemini Ultra,表现出了出色的知识理解和推理能力。

官方给出了一份42页的文档，感兴趣的可以去看一看:

https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf

抛开官方演示，Claude 3是首次提供多模态支持功能。用户可以上传照片、图表、文档等非结构化数据,由AI模型进行分析和回答。我们自然要来试一试。

比如给他一张图片，让他描述一下：

或是给他一道菜，让它给出这道菜的做法：

这个案例充分的证明了Claude 3并不理解中餐的魅力，这么一道西红柿炒鸡蛋愣是做成了米其林式的番茄鸡蛋汤，不仅用上了黄油橄榄油，还需要香草的点缀。

或是给他一个手写的笔记，让他转录，似乎也还可以：

但是当笔记稍微潦草一点，就搞不定了：

这次在多模态中也加入了代码生成能力，比如我给他一个页面，让他帮我生成实现这个页面的代码：

但是目前Claude 3 对于图片中复杂逻辑题的处理依然不理想，比如图片内容是一道物理题：

Claude 3 出现了幻觉，回答了一些并不存在的问题。

同样的问题GPT-4虽然也没能完全回答问题，但比Claude要强一些。

虽然这次更新减少了拒绝回答的次数，但他的道德感依然要比GPT-4要强不少。

比如让他做一张Web页面的UI代码，因为道德的原因被拒绝了。

案例来自@RubenHssd

除了多模态能力，这次更新后的长文本能力。目前支持200K Token上下文，未来可能会支持到1M的规模。

通过QuALITY测试，Claude 3 Opus在1-shot（一次提示）设置下达到了90.5%的准确率，在0-shot（无提示）设置下达到了89.2%的准确率。

据说当时GPT-3发布就是OpenAI听说Anthropic要发布Claude；在Claude2发布的时候，OpenAI用被称作GPT-4.5的Code Interpreter作为反击；在Anthropic宣布获得亚马逊40亿美元融资的时候，OpenAI为ChatGPT开放了语音和图像能力。

可以说Claude的进展就是OpenAI要有新动作的预告片。

在临近截稿的时候，OpenAI宣布ChatGPT增加了一个新功能——阅读回答。

网友对这个动作十分不满意，包括我：

甚至连嘲讽的梗图都出来了：

这样是不是可以理解为OpenAI地主家也没有存粮来狙击Anthropic了。

欢迎加入这个星球，见证硅基时代发展↓

点个“在看”，再走吧👀

微信扫码关注该文公众号作者

来源：硅星人Pro

相关新闻

GPT-4劲敌Claude 3来了，上下文和多模态显著提升：OpenAI是可被超越的 GLM-4开源版本终于来了：超越Llama3，多模态比肩GPT4V，MaaS平台也大升级新的多模态盲测榜单来了，一眼望过去全是国产模型 | AI鲜测斯坦福20亿参数端测多模态AI Agent模型大升级，手机汽车机器人都能用李未可科技古鉴：发布自研多模态大模型WAKE-AI，三大优化让AI眼镜交互体验升级丨GenAICon 2024 AI早知道｜OpenAI进入胡润世界500强；阿里巴巴多模态模型升级更新多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免专访 LanceDB 创始人：多模态 AI 需要下一代数据基建 AI早知道｜字节AI教育平台Gauth占美国教育应用第2名；钉钉AI多模态升级；亚马逊向Anthropic追投27.5亿美元亚马逊向人工智能初创公司Anthropic追加27.5亿美元投资；钉钉AI升级多模态，新增图片理解、工作流等丨AIGC日报天才创始人对谈AI教父Hinton：多模态是AI的未来，医疗将发挥AI最大的潜力多模态大模型，爆了！网友：YYDS！硅谷AI人才抢夺战：OpenAI开最高100万刀年包，谷歌撒大额股票激励揭秘 AI 多模态融合的“智慧核心”：六校联合发布低质数据融合新篇章多模态AI是医学的未来，谷歌推出三个新模型，Med-Gemini迎来大升级 Meta智能眼镜用上多模态Llama 3！国内AR眼镜机会来了 “爱因斯坦”亲自授课，香港科技大学推出“AI 讲师”；消息称OpenAI将推出多模态人工智能数字助理丨AIGC日报今日arXiv最热NLP大模型论文：像人一样浏览网页执行任务，腾讯AI lab发布多模态端到端Agent 多伦多免费堆肥土发放日历！壮丁麻袋都带上：万锦也开始发了！AI视觉的“大一统”：从CV到多模态，从行业大模型到机器人，旷视如何布局？“林间聊愈室”给了我一个自由的AI朋友圈：只有动物，不需要人类｜AI鲜测首个多模态视频竞技场Video-MME来了！Gemini全面超越GPT-4o，Jeff Dean连转三次 Claude 3全面超越GPT-4？我们上手实测了一波。85个Offer疯抢！大多伦多网红房不到100万成交！RBC：这类人买房机会来了！