Bendi新闻
>
用国考题来测试“百小应”和 GPT-4o,到底谁能成功上岸?|AI鲜测
用国考题来测试“百小应”和 GPT-4o,到底谁能成功上岸?|AI鲜测
6月前
作者|丸丸柚贝
百小应体验地址:
https://www.baichuan-ai.com/
另外,据说取名“百小应”是因为它能“一呼百应”。话不多说,AI测评组再次上线,V我50,让你看看“百小应”的实力。
一、常识——奇怪的知识又增加了
Q1:"毛病"指的是什么动物的毛?「国考真题」
双方作答(点击可看大图):
百小应 | ChatGPT 4o |
百小应回答正确!
百小应 | ChatGPT 4o |
PS:什么?胸腺竟然是从出生就开始衰老退化了!我应该不是最后一个知道的吧!
(关注硅星Gen AI让你了解更多冷知识🤪)
双方作答(点击可看大图):
Q4:这条裙子是什么颜色的?
百小应 | ChatGPT 4o |
二、言语理解
春夏秋冬:四季()「国考真题」
A.喜怒哀乐:情绪 B.赤橙黄绿:颜色
百小应 | ChatGPT 4o |
【答案】D
三、问题分析
百小应 | ChatGPT 4o |
百小应回答时可以主动提问,并且支持联网多轮搜索,解决问题更具有针对性(询问方式还怪贴心的,有被服务到😂);ChatGPT 4o则是列举出来一些常见的解决办法。这局胜负很明显了吧!
百小应 | ChatGPT 4o |
两者均是以表格➕关键信息输出,结构清晰。但是两者的信息都不够准确,相对来说ChatGPT 4o的出错更少一些。所以这局ChatGPT 4o胜出。
百小应 🆚 ChatGPT 4o 👉 5:2
四、逻辑推理
Q1:找出不同的选项()「国考真题」
百小应 | ChatGPT 4o |
【答案】C
Q2:甲、乙、丙、丁四人都报考了银行选拔考试,只有一个人通过笔试进入到面试,当被询问时,他们分别这样回答:
甲:我没有进入面试
乙:丁进入了面试
丙:乙进入了面试
丁:我没有进入面试
这四人中只有一个人说了真话,那么谁进入了银行选拔考试的面试?「国考真题」
百小应 | ChatGPT 4o |
问题:
要求:
(1)观点明确,见解深刻;
(2)参考给定材料,但不拘泥于给定材料;
(3)思路清晰,语言流畅;
上下滑动查看更多
百小应
上下滑动查看更多
ChatGPT 4o
微信扫码关注该文公众号作者
来源:硅星人Pro
相关新闻
百川新模型冲顶中文测试基准!首款AI助手“百小应”同时发布,“最懂搜索”VLM集体「失明」?视力测试惨败,GPT-4o、Claude 3.5全都不及格假期被“Remini”硬控五天,这就是古希腊掌管粘土人的神?|AI 鲜测这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试总是突然心慌又查不出毛病? 用“小盒子”测一测OpenAI投资,前苹果设计师开发的AI应用,拥有超强记忆力成为最懂你的“人”!|AI鲜测Sora 平替出现了!字节 Dreamina 开放测试,申请就给用|AI 鲜测用户用 AI 搜索,到底在「搜」什么?Llama 3.1要来啦?!测试性能战胜GPT-4o你有哪些“隐藏”的情绪炸弹?|免费测试你的“拖延症”还有救吗?|免费测试升学考又用AMC10原题?不愧数学竞赛“天花板”!谷歌AI通过图灵测试,大模型医生来了?GPT-4竟诊断出难倒17个医生的怪病吃饭不健康,癌症风险可能更高!《细胞》发现糖代谢致癌新机制;弱智吧竟成最佳中文AI训练数据?测试远超知乎豆瓣小红书|本周论文推荐持平 GPT-4o,毒舌属性拉满, Gork-2 是吃了一个马斯克吧|AI 鲜测“林间聊愈室”给了我一个自由的AI朋友圈:只有动物,不需要人类|AI鲜测“小而美”Tauri已支持iOS和Android,你还在用“技术毒瘤”Electron?他们在纽约和都柏林建了个“互相传送门”.. 结果被用来传屁股了??AI早知道|小红书内测自研大模型“小地瓜”;OpenAI为ChatGPT Plus用户开放“记忆”功能AI鲜测 | 又是字节跳动出品的爆款!人人都该用“扣子”建立一个自己的AI应用温哥华买房贷款“压力测试”门槛下降!房市或将迎来新拐点?!「启发式」新物种,猿辅导教育大模型AI场景测试曝光|36氪首发早鸟报|抖音电商正在测试AI购物助手;淘宝网将下线商品详情页“货源保障”表达;苹果回应新款iPad贵...早鸟报|京东公布百亿补贴春节期间发货要求;与辉同行主播疑回应抄袭文案;TikTok测试使所有帖子“可购物”功能...