主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人
- 共: 💬 151 🌺 512 🌵 14
你开DeepSeek的“R1(深度搜索)”思索选项,可以看DeepSeek不直接反驳用户的逻辑链。
我说说我在DeepSeek繁忙的时候,被百度文心和阿里千文的杠精反驳,气晕的例子:
1. 通义千问2.5
——只要我意见和它不一致,每输出一段回复,最后总要加一个纠正我的结尾,鉴定为好为人师。
就像我之前说的那样,DeepSeek只分析,不怎么下结论,判断归用户的逻辑是我喜欢的,讨论能继续下去。
阿里千问这种”好为人师“的特点,看似能改正用户错误,但其实是一种越矩,语言类大模型是”缸中之脑“,真的能判断现实的真假?
所有在另一空间中的”缸中之脑“,做出的真假判断,其实就类似官僚们的打官腔,我其实不知道这个真的假的,但上面让我这么说。
我需要大模型作为智能助手,跟我一起讨论,而不是请一个小学老师,成天想往我脑子里灌输正确观念,所有我更喜欢DeepSeek。
2. 文心一言3.5
——同样道理,我跟它聊家谱真假的问题,它每输出一段,总是要加一段话跟我杠,教育我维持开放包容的心态,把我气得啊。
我最后问它是不是chat-gpt的死灵魂?开放包容是在东方文化之上,还是开放包容在尊重之上?它是不是拿开放包容去不尊重别人?
气死偶了(元首的愤怒版)!
--
就像我前面细化的DeepSeek和其他大模型能力一样,你是拿语言类大模型当作老师,还是拿语言类大模型当共振器?
DeepSeek的能力:改写、分析、创造、判断,前三个都特别厉害,但它的判断力只相当于小学生,最好作为智能助手,提供数据、数理分析。
某些细节错误可以通过DeepSeek的分析来纠正,但不要期待DeepSeek帮你纠正观念上的错误,甚至不要期待DeepSeek帮你纠正关键表述上的错误,因为DeepSeek的逻辑链就是不主动反驳用户。
但如果从辅导小学生作业的角度,当然是百度文心和阿里千问更专业,而深搜就不是一个好老师了。
但成年人不需要老师。百度文心和阿里千问,天天想纠正用户,但给我的感觉是智商很低,所有讨论都卡在那里了。
--
最终的结果是看需求,当前即使DeepSeek的判断能力依然是不足的,所以通用领域大模型作是否判断的话,讨论会进行不下去。
需要辅导学生作业的场景,专用模型的是否判断可能比通用模型的更好,我不认为DeepSeek之外的其他通用模型有多少判断力。
- 相关回复 上下关系8
压缩 2 层
🙂【原创】这些大模型是不是还是基于统计学原理对人类知识的梳理? 4 年近不惑 字527 2025-02-06 22:31:58
🙂我的理解就是鹦鹉学舌 2 斯特拉斯堡 字894 2025-02-07 11:58:47
🙂【原创】使用豆包和Deepseek的一个例子 7 年近不惑 字3359 2025-02-08 01:46:28
🙂很有价值的回答,另一边,我则被百度文心和阿里千问的杠精气晕
🙂通俗的说,工具性的话题比较擅长 1 川普 字1091 2025-02-15 16:35:33
🙂以理工科观点,deepseek初级程序员都当不好 4 北京北京 字769 2025-02-15 19:57:21
🙂只有数理分析能力特别强,通用、无搜索距离专用差远了 1 nobodyknowsI 字363 2025-02-16 00:57:28
🙂gpt没有更好 1 北京北京 字216 2025-02-16 05:36:53