淘客熙熙

主题:这几天大火的Deepseek没有人讨论吗 -- 俺本懒人

  • 共: 💬 151 🌺 512 🌵 14
很有价值的回答,另一边,我则被百度文心和阿里千问的杠精气晕

你开DeepSeek的“R1(深度搜索)”思索选项,可以看DeepSeek不直接反驳用户的逻辑链。

我说说我在DeepSeek繁忙的时候,被百度文心和阿里千文的杠精反驳,气晕的例子:

1. 通义千问2.5

——只要我意见和它不一致,每输出一段回复,最后总要加一个纠正我的结尾,鉴定为好为人师。

就像我之前说的那样,DeepSeek只分析,不怎么下结论,判断归用户的逻辑是我喜欢的,讨论能继续下去。

阿里千问这种”好为人师“的特点,看似能改正用户错误,但其实是一种越矩,语言类大模型是”缸中之脑“,真的能判断现实的真假?

所有在另一空间中的”缸中之脑“,做出的真假判断,其实就类似官僚们的打官腔,我其实不知道这个真的假的,但上面让我这么说。

我需要大模型作为智能助手,跟我一起讨论,而不是请一个小学老师,成天想往我脑子里灌输正确观念,所有我更喜欢DeepSeek。

2. 文心一言3.5

——同样道理,我跟它聊家谱真假的问题,它每输出一段,总是要加一段话跟我杠,教育我维持开放包容的心态,把我气得啊。

我最后问它是不是chat-gpt的死灵魂?开放包容是在东方文化之上,还是开放包容在尊重之上?它是不是拿开放包容去不尊重别人?

气死偶了(元首的愤怒版)!

--

就像我前面细化的DeepSeek和其他大模型能力一样,你是拿语言类大模型当作老师,还是拿语言类大模型当共振器?

DeepSeek的能力:改写、分析、创造、判断,前三个都特别厉害,但它的判断力只相当于小学生,最好作为智能助手,提供数据、数理分析。

某些细节错误可以通过DeepSeek的分析来纠正,但不要期待DeepSeek帮你纠正观念上的错误,甚至不要期待DeepSeek帮你纠正关键表述上的错误,因为DeepSeek的逻辑链就是不主动反驳用户。

但如果从辅导小学生作业的角度,当然是百度文心和阿里千问更专业,而深搜就不是一个好老师了。

但成年人不需要老师。百度文心和阿里千问,天天想纠正用户,但给我的感觉是智商很低,所有讨论都卡在那里了。

--

最终的结果是看需求,当前即使DeepSeek的判断能力依然是不足的,所以通用领域大模型作是否判断的话,讨论会进行不下去。

需要辅导学生作业的场景,专用模型的是否判断可能比通用模型的更好,我不认为DeepSeek之外的其他通用模型有多少判断力。

通宝推:川普,


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河