基于大语言模型（LLM) 的 AI 对理科和文科工作都会带来巨大冲击，但是文科工作受到的冲击会更来的更早，更猛烈

浏览过的版块

等级三等兵

威望--

贴子83

魅力299

注册时间2022-08-28

zhshthd

查看全部

基于大语言模型（LLM) 的 AI 对理科和文科工作都会带来巨大冲击，但是文科工作受到的冲击会更来的更早，更猛烈

861

2024-05-30 22:29:50

听上去有点反直觉。但是原因很简单，大语言模型是基于概率的预测，‘依样画葫芦’，而不是基于对世界万物的底层原理产生的推理（reasoning）。要让它的推理能力增强，必须通过人工干预，做一些具体的优化，但这个世界千变万化，不可能都干预得过来。

所以语言模型对那些没有具体的，硬性的，客观可测量要求的任务，可以完成的很好。比如画一张印象派油画，你画之前也不知道应该画成啥样的，纯粹为了欣赏，totally open ended。这是它的强项。

但对有具体硬性要求的，比如从头到尾理解一个数学题，最后给出正确答案（而不是差不多就行），或者写一段不那么简单，非基础的程序，可以跑起来并给出正确输出。它或许可以做到85%到90%，但是在理科任务里，很多事情，不是100%就等于0%，需要人工去纠正，修改。

哪怕是画画，如果是要画一张海报，但规定哪几个字必须以什么颜色出现，必须如何如何排版，第一个字母自必须黑体，背景必须是某个城市某个建筑，等等有硬性约束条件的。你去试试，它怎么画都满足不了你的条件。不是‘不好看’的问题，是客观上无法满足一些很简单，人类画家可以轻松做到的东西。这就是语言模型其模糊概率特性所决定的。

Google 最近推出的 AI Overview 给出让人从金门大桥跳下去的答案，也是同样原因。

当然我相信这些依靠一些工程上的技巧来局部优化，可以大大减少其模糊性，但无法做到完全杜绝, 这是LLM的先天不足。

最后，我认同我司首席AI科学家，图灵奖获得者杨乐坤（Yann LeCunn) 的观点：靠大语言模型（LLM）走向AGI （强人工智能）是一条死路。活路是创建一个对世界底层原理的知识库，从而进行推理的"世界知识模型"(world model). 换言之，要让AI “从小到大” （一生二，二生三，三生万物），而不是像现在那样“从大到小”去模仿。这也是李飞飞最近创业公司所做的事情。

等级三等兵

威望--

贴子83

魅力299

注册时间2022-08-28

zhshthd

查看全部

2024-05-30 22:51:35

回复 1楼 zhshthd 的帖子

别的不知道，但我感觉版上很多ID很容易被LLM代替。那些家长里短鸡毛蒜皮的裹脚布帖子，随便搞个模型训练一下，就能生成差不多风格的帖子，要发多少有多少。

还有那些垃圾网络文学，网络小说，玄幻小说什么的，应该也很容易用LLM生成

说难听了，就是越垃圾越没技术含量的东西越容易被AI代替。