cocolili
这ChatGPT 是不是不太靠谱呀?
1193
10
2024-11-17 13:44:42
以前用它主要是修改文字,还不错。
前一段要修改一下同事十几年前的非常简单的小程序,用chatgpt也还行。
公司AI的网课,最后有个小考,用ChatGPT 只得了71分,勉强pass。记得有一题是存储介质,好几个选项,其中有个手写记事本,它也帮我选了。
前两天,用它咨询新币转美金/人民币和转出的事,就出状况了。反正银行转都不好,wise, ofx等网上的这些好,说ofx 大额不收费,但汇率不太好。 wise 收费,汇率好。我让它给出汇率,竟然ofx的比wise的好?没有细查真正的汇率,就是觉得自相矛盾。
然后问它能不能拿外币个人支票,直接存成外币在国内银行的外币户头?很多年前存过,没有问题,也很简单,就是时间长,国内银行收个手续费,当时是200人民币左右。它回答可以,但很复杂,要填表,审批啥的。我说以前不用呀,然后它改口说你说的对,不用填表和审批。
昨天它推荐了两个附近已经关门的staples 商店给我,我说它们已经关门了,它又说,你说得对
写程序这个我感觉是这样:Chatgpt就像是一个和我水平差不太多的对象,需要来回沟通才能把事情做对。比如我想让Chatgpt写一个程序,要想正确那我自己首先要知道这个程序的逻辑,以及正确的写法,GPT只是帮我实现这个code的工具。就像我想计算12348*87662,我是知道怎么算的。但是我有计算器,计算器可以帮我节约时间。GPT就像是那个计算器。
然后如果程序实施起来结果是正确的,但是如果想大规模应用还是有点慢,我就逐条看一下它的语句,告诉它有些地方不efficieint, 在不改变运行结果的情况下帮我优化一下,它也是可以做到的。
关于汇率这些实时变化的东西,它一般就不是很灵。说白了就是它不能迅速帮我们做一个预测:哪个选择经济上最划算。否则的话我们用GPT套利,挣点小钱不久太容易了吗:D. 如果很多人都问他这个问题,这种小的‘划算’的空间会立马变小,GPT应该也是很难跟上这个变化的。
关键是ChatGPT一本正经地胡说八道,要是使用者没有这方面基础,的确会误事。
这就是常见的ai hallucination嘛,俗称一本正经地胡说八道。其实就把llm当成一个懂王就行了,说的话有些可取,但不能100%全信,尤其是细分专业上的问题,懂王经常胡说八道。gpt-4以后的版本和google都会给answer列出source,你可以自己verify一下,这个还是省了一些查找source的时间。
我每次考试用chatgpt,正确率都是75%左右
回复 1楼 cocolili 的帖子
这太正常了。说明他更像个人了。
你在这论坛上问问题,网友的回答,比这个更是胡说八道。Chatgpt 也学会了。我现在特别相信,那个transformer 模型和人脑差不多,我们很有可能模拟出了上帝创造或者自然进化的人脑思维过程。人根据自身历史经验而能回答的问题,它都能回答。但哪怕就是爱因斯坦,也会在某些事情上胡说八道。所以防着GPT,也是应该的。
至于关门的staples,你也知道GPT是个train的模型,总有个时间差的。它不可能知道它没见过的东西。如果它能预测未来,那是超能力或者神棍,不是GPT。
我觉得拿它做个书的summery,写的煞有介事,但是不仅归纳的不怎么靠谱,细看有的话都不知哪里来的。现在不敢了。
他就是一个统计归纳,完全不会思考,不是真正意义上的人工智能,比较蠢且会瞎掰,与有些老印很像
chatgpt, 其实是COPYGPT.
到底了
Hot Deals
All Deals