显示热门

深色模式

字体大小|

搜索
ADVERTISEMENT
返回
  • 浏览过的版块

12
ADVERTISEMENT
Huaren
等级中士
威望1
贴子1150
魅力1448
注册时间2007-04-16

cocolili

只看楼主

这ChatGPT 是不是不太靠谱呀?

1433

10

2024-11-17 13:44:42

以前用它主要是修改文字,还不错。


前一段要修改一下同事十几年前的非常简单的小程序,用chatgpt也还行。


公司AI的网课,最后有个小考,用ChatGPT 只得了71分,勉强pass。记得有一题是存储介质,好几个选项,其中有个手写记事本,它也帮我选了


前两天,用它咨询新币转美金/人民币和转出的事,就出状况了。反正银行转都不好,wise, ofx等网上的这些好,说ofx 大额不收费,但汇率不太好。 wise 收费,汇率好。我让它给出汇率,竟然ofx的比wise的好?没有细查真正的汇率,就是觉得自相矛盾。


然后问它能不能拿外币个人支票,直接存成外币在国内银行的外币户头?很多年前存过,没有问题,也很简单,就是时间长,国内银行收个手续费,当时是200人民币左右。它回答可以,但很复杂,要填表,审批啥的。我说以前不用呀,然后它改口说你说的对,不用填表和审批。


昨天它推荐了两个附近已经关门的staples 商店给我,我说它们已经关门了,它又说,你说得对



Huaren
等级一等兵
威望--
贴子549
魅力612
注册时间2012-05-13

bugsamend

只看他

2024-11-17 13:58:06

写程序这个我感觉是这样:Chatgpt就像是一个和我水平差不太多的对象,需要来回沟通才能把事情做对。比如我想让Chatgpt写一个程序,要想正确那我自己首先要知道这个程序的逻辑,以及正确的写法,GPT只是帮我实现这个code的工具。就像我想计算12348*87662,我是知道怎么算的。但是我有计算器,计算器可以帮我节约时间。GPT就像是那个计算器。


然后如果程序实施起来结果是正确的,但是如果想大规模应用还是有点慢,我就逐条看一下它的语句,告诉它有些地方不efficieint, 在不改变运行结果的情况下帮我优化一下,它也是可以做到的。


关于汇率这些实时变化的东西,它一般就不是很灵。说白了就是它不能迅速帮我们做一个预测:哪个选择经济上最划算。否则的话我们用GPT套利,挣点小钱不久太容易了吗:D. 如果很多人都问他这个问题,这种小的‘划算’的空间会立马变小,GPT应该也是很难跟上这个变化的。

Huaren
等级一等兵
威望--
贴子561
魅力581
注册时间2008-10-14

dpg

只看他

2024-11-17 14:08:01

关键是ChatGPT一本正经地胡说八道,要是使用者没有这方面基础,的确会误事。

Huaren
等级中尉
威望2
贴子2330
魅力2409
注册时间2010-06-25

MegMegMeg

只看他

2024-11-17 14:12:49

这就是常见的ai hallucination嘛,俗称一本正经地胡说八道。其实就把llm当成一个懂王就行了,说的话有些可取,但不能100%全信,尤其是细分专业上的问题,懂王经常胡说八道。gpt-4以后的版本和google都会给answer列出source,你可以自己verify一下,这个还是省了一些查找source的时间。

Huaren
等级大校
威望26
贴子21651
魅力29352
注册时间2007-09-09

pineappletin

只看他

2024-11-17 14:15:47

我每次考试用chatgpt,正确率都是75%左右

Huaren
等级二等兵
威望--
贴子237
魅力237
注册时间2024-07-15

Wugelvshi2

只看他

2024-11-17 14:18:04

回复 1楼 cocolili 的帖子


这太正常了。说明他更像个人了。


你在这论坛上问问题,网友的回答,比这个更是胡说八道。Chatgpt 也学会了。我现在特别相信,那个transformer 模型和人脑差不多,我们很有可能模拟出了上帝创造或者自然进化的人脑思维过程。人根据自身历史经验而能回答的问题,它都能回答。但哪怕就是爱因斯坦,也会在某些事情上胡说八道。所以防着GPT,也是应该的。


至于关门的staples,你也知道GPT是个train的模型,总有个时间差的。它不可能知道它没见过的东西。如果它能预测未来,那是超能力或者神棍,不是GPT。



Huaren
等级大校
威望35
贴子28484
魅力33991
注册时间2010-05-04

Confuse

只看他

2024-11-17 14:40:07

我觉得拿它做个书的summery,写的煞有介事,但是不仅归纳的不怎么靠谱,细看有的话都不知哪里来的。现在不敢了。

Huaren
等级少尉
威望2
贴子1617
魅力1631
注册时间2022-10-06

lendingclubs

只看他

2024-11-17 14:43:11

他就是一个统计归纳,完全不会思考,不是真正意义上的人工智能,比较蠢且会瞎掰,与有些老印很像

Huaren
等级少校
威望3
贴子3003
魅力3612
注册时间2022-01-16

aegeanboat

只看他

2024-11-17 14:51:11

现在还有人认为ChatGPT靠谱?
ADVERTISEMENT
Huaren
等级大校
威望55
贴子44230
魅力49850
注册时间2017-05-30

mindstorm

只看他

2024-11-17 15:02:14

chatgpt, 其实是COPYGPT.

初始化编辑器...

到底了