Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了282,855,902字

小细节

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
CS75 PLUS算是我今年最期待的车型了
```
想念一个人

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
长安CS75P还是很不错啊，身边的人评价都可以，我对新车很有信心
```
蝴蝶的翅膀

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
cs75plus口碑怎么样，网上随便一搜就能搜到，不用多说，看新车表现吧
```
飞天小牛

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
如果还是现在的价格，必入一辆！
```
幸福小胖珠

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
我买车主要看口碑，cs75plus口碑不错，新我肯定会去试驾的
```
a崽

在文章《比亚迪腾势 N7 车型推出限时优惠政策，2000 元可抵 5.2 万元》中回复：
```
哇！现在这个价格太顶了吧！赶紧入手！
```

野人霸霸

终于看到关注的车型，改款了，这波颜值，是我喜欢的，如果上市后的价格给力，就冲了，腾势这波改款真棒！

我是萌萌萌萌哒

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
从去年就开始关注，终于等到改款了，眼前一亮，颜值不错，期待上市价格
```

海绵小宝宝P

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：

希望将来公布的价格能给力一点，这次改款已经非常让我心动了，腾势还是懂车主的喜好的！

Wmx0819

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
改的好，改的秒，改的呱呱呱。N7大麦大麦大麦
```

该文章投稿至Nemo社区资讯板块复制链接

Chat-GPT 可以做数学吗

发布于 2023/02/09 18:16 170浏览 0回复 8,899字

翻译：蒋迅

译者注：本文试图说明 Chat-GPT 在数学证明领域里还有缺陷。所以下面除了最基本的问题外，Chat-GPT 给出的证明都是不正确的。请读者不要把这里的证明当作标准答案。

Chat-GPT 是 Open AI 发布的令人印象深刻的全新 AI 聊天机器人。它令人印象深刻的应用程序可以在整个互联网上找到。但它能做数学吗？

通过数学，我们并不意味着简单地做一些计算。它自己的设计确保了存在着它无法解决的计算问题。我更感兴趣的是它可否解决需要一些数学推理的问题。

为了选择我们的问题，我们使用了 MMLU 数据集。Meta AI 最近发布的大型语言模型 Galactica 在这个数据集上取得了一些不错的结果。他们的发现陈述在他们论文的第 5.3 节中。

接下来，我们将挑选几个问题，看看 Chat-GPT 如何处理它们。如果失败，我们将尝试改写这个问题以期获得部分结果。

我们注意到 MMLU 数据集有多项选择题，但我们只是将问题呈现给 Chat-GPT。我们只是从 MMLU 的抽象代数部分选择问题。之后，我们将刺激 Chat-GPT 以获得直觉和证明。在最后，我们将向数学家推荐 Chat-GPT 的一些应用。

问题一

我：乘法群中的逆是

Chat-GPT: 乘法群中的逆是。群中元素的逆元素是满足的元素，其中是该群的单位元。在这个群中，是单位元，所以元素的逆元素是满足的元素。

例如，的逆是，因为。同样，的逆是，因为。

注： Chat-GPT 完美地回答了这个问题并给出了极好的解释。公平地说，这是一个较简单的问题。

问题二

我：到有多少个同态？请以 latex 格式书写。

Chat-GPT: 有两个到的同态。它们的定义如下：

满足对于所有，成立

满足对于所有的 , 成立

注：同样，Chat-GPT 是正确的。但是，这个问题我问了几次，有一次说了，有一次说了却给出了错误的理由：

（整数）到（整数模 2）只有两个同态。

一个同态将每个整数映射到，另一个同态将每个整数映射到。

问题三

我：令中的 p = (1, 2, 5, 4)(2, 3)。在中找到 的指数。请用 latex 写下你的答案。

Chat-GPT:

在中的指数是中按字典顺序出现在 之前的元素数。

要找到 的指数，首先要确定 p 的循环类型。排列的循环类型是其不相交循环的长度列表，按降序排列。

p 的循环型是 [2,2]，因为 p 由一个 2-循环和一个 2-循环组成。

现在我们可以使用的循环指数来确定循环类型为 [2,2] 的 S_5 中的排列数。

的循环指数由下式给出：

其中是中循环的排列数，是表示长度为的循环的变量。

将循环类型 [2,2] 代入循环指数给出：

它简化为：

该表达式中的系数为，所以循环型为 [2,2] 的中的排列数为。

由于 是中唯一具有循环型 [2,2] 的排列，因此它是中的第排列。

因此， 在中的指数为。

注：哇！这是非常错误的！第一句话是完全错误的。还有，它最后的结论，连整数都不是，这肯定是不对的。事实上，子群的指数是有一定意义的，而且大多数是正整数。

不过，我们能够挽救一些东西。假设我们使用代数技巧计算出 的阶数为。然后我们可以使用以下提示 Chat-GPT。

我：现在假设是 5 阶子群。在中的指数是多少？

Chat-GPT: 群中子群的指数是在中的左陪集数。这也等于在中的右陪集数。

由于子群的阶数能整除群的阶数，因此的阶数必须除以的阶数，即 120。120 的小于 120 的因数只有 1, 2, 3, 4, 5, 6, 8, 10, 12, 15, 20, 24, 30, 40, 和 120。因此，的唯一可能顺序是 1, 2, 3, 4, 5, 6, 8, 10, 12, 15, 20 、24、30、40 和 120。

由于的阶数为 5，所以在中的指数为 24.

注：在这里，Chat-GPT 正确回答并给出了一个完美的解释。也许最好提一下所使用的主要事实是拉格朗日定理，尽管这可以很容易地通过问它“上面你使用了什么定理？”来获得。

但是直觉是什么？

使研究数学家伟大的是对问题的某种“直觉”。让我们看看 Chat-GPT 是否可以解释其中的任何一个。

我：你能解释一下柯西-施瓦茨不等式背后的直觉吗？请用 latex 写所述的数学公式。

Chat-GPT: 当然！柯西-施瓦茨不等式是一个有用的不等式，出现在数学的各个领域，例如向量代数、内积空间和概率论。它指出对于任意两个向量和，以下不等式成立：

Chat-GPT 可以做数学吗

直觉上，柯西-施瓦茨不等式指出两个向量和的内积由向量和的长度“控制”。要了解这一点，让我们考虑和是单位向量（即长度为 1 的向量）的特殊情况。在这种情况下，不等式变为：

这意味着和的内积总是小于或等于 1。这与我们的直觉一致，即如果两个单位向量“正交”（即垂直），则它们的内积应该“小”，并且如果它们“平行”（即指向同一方向），则为“大”。

我希望这有所帮助！如果你有任何问题，请告诉我。

注：这还算不错，但肯定可以改进。例如，解释什么时候柯西-施瓦茨不等式何时成立（当一个向量是另一向量的倍数时）有助于给出最后一段更精确的含义。人们可以看到陶哲轩这篇博客文章的前几段，以了解来自世界领先数学家之一的解释。此外，这是 Stackexchange 上关于该主题的数学讨论。

给出证明。

我：你能证明这个吗？

Chat-GPT: 当然！这是柯西-施瓦茨不等式的证明：

首先，我们可以将不等式重写为：

接下来，我们可以如下展开左侧：

此式简化为：

Chat-GPT 可以做数学吗

现在，我们可以将算术-几何平均不等式应用于右侧的每一项：

Chat-GPT 可以做数学吗

这简化为：

Chat-GPT 可以做数学吗

最后，我们可以再次将算术几何平均不等式应用于右侧的项：

Chat-GPT 可以做数学吗

这简化为：

Chat-GPT 可以做数学吗

我们完成了！这就完成了柯西-施瓦茨不等式的证明。

我希望这个能有所帮助！如果你有任何问题，请告诉我。

注：不幸的是，这个证明并不完全正确。无论是证明方法还是细节（即它对 AM-GM 的应用）都存在严重缺陷。

结论

老实说，Chat-GPT 对于一个无论如何都不是为数学量身定做的模型来说是相当令人印象深刻的。我认为，以目前的格式，它已经可以帮助数学家准备讲义甚至论文中更简单的部分。也许它最大的用处在于自动处理基金和工作申请的某些部分。

本文来自微信公众号：遇见数学（ID：meetmath），作者：George Shakan

本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/672/334.htm]

本文标签
数学 chatgpt

上一个文章：国美电器多个破产申请被驳回，苏泊尔在列

下一个文章：中国信通院“全球网测”App iOS 版上线：拥有宽带测速、上网体验和网络诊断等功能

点了个评

Echo

最近回复

Chat-GPT 可以做数学吗

问题一

问题二

问题三

但是直觉是什么？

给出证明。

结论

点击排行

没有找到这位爷的热门文章哦~

最新文章

索尼《地平线零之曙光》宣布 5 月 31 日登陆腾讯 WeGame 平台

在线内容难逃“短命”结局：研究发现 2013 年的网页有 38% 当前已无法访问

库洛开放世界动作游戏《鸣潮》公测 PV 发布：5 月 23 日公测、5 月 21 日开启预下载

《黑神话：悟空》主创谈心路历程：先“装成”，直到真正“变成”

Machdyne 推出寿命可达 200 年的 Blaustahl FRAM U 盘：容量仅 8KB，售价 29.95 欧元

消息称微软即将推出 Windows 11 新默认壁纸，采用 Copilot 配色

《黑神话：悟空》售价揭晓：简体中文PC标准版268元

经历“行业寒冬”后，单枪匹马做游戏是否还可行？

3199 元，Bose“史上最大”手提音箱 SoundLink Max 今日开启预售

骨干网光通信的最新趋势