|
Post by alhasan359 on Apr 18, 2024 5:18:13 GMT
人工智能数学准确性的下降引发了人们对在内容创建过程中使用该工具的质量和可靠性的质疑。 ChatGPT 的兴起及其最初的准确性 ChatGPT 是OpenAI开发的人工智能语言模型,最初彻底改变了数学问题解决领域。起初,它的准确率高达 98%,令人印象深刻。人们可以使用这个工具快速准确地求解复杂的方程,进行数值分析,并获得逐步的解释。 但这不仅仅是数学。以下是人们如何使用人工智能来协助各个行业的一些示例: 金融: 投资银行使用此工具生成详细的财务报告、分析市场趋势并预测股票波动。 学术界: 如果不违反学生行为准则,学生可以使用人工智能解决复杂的数学问题、撰写学术论文并参与科学讨论。 营销: 营销人员使用此工具来构思和告知内容创建过程。 客户支持: 公司使用此工具来更快、更高效地回答客户问题并解决问题。 数据分析: 企业使用人工智能来分析大型数据集并识别 哥斯达黎加移动数据 模式和趋势。 AI数学下降报价尽管存在这些用例,但一项 研究表明,98% 的数学准确率已骤降至 2%。 但为什么? 神秘的暴跌:研究结果 在我提到的研究中,研究人员发现 OpenAI 的 GPT-4 技术执行某些任务的能力可能会出现大幅波动。该研究考察了该模型的两个版本,一个是三月份的,一个是六月份的。 该研究指出,“作为一项规范研究,我们探索了这些 LLM(大型语言模型)确定给定整数是否为素数的能力的变化。我们专注于这项任务,因为它对人类来说很容易理解,同时仍然需要推理,类似于许多数学问题。” 3 月份,GPT-4 在 97.6% 的情况下正确识别出数字 17077 是素数。 然而,仅仅三个月后,它在这项任务上的准确率就骤降到了 2.4%。 与此同时,GPT-3.5 模型显示出相互矛盾的结果。 3 月份,GPT-3.5 能够将 17077 正确识别为素数,正确率仅为 7.4%。然而,到了 6 月份,其这项任务的准确率已提高到 86.8%。 研究人员将这种性能的剧烈波动归因于 GPT-4 的训练方式。它接受了海量文本和代码数据集的训练,包括数学问题。当 GPT-4 第一次训练时,它可以相对较好地学习解决数学问题。 然而,当它接触到更多数据时,它还会学习其他(有时是不准确的)东西。不幸的是,这种暴露可能会导致该工具忘记如何解决数学问题,或者更糟糕的是,学会错误地解决它们。 AI 数学下降调查结果引用研究人员得出结论:“我们的研究结果表明,GPT-3.5 和 GPT-4 的行为在相对较短的时间内发生了显着变化。这凸显了持续评估和评估法学硕士在生产应用中的行为的必要性。” 换句话说,GPT-4 对于解决数学问题尚不 可靠。
|
|