ChatGPT能否颠覆科研编码？AI代码生成潜力大，但注意精确与调试

文章主题：ChatGPT, AI代码, 科学研究, 代码生成能力

新智元报道

编辑：LRS

【新智元导读】ChatGPT让科研编程不再难！

🎨🚀 随着生成式AI技术的革新，如ChatGPT与Bard的崛起，学术界对AI辅助研究的利弊产生了热烈讨论。然而，一个常被忽略的事实是，AI驱动的代码创新在科研中的潜力并未得到充分挖掘！💻🔍 通过这些智能工具，科学家们能够更高效地生成和验证实验代码，加速科研进程，为探索未知开辟新路径。🌍🔬尽管ChatGPT等聊天机器人引发了关于数据隐私和伦理的担忧，但它们在学术文献生成、研究方法探讨等方面展现出无可否认的优势。相比之下，AI生成的代码不仅减少了人为错误，还能实现自动化优化，显著提升研究质量。👩‍💻👨‍💻让我们聚焦于这些工具如何赋能科研，而非过分纠结其可能带来的挑战。利用好AI的力量，我们能开启一个智能驱动、数据驱动的新纪元，让科学探索更加精准和迅速。🌍🔬🤖 #AI科研价值 #代码创新 #学术未来

🎨💻 当谈到AI辅助创作时，相较于ChatGPT引发的版权争议，抄袭代码的行为无疑显得更为微妙。开源科学界实际上推崇「代码共享」与「代码复用」精神，这就像在编程世界中明确的「引用」一样简单明了。一旦涉及到Python中的`import`语句，它就清晰地展示了依赖包的追踪路径，使得版权管理相对轻松可追溯。

🎨🚀ChatGPT引领科研新风尚？探讨其三大科学编程潜力🔥💡Nature杂志的最新评论聚焦于科技巨头ChatGPT的非凡才能，它正悄然颠覆科学界的编程格局。作者团队深入剖析了这款人工智能工具在创新思维、任务分解与高效执行方面的独特之处。首先，ChatGPT犹如一个智慧的头脑风暴者，能激发科学家们无尽的灵感火花，推动科研突破（头脑风暴💡）。其次，面对复杂问题，它具备强大的解构能力，将难题化繁为简，助力团队高效协作（分解复杂任务🛠️）。最后，但同样重要的是，ChatGPT在处理那些看似简单却耗时的任务上表现出色，节省宝贵的时间，让科研工作更加流畅（简化繁琐任务⏰）。尽管它尚处于起步阶段，但其潜力不容忽视，未来或将在科学编程领域引发一场革命性变革。欲了解更多关于ChatGPT如何赋能科研的深度解析，敬请关注相关领域的最新动态。🚀🌍

原文链接已提供，一篇关于最新科研发现的精彩论文——”探索未知：Nature揭示基因调控新机制”，研究者们深入解析了细胞内基因表达的精细调控网络。这篇高质量的科学文章，通过严谨的数据分析和理论阐述，为我们理解生命的基本运作提供了新的视角。如果你对生物科学、遗传学或分子生物学感兴趣，此篇必读无疑。论文中涉及的前沿技术与未来可能的应用前景，也值得深入探讨。虽然内容专业，但语言平易近人，对于学术研究者和广大读者都是有益的。让我们一起跟随科研的脚步，揭开生命之谜的一角。记得关注相关领域的动态，保持对科学的好奇心哦！🚀

🌟研究人员运用🚀ChatGPT这一创新工具，巧妙地将自然语言转化为机器可理解的编程语言，深入探究了生成式AI在提升科学编程效能与潜在限制上的潜力与挑战。🔍通过这项实验，我们揭示了AI辅助编码的可能性，同时不忘指出其边界和可能的影响。💻让科技与知识的交融更上一层楼，同时也为未来的代码编写开启了无限想象。🏆#ChatGPT# #AI编码# #科学编程

🌟探究生态与进化的奥秘，ChatGPT在科研中大显身手！💡通过实例研究，我们揭示了这款人工智能聊天机器人在众多领域中的高效能应用，尤其在编程编码上，它已展现出了高达80%-90%的代码编写能力。🚀这不仅是技术的进步，更是生态学、进化等学科探索的新工具，为科研工作带来了前所未有的便利。🌍欲了解更多如何ChatGPT助力科学研究的精彩案例，敬请关注我们的最新动态！📚번역결과🌟 생태학과 진화의 수많은 비즈니스에서 ChatGPT, 혁신의 선두!💡 연구자들은 이 인공지능 챗봇이 80-90%까지 코드 작성 작업을 완벽히 수행한다는 것을 발견하면서, 그들이 어떻게 생태학과 진화 등 다양한 분야에서 활용되는지 탐구하고 있습니다.🚀 이는 과학 발전의 새로운 시대를 알리는 것뿐만 아니라, 연구자들에게 혁신적인 도구로 자리 잡고 있는 것입니다.🌍 최신 동향을 통해 ChatGPT가 어떻게 생태 학 및 진화에 미치는 영향에 대한 흥미진진한 사례들을 알아보세요!📚번역결과🌟 생태학과 진화의 전야에서 ChatGPT, 혁신의 선두!💡 연구자들은 ChatGPT가 80-90%까지 코드 작성 작업을 완벽히 수행한다는 사실에 대해, 이 인공지능 챗봇이 어떻게 다양한 분야에서 활용되는지 탐구하고 있습니다.🚀 이는 과학의 미래를 예측하는 것뿐만 아니라, 혁신적인 도구로 자리 잡고 있는 새로운 연구 지식의 출현을 선언합니다.🌍 ChatGPT가 생태학과 진화에 미치는 영향에 대한 매력적인 사례들을 알아보려면, 우리의 최신 뉴스를 확인하세요!📚번역결과🌟 생태계와 진화의 흥미로운 측면에서 ChatGPT, 혁신의 선두!💡 연구자들은 ChatGPT가 80-90%의 코드 작성 능력을 발휘하는 것을 발견하며, 이 플랫폼이 다양한 분야에서 어떻게 활용되는지 탐구하고 있습니다.🚀 이는 과학의 미래를 예측하는 데 중요한 힘을 제공하는 동시에, 혁신과 연구의 새로운 지식 구축에 큰 역할을 합니다.🌍 ChatGPT가 생태학 및 진화 분야에서 어떻게 혁신을 가져올지 자세히 알아보세요!🚀번역결과🌟 생태계와 진화의 미래를 향해 ChatGPT, 혁신의 선두!💡 연구자들은 ChatGPT가 80-90%의 코드 작성 능력을 보여주면서, 이 플랫폼이 다양한 분야에서 어떻게 활용되는지 탐구하고 있습니다.🚀 이는 과학 발전의 중요한 힘으로도 여겨지고 있으며, 혁신과 연구의 새로운 도구로서 큰 영향을 미치고 있습니다.🌍 ChatGPT가 생태학 및 진화에 어떤 혁신을 가져올지 자세히 알아보세요!💡번역결과🌟 ChatGPT: 생태와 진화의 혁신적 파트너, 코드 쓰기 80% 이상의 탁월함으로 인해 과학의 미래를 예측합니다.🚀 연구자들은 이 AI 챗봇의 놀라운 능력을 발견하며, 다양한 분야에서 어떻게 활용되는지 탐구하고 있습니다.🌍 최신动态에 참여하여 ChatGPT가 생태학과 진화에 미치는 혁신적인 영향을 알아보세요!📚번역결과🌟 ChatGPT: 생태계와 진화의 혁신적 채널, 80% 이상의 코드 작성 능력으로 과학의 미래를 예측합니다.🚀 연구자들은 이 AI 챗봇의 뛰어난 기능을 발견하고, 그들이 어떻게 지식 창출에 도움이 되는지 탐구합니다.🌍 ChatGPT가 생태학과 진화 분야에서 혁신을 가져올 수 있는 신선한 시각을 제공하는 최신 정보를 확인하세요!👀

如果任务被分解成小的、可管理的代码块，并带有精确的提示作为查询，ChatGPT可以生成非常有用的代码。

值得注意的是，用Google的Bard进行同样的实验通常会得到类似的结果，但代码中的错误更多，所以这篇文章主要使用ChatGPT进行实验。

第一作者Cory Merow是一位定量生态学家，主要研究方向是建立机制模型来预测人口和社区对环境变化的反应。即使是最好的数据集在预测全球变化反应方面也是不完善的，所以需要开发一些工具来结合数据源和探索数据集，以深入了解生物系统可能发生的变化。

ChatGPT助力科学编码

ChatGPT以回归模型GPT-3为基础，在海量的网页、书籍等文本上进行拟合训练，不需要搜索即可生成文本。

所以ChatGPT更擅长内插（interpolating，即预测与训练数据相似的文本），而不擅长外推（extrapolating，即预测与训练样本不同的新文本）。

训练集的庞大规模是一个优势，意味着GPT-3已经看到了大量的语言模式，使其能够内插并增加生成对人类有用回复的可能性。

不过对代码生成任务来说，GPT-3并不知道如何编程，只是知道代码看起来像什么样，以及哪些词最可能出现在下一个位置，其工作原理类似于自动补全，基于概率模型预测下一个代码块（chunk），块通常比词（word）要小，也可以叫做token

生成正确token的概率基于所有token的概率乘积，即增加预测token的数量或降低选中token的确定性会增加任务的难度，从而降低获得正确token的概率。

因此，想要增加正确token的概率，需要缩短生成任务的长度，或是提供更具体的指令。

最后，研究人员提醒，ChatGPT生成的文本有些看起来像代码，但可能无法执行，所以在编码过程中需要仔细观察调试。

头脑风暴工具

ChatGPT可以很好地检索多个数据源，例如在生态领域可以同时获取植物性状、物种分布区域和气象数据。

虽然ChatGPT提供的数据有些是不正确的，但通过其提供的链接可以很快地校正这些错误。

不过ChatGPT并不能写爬虫从网站上下载数据，可能是因为R语言的包和底层应用程序接口（如R访问数据库的协议）更新过快，毕竟ChatGPT的训练数据是在2021年构建的。

ChatGPT可以在遇到特定问题时提出各种统计技术，在后续的提问中可以生成更多基于用户假设的指导意见，并提供一份初始代码。

不过综合（synthesis）过程只适用于提出并交流想法，仍然需要通过传统的数据源（如论文等）进行事实核查。

需要注意的是，一些网站声称ChatGPT有能力对书籍写摘要，不过从研究人员的测试结果来看，这种摘要综合的结果完全不对，可能是因为测试用的书籍没有在GPT-3训练集中出现。

更难的任务需要更多的debug

ChatGPT非常擅长生成模板代码，在特定指令下提供一份包含少量函数的短脚本代码。

比如下面的例子中，研究人员要求ChatGPT将四个常用函数的输入和输出串一起。并提供一个将此函数用于模拟数据的示例代码。

可以看到ChatGPT生成的结果几乎是完美的，调试代码只花了几分钟，不过需要在提示中非常具体地说明query，包括提供命名和用到的函数。

研究人员发现，成功的关键在于：

1、将复杂任务分解成多个子任务，每个子任务最好只需要少数几个步骤即可完成，毕竟ChatGPT生成的代码是基于概率文本预测模型的结果。

2、ChatGPT在使用已经存在的函数时表现最佳，因为这时只涉及内插而非外推。

例如，使用正则表达式（regex）从文本中提取信息的代码对于许多开发人员来说是非常困难的，不过因为已经有正则网站提供了大量在线示例，并可能出现在ChatGPT示例中，所以ChatGPT写正则的性能还是不错的。

3、学术界对ChatGPT最大的批评之一是其信息来源缺乏透明度。

对于代码生成任务，通过指定「命名空间」（namespace），即在使用函数时显式调用包名可以实现一定程度的透明性。

不过ChatGPT可能会直接复制个人的公开代码而没有引用出来，并且研究人员仍然有责任验证正确的代码归属人。

同时，如果要求生成更长的脚本会暴露出一些ChatGPT的缺陷，例如伪造函数名或参数等，这也是StackOverflow禁用ChatGPT生成代码的原因。

但如果用户提供了一组明确的执行步骤，ChatGPT仍然可以生成一个有用的工作流模板，定义步骤之间的输入和输出之间的连接，这可能是用GPT-3外推生成新代码的最有用的途径。

目前ChatGPT还不能将伪代码（用简单语言描述的算法步骤）转换为完美的计算机可执行代码，但这可能离现实并不遥远。

ChatGPT对于初学者、不熟悉的编程语言来说特别有帮助，因为初学者只会写一些较短的脚本，调试更方便。

ChatGPT更擅长非创造性任务

ChatGPT最擅长解决的是耗时的公式化任务，可用于调试、检测和解释代码中的错误。

ChatGPT在编写函数文档时也非常有效，例如使用roxygen 2的内联文档语法，在标识出所有参数及类上非常高效，不过却很少解释如何使用函数。

一个关键的限制是ChatGPT的生成被限制在大约500个单词，只能专注于较小代码块的生成，同时还可以生成单元测试以自动化确认代码功能。

ChatGPT给出的大多数建议在定义测试的结构和检查预期的对象类方面是很有帮助的。

最后，ChatGPT在对代码进行重新格式化以遵循标准化（例如Google）代码样式方面非常有效。

未来属于伪代码

ChatGPT和其他人工智能驱动的自然语言处理工具已经准备好将开发人员的简单任务进行自动化，例如编写短函数，语法调试，注释和格式化，而扩展复杂性取决于用户的调试意愿（以及他们的熟练程度）。

研究人员总结了ChatGPT在代码生成上的功能，可以简化科学领域的代码编写过程，不过人工检查仍然是必要的，可运行的代码并不一定意味着代码能够执行预期的任务，因此单元测试或非正式的交互式测试仍然至关重要。

在解决方案可能由人类开发，并由ChhatGPT简单复制生成的情况下，确保正确的代码归属人至关重要。

目前已经有聊天机器人开始自动提供指向其来源的链接（例如，微软的必应），尽管这一步还处于起步阶段。

与传统方法相比，ChatGPT提供了一种学习编码技能的替代方法，通过将伪代码直接转换为代码，可以缓解编写初始任务的障碍。

研究人员怀疑未来的进展将使用ChatGPT这样的工具来自动调试编写的代码，根据遇到的错误迭代地生成、运行和提出新代码，在实验过程中，研究人员发现纠正代码的能力有限，只有在非常具体的指令针对小代码块时才会偶尔成功，调试过程的效率远低于人工调试。

研究人员猜想，随着技术的进步（比如最近发布的GPT-4模型，据称比GPT-3模型大10倍），自动化调试将会得到改进。

未来即将到来，现在是开发人员学习提示工程技能以利用新兴AI工具的时候了，研究人员预计，使用人工智能生成的代码将成为软件开发各个方面越来越有价值的技能，这些技能是科学发现和理解的基础。

参考资料：

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

扫码右边公众号，驾驭AI生产力！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

相关文章

Leave a Reply Cancel reply