为防止学生用ChatGPT作弊,大学教授开始恢复纸质考试或改用口试
AI与化学

为防止学生用ChatGPT作弊,大学教授开始恢复纸质考试或改用口试

为防止学生利用ChatGPT作弊,一些大学教授开始尝试恢复纸质考试或改用口试。然而,ChatGPT在多项测试中表现良好且难以识别,使得查重变得困难。一些学生甚至用ChatGPT编写作业,而教授们则面临着无法识别这些作弊行为的困境。尽管有些学生呼吁将ChatGPT用作学习工具,但在许多学校,教授们仍然明令禁止学生在考试中使用ChatGPT。
2023年中国银河专业交易策略公开赛半年度颁奖典礼:私募精英云集,科技赋能下的投资新时代
AI与数学

2023年中国银河专业交易策略公开赛半年度颁奖典礼:私募精英云集,科技赋能下的投资新时代

本文主要介绍了2023年中国银河专业交易策略公开赛半年度颁奖典礼的情况。在这场活动中,银河证券及其关联公司银河期货、朝阳永续展示了他们在私募投资领域的优秀表现,且其“星耀管理人”俱乐部成员数量有了显著增长。此外,银河证券推出了针对私募管理人的“星耀管理人”俱乐部,提供包括交易、运营、投研等多方面的服务。在科技领域,银河证券积极拥抱新技术,如人工智能助手ChatGPT在量化投资中的应用,以及大语言模型在期权定价模型中的作用。银河证券的私募服务新生态在不断建设和发展中,推动了机构投资者核心业务能力、科技创新能力和生态融合能力的提升。
字节版ChatGPT悄悄开放,免费无排队,抖音号手机号直接登
AI与数学

字节版ChatGPT悄悄开放,免费无排队,抖音号手机号直接登

克雷西 鱼羊 发自 凹非寺量子位 | 公众号 QbitAI 字节跳动版ChatGPT,现在人人可玩了! 网页版、安卓版和iOS版同步上线,用抖音账号、手机号和苹果账号都能登录。 并且无需排队,打开就能和这个名叫“豆包”的AI助手直接开聊。 是doubao.com不是douban.com噢~ 消息一出,已经有不少胖友第一时间前往围(tiao)观(xi)。 我们也抓紧实测了一波~ 与ChatGLM难分伯仲 先来看看豆包是怎么介绍自己的: 既然如此,我们就来试试这些“官方功能”靠不靠谱。 比如,我们挑选了几个有意思的错误机翻让豆包纠正,结果豆包给出的反馈还挺不错的: 尤其是“鸳鸯锅”的翻译,可以说是完胜Google和DeepL。 知识方面的话,当然要问一下“刁钻”的问题了 :雷公电母放出的电是直流电还是交流电。 豆包的这个回答,可以概括成“不是直流电,而是直流电”?,但前面说的还算可以吧。 抛开整活的话,豆包的开胃小菜的确给了我们一个不错的第一印象。 那么下面我们就上正餐——来拿它和备受好评的国产开源大模型ChatGLM进行一场大横评。 具体的内容包括文案创作、逻辑推理、数学和代码四个方面。 文案创作方面,豆包说自己会撰写知乎、小红书等各种风格的文案。 我们不妨整个奇葩点的东西,看看它能不能创作得出来,比如……豆汁美式的小红书笔记。 文案搭配着emoji,连Tag都有了,看来豆包真的是懂小红书的。 不过你确定“醇香甘甜”这个词是用来形容豆汁的吗…… ChatGLM虽然写了很多,但是没审清题,把豆汁直接当成了豆浆…… (这么一看,豆包可能也理解成豆浆了,但是人家没直接说成豆浆啊) 看来豆包是有一定创作能力的,所以不妨再加大难度。 直接让它给“豆汁美式”的宣传片写个短视频脚本。 ChatGLM的版本细节则要丰富些,不过豆包的版本也算是五脏俱全了。 两者的文案创作水平不相上下,那么逻辑推理能力又怎么样呢? 我们找来了一道推理题目,这道题两位选手都没能做对(正确答案是甲3乙1丙2): 虽然都没做对,但是豆包的思路好像在往正确的方向上走了。 而ChatGLM的解答,反正我是没看懂。 这一环节对两者的表现也是很难评价,那么,马上进入一众大模型的噩梦环节——数学。 简单如鸡兔同笼这样的问题就不测了,我们直接上难度,拿一道高考题给他们试试。 △2023北京卷第16题 (图片我们没有输入,但没有图片也能解题;第一问是证明,我们也去掉了) 豆包使用的是纯几何方法,最后的答案是正确的,但很遗憾过程不对。 △从红框开始出现错误 ChatGLM则使用了向量解法: 首先结果是错的,不过120倒是和60度互补,是出了些小问题吗? 但我们很快发现了华点:...
文章《WizardMath-70B-V1.0:一种提升大模型数学能力的强大方法》
AI与物理

文章《WizardMath-70B-V1.0:一种提升大模型数学能力的强大方法》

这篇文章介绍了微软与中国科学院共同发布的大模型 WizardMath-70B-V1.0 在两个数学基准测试中的优秀表现,其性能超过了多个开源模型,包括 ChatGPT 3.5、Claude Instant 1 和 PaLM 2 540B。该研究采用了 Reinforced Evol-Instruct 方法,并通过多种方式优化模型的性能。在未来的研究中,作者将继续探索更多的改进方向。