AI资讯站在时代最前沿

AI赋能科技创新:我国科技部和foundation启动“人工智能驱动的科学研究”专项部署工作
AI与物理

AI赋能科技创新:我国科技部和foundation启动“人工智能驱动的科学研究”专项部署工作

为响应我国《新一代人工智能发展规划》,科技的部门已启动“人工智能驱动的科学研究”专项部署工作,聚焦药物研发、基因研究等领域,同时推广6G技术,推进光伏发电产业发展。此外,先正达集团的上市审议会议被取消,可能是出于对市场稳定的考虑。而航天宏图的“宏图一号”分布式干涉SAR高分辨率遥感卫星星座也在太原卫星发射中心成功发射。不过,一些公司的减持行为引发了市场关注。
强化学习在对话模型中的应用:以ChatGPT为例
AI与物理

强化学习在对话模型中的应用:以ChatGPT为例

本文探讨了人类反馈强化学习(RLHF)在语言模型中的应用及优势,特别是在ChatGPT中的具体实践。RLHF通过结合强化学习和人类反馈,使语言模型在预训练阶段学习关于世界的一切,并在RLHF阶段专注于输出正确、有益的答案。具体而言,它分为三大步骤:1)用监督学习微调LLM;2)由人工评估员对答案进行排名,用于训练奖励模型;3)用近端策略优化(PPO)模型优化LLM的奖励模型。RLHF的技术和理念在很大程度上推动了ChatGPT的成功,而 Natasha Jaimes 的研究成果为其提供了理论支持。此外,Natasha 还关注社交强化学习领域,旨在提高 AI 智能体的学习、泛化、协作以及人机交互能力。
论:探究聊天AIChatGPT背后的原理与前景
AI与物理

论:探究聊天AIChatGPT背后的原理与前景

本文介绍了OpenAI新发布的聊天AI ChatGPT,这款基于GPT系列的大型语言模型在短短几天内用户量冲破百万级,引发了广泛关注。ChatGPT是一个专门用于对话交互的模型,其训练采用了无监督学习技术, large language models (LLMs) 可以生成更长的连贯文本序列,并且可以应对大规模的应急能力。然而,大型语言模型仍存在一些基本缺陷,如在需要常识、逻辑、规划、推理和其他知识的任务中无法预测。为了优化大型语言模型的表现,OpenAI 使用了人类反馈强化学习 (RLHF) 技术,将其应用于 InstructGPT,以提高其对用户指令的响应能力和减少有害输出。
ChatGPT:人工智能革命潮下的伦理挑战
AI与物理

ChatGPT:人工智能革命潮下的伦理挑战

去年11月,聊天机器人ChatGPT的诞生引发了全球关注。ChatGPT展现了强大的创作和学习能力,引来了各大公司的注意。然而,这也引发了对ChatGPT可能对人类学习和思考能力产生潜在影响的担忧。如今,ChatGPT的影响力不断扩大,资本也对ChatGPT背后的公司OpenAI抛出了橄榄枝。

AI论文助手超级助手