大语言模型的涌现现象与能力分析
大语言模型 scale 提升引发了新的能力涌现,如类比推理、自主决策等。Google、Stanford、DeepMind 等团队合作的研究发现,大语言模型的涌现能力遵循从简单到复杂、从具体到抽象的规律。为应对能力涌现,研究人员提出了一系列模型设计和训练策略,例如 Chinchilla 和 LLaMA 等 "小" 模型,以及 Google 发布的 PaLM 等超大型模型。此外,基于人类反馈的 fine-tuning 策略也被证明有助于保持大语言模型与人类意图的一致性。



