AI与物理
这篇文章是一位作者对ChatGPT的使用体验和技术的分析。首先,作者通过简单的测试了解了ChatGPT的基本性能。接着,详细介绍了ChatGPT的技术原理,包括Transformer Decoder、生成式、自回归、因果掩码和概率模型等。然后,作者阐述了ChatGPT的具体使用流程,包括采集人类标注的demo,监督式finetune pretrained GPT,训练reward model,以及使用RL提升SFT model。最后,对比了DeepMind和OpenAI的工作风格,认为两个机构的论文都很有价值。