IBM的十六原则机器人大挑战,Dromedary打破神话,AI自对齐新纪元到来!
IBM和CMU合作研发的单峰骆驼模型Dromedary在多项测试中展现出高准确度,超越了Anthropic和GPT系列。它通过自我指示机制生成大量指令进行instruct-tuning,减少了潜在偏见,并遵循16原则来指导AI助理的回答,这一过程实现了极少量人类监督下的自对齐,相比之前的模型,如InstructGPT和Alpaca,Dromedary显著简化了标注需求,节省了5万条人工标签。这项研究对于提升AI伦理水平和减少AI胡说八道的问题有重要意义。



