ChatGPT 爱用破折号和擅长编程,这不是文科生和理科生的差别,更像是文科学习和理科学习的差别,当然实际上是两种不同类型内容生成的训练方式差别。 生成文本的结果是没有标准答案的,这就依赖于人类定义好的标准答案和反馈,偏好极其依赖于标注员标注的结果,就好比我们学文科,会依赖于我们阅读的教材和老师的讲解。 写代码和做数学题的特点是有标准答案,就好像我们学理科做数学物理,对就是对,错就是错,和人类偏好无关,做对了就有奖励,做错了就没有奖励,所以模型能反复训练,最终越来越厉害。
只需要几秒!
创建帐户
已拥有账号并想要登录?
登陆 忘记密码?