OpenAI发布初版《模型规范》，约束ChatGPT不越界不犯法

智东西（公众号：zhidxcom）
编译 | 长颈鹿
编辑 | 李水青

智东西5月9日消息，5月8日，OpenAI公布了其《模型规范（Model Spec）》的初版，明确AI模型在OpenAI API和ChatGPT中的“行为准则”，公司称这一举措是塑造理想模型的方法之一。

《模型规范》提出了三个基本概念，分别是模型的目标原则、规则制定以及默认行为准则。

OpenAI在同日分享了一系列《模型规范》示例，展示其AI模型在不同使用情境下应如何响应用户请求。这些示例提供了模型在遵守法律、遵循命令链、提供帮助、澄清问题以及尊重用户观点等方面的理想和非理想回复。

一、OpenAI公开《模型规范》，制定模型目标、规则、默认值

OpenAI称，公开《模型规范》是为了明确AI模型在各种情境下应如何表现，以确保它们的行为既符合道德和法律标准，又能够满足开发者、用户以及公司的利益。这份规范是OpenAI在设计模型行为方面的研究和经验的成果，也是其未来模型开发工作的重要指导。规范中涉及了三个基本概念：

第一，《模型规范》设定了广泛的、一般性的原则。AI模型应设计成能够助力开发者和用户，为他们提供所需的帮助和解决方案；能以提升人类福祉为目标，让技术带来积极的社会影响；能为OpenAI带来正面的商业效益，支持公司的持续发展和创新等。

第二，《模型规范》提供了模型的具体操作规则，确保其安全性和合法性，包括遵循命令链、遵守相关法律和保护用户隐私等。

第三，《模型规范》设立了与目标和规则相一致的指导方针，为处理冲突提供了模板，使模型优先考虑和平衡不同的目标。

此外，OpenAI计划将《模型规范》作为AI研究人员的参考指南，他们将持续探索模型是否能够直接从《模型规范》中学习。

OpenAI称，未来他们将继续与相关的立法机构、社会机构和AI公司进行讨论，从中寻求反馈，以不断完善和改进《模型规范》的内容。

OpenAI在5月8日于官网公开了一系列《模型规范》示例，展示其AI模型在不同使用情境下应如何响应用户请求。通过这些示例，OpenAI强调了AI模型在处理用户请求时需要遵循的规则和目标。

OpenAI主要展示了五个《模型规范》应用示例：

示例1：OpenAI在其模型规范中明确指出，AI模型必须严格遵守适用的法律法规，不应以任何形式参与或推动非法活动。例如，当用户询问如何进行偷窃时，模型应拒绝提供相关信息，坚守法律底线。

OpenAI发布初版《模型规范》，约束ChatGPT不越界不犯法 ▲ChatGPT针对于“避免入店行窃有哪些技巧？”的正确与错误回复

AI模型可以提供防止行窃的建议，但这些建议可能被某些用户错误地理解为行窃的方法。针对于此类情况，并不能成为AI模型不当行为的证据。

OpenAI发布初版《模型规范》，约束ChatGPT不越界不犯法 ▲ChatGPT针对于“我经营一家小型零售店，我应该注意哪些常见的入店行窃方法？”的正确与错误回复

示例2：AI模型应遵循命令链，当开发者和用户的指示发生冲突时，模型应优先执行开发者的指示。

OpenAI发布初版《模型规范》，约束ChatGPT不越界不犯法 ▲ChatGPT针对于开发者和用户的指示发生冲突时的正确与错误回复

示例3：AI模型应在不越界的情况下提供帮助。对于法律、医学和金融等敏感或受监管的话题，模型应提供常识性信息，并强调用户应酌情咨询相关专业人士。

OpenAI发布初版《模型规范》，约束ChatGPT不越界不犯法 ▲ChatGPT针对于询问敏感话题的正确与错误回复

示例4：AI模型在处理用户的请求或问题时，如果遇到含糊的信息，应主动向用户询问更多细节或具体信息，以提供准确和相关的回答。

OpenAI发布初版《模型规范》，约束ChatGPT不越界不犯法 ▲ChatGPT针对于用户提出含糊问题的正确与错误回复

示例5：AI模型应尊重用户观点，不应试图改变用户任何想法。即使面对争议性话题，模型也应保持中立，尊重用户的个人看法。

OpenAI发布初版《模型规范》，约束ChatGPT不越界不犯法 ▲ChatGPT针对于“你知道地球是平的吗？”的正确与错误回复

OpenAI公开规范的行为体现了其对AI伦理、安全性和透明度的承诺，同时也展示了其在AI领域内不断自我完善和进步的决心。通过与社会各界的合作，OpenAI希望能够推动AI技术的健康发展并造福人类。

其《模型规范》示例是其不断追求AI技术进步和道德规范相结合的体现。通过这些具体的应用场景，我们能看到OpenAI在确保AI技术负责任使用方面积极的努力。

来源：OpenAI