OpenAI不藏着了，开放微调功能，不用其他工具就能搞一个你自己的ChatGPT

作者

｜

李欣帅

邮箱

｜

[email protected]

8月23日，OpenAI宣布推出基于GPT-3.5 Turbo的微调功能并更新API，让企业、开发人员能够使用自身数据定制ChatGPT。

微调（Fine-tuning）是一种利用已有通用语言模型（如GPT-3.5）来训练一个特定模型的方法。通用语言模型虽然具有很强的语言理解和生成能力，但是它们并不针对特定的领域或任务。通过在自己数据上对通用模型进行微调优化，训练一个专属模型，可以更好地适应特定的使用场景。在保留通用语言模型强大能力的同时，进一步提高模型的准确度等效果和效率。

这就相当于在一个已经建好的房子上进行装修，使其更符合自己的需求和喜好，而不是从头开始建造一个新房子。因此，可以节省大量时间和资源，也可以避免一些技术难题。

OpenAI此次推出的微调功能，使更多开发者能参与到GPT模型应用当中，并借此实现更多个性化和创新的应用场景，提高用户体验和粘性，这对开发者生态的建立也起到了积极的助推作用。同时也极大拓展了通用模型的应用范围和潜力，加快了各行各业部署AI技术的步伐。

对于此次公告中提到的GPT-3.5 Turbo微调的安全性、使用效果、价格、未来更新、部署步骤等方面，重点说明如下。

安全性：从微调API发送的数据归客户所有，OpenAI或任何其他组织不会使用数据来训练模型。同时，为了保障模型部署的安全，OpenAI通过审核API和GPT-4驱动的审核系统，检测与安全标准冲突的有害数据。（微调有利于为用户提供更具个性化的服务，但也降低了技术门槛，可能导致不负责任的使用）

微调效果：在实际测试过程中，GPT-3.5 Turbo的微调版本在某些任务上，与基本型号的GPT-4能力相当甚至要更好。微调客户能够提高常见用例的模型性能，并缩短提示时间。通过对模型本身的指令进行微调，还可加快API调用并降低成本，提示词数量减少了90%。

价格和Token：GPT-3.5 Turbo的微调成本分为初始训练成本和使用成本两部分。一个包含100K tokens训练文件的微调工作，预计成本为2.4美元。具体来说：

训练：$0.008 / 1K tokens；
使用输入：$0.012 / 1K tokens；
使用输出：$0.016 / 1K tokens。

可处理的上下文为4K tokens，是之前微调模型的两倍。

微调步骤：只需经过准备数据、上传文件、创建微调作业、使用微调模型四步。一旦模型完成微调过程，就可以立即在生产中使用。

未来更新：GPT-4 的微调将于今年秋天推出，而在秋季晚些时候会推出对GPT-3.5函数调用和16k上下文的微调支持。不久的将来还会推出微调UI，可更容易访问正在进行的微调作业等有关信息。

GPT-3迭代：OpenAI现在正在提供babbage-002和davinci-002型号作为GPT-3基础模型或微调模型。最初的GPT-3基础型号（ada、babbage、curie、davinci）将于2024年1月4日关闭。

总结来说，通过开放先进大模型的微调功能，OpenAI能吸引更多企业和开发者使用其平台和模型，从而扩大影响力和增加营收缓解亏损压力。这有助于AI产品得到更广泛应用，推动大模型加速落地。

同时，此次功能更新，也可看作是对Meta开源模型并允许商用等外部竞争的一个应对举措。通过允许微调模型，OpenAI可以进一步扩大和巩固用户基础，确保自身在行业的引领地位。这或许也会促使其他企业加快商业化步伐，行业竞争进一步加剧。

以下为OpenAI公告全文：

GPT-3.5 Turbo 的微调现已推出，GPT-4 的微调将于今年秋天推出。此更新使开发人员能够自定义更适合其用例的模型，并大规模运行这些自定义模型。早期的测试表明，GPT-3.5 Turbo的微调版本可以在某些垂直的任务上与基础的GPT-4功能相当，甚至要更好。与我们所有的API一样，从微调API发送的数据归客户所有，并且未被 OpenAI 使用或任何其他组织来训练其他模型。

微调用例

自 GPT-3.5 Turbo 发布以来，开发人员和企业要求能够自定义模型，以便为其用户创造独特且差异化的体验。通过此次发布，开发人员现在可以运行监督微调，以使该模型在其用例中表现更好。

在我们的私人测试版中，微调客户已经能够有效地提高常见用例的模型性能，举例来说：

改进的可操纵性：微调允许企业使模型更好地遵循指令，例如使输出简洁或始终以给定语言响应。例如，开发人员可以使用微调来确保模型始终按要求以德语响应。

可靠的输出格式：微调可提高模型一致格式化响应的能力，这对于需要特定响应格式（例如代码完成或撰写 API 调用）的应用程序来说至关重要。开发人员可以使用微调来更可靠地将用户提示转换为可与自己的系统一起使用的高质量 JSON 代码段。

自定义风格：微调是磨练模型输出定性感觉的好方法，具有可识别品牌风格的企业可以使用微调来使模型与其基调更加一致。

除了提高性能外，微调还使企业能够缩短提示时间，同时确保类似的性能。使用 GPT-3.5-Turbo 进行微调也可以处理 4K tokens——是我们之前微调模型的两倍。早期的测试人员通过将指令微调到模型本身，加快了每次 API 调用并降低成本，将提示大小减少了多达 90%。

当与其他技术如提示工程、信息检索和函数调用相结合时，微调的效果是最强大的。对这方面若想了解更多可查看我们的微调指南。另外，对函数调用和GPT-3.5-turbo-16k的微调支持将在今年秋季晚些时候进行。

微调步骤

我们还将在不久的将来推出微调 UI，这将使开发人员更容易访问正在进行的微调作业、已完成的模型快照等有关信息。

安全

对我们来说，安全地部署微调是非常重要的。为了在微调过程中保留默认模型的安全功能，微调训练数据将通过我们的审核API和GPT-4支持的审核系统，以检测与我们的安全标准冲突的不安全训练数据。

定价

微调成本分为两类：初始训练成本和使用成本。训练：$0.008 / 1K tokens；使用输入：$0.012 / 1K tokens；使用输出：$0.016 / 1K tokens。例如，用100,000个tokens进行微调工作，预计成本为2.40美元。

更新的 GPT-3 型号

今年7月，我们宣布原始 GPT-3 基本型号将于2024年1月4日关闭。今天，我们正在制造这些模型的替代品，无论是作为基本模型还是微调模型。这些模型可以使用我们新的 API 端点进行微调。基本和微调的 GPT-3 型号的定价如下：

新的端点提供了分页和更多的可扩展性，以支持微调 API 的未来发展，过渡到更新的端点也非常简单，更多详细信息可参见我们的微调指南。

*更多详细内容可参考OpenAI官网：

https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates

品玩招聘作者，资深作者及编辑，并长期开放实习生招聘。

世界不平静，我们希望在变动的技术周期和商业周期里继续我们的探索，不熄灭眼里的光。

为了和更多个优秀的你一起记录和改变这个激动人心的时代，做更多有价值的报道，品玩现开放招聘。

岗位信息：全职：4人。实习生长期招聘。工作地点：北京。

一句话总结我们在招聘的岗位的工作内容，就是：

报道最重要的商业和技术新闻，并抽丝剥茧地解释给读者它们为什么重要。

一些共同的岗位要求：

1. 尊重常识。

2.对好内容有感知，有选题发明能力。

3.掌握快速搜索梳理信息的方法，有较强的文献阅读能力，能独立拓展相关资源。

4 英文流利。有阅读英文内容的习惯，可以用英文完成沟通。

5.对真实世界有感知，心智成熟，有职业精神，沟通界面良好稳定。

在招岗位：

-新经济作者、新技术作者

新经济作者负责报道互联网商业领域最新动态；新技术作者负责报道新技术领域（AI，芯片，机器人等）最新动态；

追踪钱的流动，人的变化，商业世界的竞争与合作以及科技的变革，并把它们讲述给我们的读者；

不限工作经验，不限专业背景，我们欢迎不同背景的候选人。

-资深作者/编辑

对互联网商业领域或新技术领域有自己的研究和积累；

有自己获取信息的方法体系，有持续学习的能力；

能发明选题，撰写深度文章，同时也可以辅导初级作者。

长期招募实习生

我们为实习生提供与全职同样的指导与工作支持，并提供留用机会。

或者，以上的描述都不能定义你，但你认为你是我们需要的那个人，也可以发邮件给我们，介绍你自己。

以上岗位应聘者，请将简历及作品发送至：[email protected] 。（请标明应聘岗位）

同时，我们也在招聘其他岗位：

运营部门

岗位信息：全职：3人。实习生长期招聘。工作地点：北京。

内容运营

能够敏锐的捕捉互联网热点，并将其转化为出色的内容；

富有创新意识和强烈的主观能动性，重视流量在工作中的重要性；

有自己独特的数据分析方法论，能发现庞杂数据中的关键点，并反哺内容创作。

视频运营

具备视频的全流程的创作能力；

对各个内容平台均有深刻理解，能抓住平台规则红利；

有自己独特的数据分析方法论，能发现庞杂数据中的关键点，并反哺内容创作。

社区运营

有过国内外成熟知名社区的运营经验；

能够独立承担运营策略、节奏设计，结合运营目标、节点资源等因素制定精细化的社区运营规划；

对UGC的热点、流行趋势、话语体系有充分理解，能够通过创意、热点玩法、活动策划激发UGC参与。

长期招募实习生

我们为实习生提供与全职同样的指导与工作支持，并提供留用机会。

运营岗位应聘者，请将简历及作品发送至：[email protected] 。（请标明应聘岗位）

商务部门

销售总监/高级销售经理

岗位职责：

1. 负责品玩线上广告、线下活动类、品牌营销、市场公关、以及定制方案的商务拓展与销售工作，通过对目标行业客户的销售完成指定收入目标；

2. 对目标行业客户进行研究、识别、接洽、需求、分析、产品演示、方案规划、谈判与签约；

3. 管理与维护指定客户(包括新客户与现有客户)，提供优秀的售前与售后服务，建立长期、稳定的合作关系，对客户产品和需求进行持续性的研究与开发；

4. 与各部门保持紧密合作，回馈客户需求与最新行业动向，协助优化产品与服务；

5. 积极参加行业商务与社交活动，拓展人脉资源，持续了解与提升行业知识和洞察力

任职要求：

1. 互联网销售经验2年以上，销售经验5年以上优先;

2. 做事严谨、细心，较强的沟通协调能力;

3. 有市场营销、品牌方或者市场公关乙方工作经历优先；

4. 自我驱动，有很强的学习行业知识及专业知识的能力；

5. 具备应变能力，团队协作能力，能适应多任务处理及工作压力；

6. 拥有intel、华为、华为云、阿里、阿里云、高通等互联网行业直客资源者优先。

更多招聘信息，可以进入官网招聘页面获取。

期待品玩有你的加入。

· 文章版权归品玩所有，未经授权不得转载。

· 发送关键词转载、合作、招聘到品玩微信公众号，获得相应信息。

· 您亦可在微博、知乎、今日头条、百家号上关注我们。

继续阅读

阅读原文