解决GPT-3.5 API生成无关代码的问题：优化模型选择与提示工程

心靈之曲

发布时间：2025-09-28 12:30:01

214人浏览过

来源于php中文网

原创

解决GPT-3.5 API生成无关代码的问题：优化模型选择与提示工程

在使用GPT-3.5 API构建应用时，text-davinci-003模型有时会生成不相关或意外的代码片段，尤其是在处理代码或复杂对话任务时。本文旨在解决这一问题，核心在于强调模型选择的重要性，推荐使用更适合此类任务的指令遵循模型（如gpt-3.5-turbo或gpt-4），并深入探讨如何通过精细的提示工程来引导AI输出，从而提升生成内容的准确性和相关性，避免无关信息的干扰。

理解问题：text-davinci-003生成无关代码的根源

开发者在使用openai的text-davinci-003模型构建gpt克隆应用时，可能会遇到模型在正常对话中突然插入与上下文无关的代码片段（例如java代码）的情况。这通常发生在模型被用于生成代码、调试或作为通用聊天机器人时。尽管text-davinci-003是一个功能强大的通用文本补全模型，但它并非专门为严格遵循指令或复杂的代码生成任务而优化，尤其是在与更现代的指令遵循模型（如gpt-3.5-turbo和gpt-4）相比时。

text-davinci-003是一个基础模型，它通过预测下一个最可能的词来完成文本。当输入提示不够清晰或模型内部权重在训练数据中遇到大量代码示例时，它可能会“误解”意图，并生成它认为最符合“完成”任务的文本，即使那是一段不相关的代码。此外，它缺乏像新一代模型那样对角色和对话历史的内在理解。

解决方案一：模型选择与迁移

解决此问题的首要且最有效的方法是选择更适合任务的模型。text-davinci-003是OpenAI的旧版Completion API模型，而目前推荐用于聊天和大部分通用任务的是Chat Completion API，它使用gpt-3.5-turbo或gpt-4等模型。这些模型经过指令微调，更擅长理解和遵循用户指令，并能更好地维护对话上下文。

为何选择gpt-3.5-turbo或gpt-4？

指令遵循能力更强： 这些模型被设计为更好地理解和执行用户提供的指令，减少了生成无关内容的可能性。
成本效益更高： gpt-3.5-turbo通常比text-davinci-003更经济。
对话优化： 它们通过结构化的messages数组来处理对话，可以更好地管理角色（系统、用户、助手）和对话历史，从而提供更连贯、相关的响应。
代码生成能力更强： 尤其是gpt-4，在代码生成和理解方面表现卓越。

将代码从text-davinci-003迁移到gpt-3.5-turbo

以下是如何修改您的server.js以使用gpt-3.5-turbo模型：

import express from "express";
import * as dotenv from "dotenv";
import cors from 'cors';
import { Configuration, OpenAIApi } from "openai"; // 注意：对于Chat Completion API，推荐使用'openai'库的最新版本，它提供了更直观的Chat API客户端

dotenv.config();

const configuration = new Configuration({
    apiKey: process.env.OPENAI_API_KEY,
});

const openai = new OpenAIApi(configuration); // 尽管这里仍然使用OpenAIApi，但我们将调用其Chat Completion方法

const app = express();
app.use(cors());
app.use(express.json());

app.get("/", (req, res) => {
    res.status(200).send({
        message: "Welcome to OpenAI API",
    });
});

app.post('/', async (req, res) => {
    try {
        const prompt = req.body.prompt;

        // 使用Chat Completion API
        const response = await openai.createChatCompletion({
            model: "gpt-3.5-turbo", // 更改为更适合聊天的模型
            messages: [
                { role: "system", content: "你是一个乐于助人的AI助手。" }, // 可以定义AI的角色和行为
                { role: "user", content: prompt } // 用户的输入
            ],
            temperature: 0.7, // 适当调整温度，0为更确定性，1为更随机
            max_tokens: 1000, // 调整最大生成token数，以适应预期响应长度
            // top_p, frequency_penalty, presence_penalty 也可以应用于Chat Completion，但通常默认值已经很不错
        });

        res.status(200).send({
            bot: response.data.choices[0].message.content // Chat Completion的响应结构不同
        });
    }
    catch (error) {
        console.error("OpenAI API Error:", error.response ? error.response.data : error.message); // 更详细的错误日志
        res.status(500).send({ error: error.response ? error.response.data : { message: error.message } });
    }
});

app.listen(5000, () => console.log("Server is running on port :- http://localhost:5000"));

代码修改要点：

model参数： 从"text-davinci-003"改为"gpt-3.5-turbo"（或"gpt-4"）。
API调用： 从openai.createCompletion改为openai.createChatCompletion。
prompt结构： 不再直接传递一个字符串prompt，而是使用messages数组。messages数组包含一系列消息对象，每个对象有role（角色，如system、user、assistant）和content（消息内容）。
- system角色用于设置AI的整体行为或指令。
- user角色是用户的输入。
- assistant角色是AI之前的回复（在多轮对话中需要保存并传递）。
响应解析： createChatCompletion的响应结构不同。response.data.choices[0].text需要改为response.data.choices[0].message.content。
temperature和max_tokens： 根据需要调整这些参数。对于需要精确输出（如代码）或避免发散的场景，可以考虑将temperature设为较低值（如0或0.2）。

解决方案二：优化提示工程

即使使用了最先进的模型，清晰、明确的提示工程仍然至关重要。一个模糊或开放的提示可能会导致模型生成不预期的内容。

Otter.ai

一个自动的会议记录和笔记工具，会议内容生成和实时转录

下载

提示工程的关键原则：

明确指令： 清晰地告诉模型你想要什么。例如，“生成一个JavaScript函数来计算斐波那契数列的前N项”，而不是“关于斐波那契数列”。
设定角色和限制： 使用system消息为模型设定一个角色（例如，“你是一个经验丰富的JavaScript开发者，只提供代码，不要解释。”）并明确限制其行为（例如，“不要生成任何Java代码。”）。
提供示例： 如果可能，提供少量的输入-输出示例（Few-shot prompting），帮助模型理解预期格式和内容。
指定输出格式： 如果需要特定格式（如JSON、Markdown代码块），请在提示中明确说明。
避免歧义： 确保提示中的语言没有歧义，不会让模型产生多种解释。

示例：改进的提示结构

在您的server.js中，可以这样构造messages：

// ... 其他代码 ...

app.post('/', async (req, res) => {
    try {
        const userPrompt = req.body.prompt;

        const response = await openai.createChatCompletion({
            model: "gpt-3.5-turbo",
            messages: [
                {
                    role: "system",
                    content: "你是一个专业的Web开发助手，专注于提供JavaScript相关的代码和建议。请严格遵循用户的请求，不要生成任何与JavaScript无关的语言代码（如Java、Python等）。如果请求与Web开发无关，请礼貌地拒绝。"
                },
                {
                    role: "user",
                    content: userPrompt
                }
                // 如果是多轮对话，这里还需要加入之前的assistant和user消息
            ],
            temperature: 0.5, // 适当降低温度，减少随机性
            max_tokens: 1500,
        });

        res.status(200).send({
            bot: response.data.choices[0].message.content
        });
    }
    catch (error) {
        // ... 错误处理 ...
    }
});

在这个例子中，system消息明确地指示了AI的角色、专业领域、禁止行为以及对无关请求的处理方式。这大大降低了模型生成不相关Java代码的可能性。

注意事项与总结

持续迭代： 提示工程是一个迭代过程。如果模型仍然生成不理想的输出，请尝试修改您的提示或system消息。
上下文管理： 对于聊天机器人，务必在messages数组中包含之前的对话历史（用户和助手的所有消息），以便模型理解完整的上下文。
错误处理： 确保您的代码有健壮的错误处理机制，能够捕获并记录OpenAI API可能返回的任何错误。
OpenAI官方文档： 定期查阅OpenAI的官方文档和提示工程指南（如help.openai.com/en/collections/3675942-prompt-engineering），以获取最新的最佳实践和模型更新信息。

通过从text-davinci-003迁移到更强大的Chat Completion模型（如gpt-3.5-turbo或gpt-4），并结合精细的提示工程，您可以显著提高AI生成内容的准确性、相关性，并有效避免生成无关代码的问题，从而构建出更稳定、更智能的GPT克隆应用。

JavaScript全局对象window与globalThis的兼容性处理

JavaScript原始类型在闭包环境下的捕获与引用表现

JavaScript字符串重复repeat与填充padStart用法

JavaScript数值绝对值Math-abs与取整函数对比

JavaScript中逻辑空赋值运算符在默认值设定应用