文章目录
- 项目背景
- 技术选型
- 架构设计
- 核心实现
- 1. 环境准备与配置
- 2. 定义核心提示词模板
- 3. 调用AI生成内容
- 4. 批量生成与文件保存
- 踩坑记录
- 效果对比
项目背景
最近在帮一个做本地生活服务的客户做引流,目标平台是小红书。他们之前靠人工写笔记,一天憋不出几篇,内容同质化严重,流量时好时坏。我接手后,第一反应就是:这种结构相对固定、追求爆款公式的内容,不正是AI的拿手好戏吗?用AI实现批量、稳定地生产“爆款感”笔记,把人力从重复劳动中解放出来,去干更重要的运营和转化工作,这才是效率的提升。
但理想很丰满,现实很骨感。直接让GPT写一篇“XX咖啡馆探店笔记”,它给出的内容往往“正确但平庸”,像一篇干巴巴的说明书,缺乏小红书用户爱看的“真实感”和“情绪价值”。所以,这个项目的核心挑战不是生成文字,而是生成符合平台调性、能激发互动的“爆款内容”。这需要一套完整的方法论和工程化流程。
技术选型
这个项目不涉及复杂的模型训练,核心是提示词工程和流程自动化。我的技术栈选型基于“高效、可控、成本低”的原则:
- 大语言模型 (LLM) API:OpenAI GPT-4。这是核心大脑。我试过Claude和国内的一些模型,但在理解复杂指令、保持风格一致性上,GPT-4(特别是GPT-4 Turbo)依然是效果最好的。虽然成本稍高,但为了内容质量,这笔投入值得。
- 编程语言与环境:Python。生态丰富,处理文本、调用API、操作文件都是强项。搭配
openai官方库即可。 - 内容结构化:Markdown模板。将一篇笔记拆解成标题、正文、标签(Hashtag)等部分,方便AI分块生成和后期人工微调。
- 自动化流程:简单的Python脚本。实现从“输入关键词”到“输出成稿”的半自动流水线。暂未涉及全自动发布(涉及平台反爬,风险高)。
架构设计
我的目标不是做一个全黑盒系统,而是一个“人机协同”的创作流水线。架构分为三层:
[输入层] -> [AI处理引擎] -> [输出与优化层]- 输入层:一个关键词列表(如“上海宠物友好咖啡馆”、“通勤穿搭”),以及一个“爆款笔记样本库”。样本库是我手动收集的几十篇真实爆款笔记,用于分析结构和话术。
- AI处理引擎:这是核心。它又分为两步:
- 第一步:角色与风格设定。给AI一个精准的“人设”,比如“一位生活在上海、热爱探索小众店铺、文笔细腻带点幽默的时尚博主”。
- 第二步:结构化生成。基于人设和关键词,按照“标题 -> 正文 -> 标签”的顺序依次生成。这里的关键是,每一步的提示词都基于上一步的结果,保证内容连贯。
- 输出与优化层:AI生成初稿后,输出为Markdown文件。这里必须加入人工审核与微调环节,修改事实错误、注入最新网络热词、调整情绪浓度。最后才考虑发布。
核心实现
下面我以“生成一篇‘上海外滩露台餐厅’的探店笔记”为例,拆解关键代码和提示词。
1. 环境准备与配置
importopenaiimportosfromtypingimportList,Dict# 配置你的OpenAI API Keyopenai.api_key=os.getenv("OPENAI_API_KEY")# 定义客户端 (适用于openai库新版本)client=openai.OpenAI()# 定义模型MODEL="gpt-4-turbo-preview"# 也可以用 gpt-3.5-turbo 控制成本,但效果有差距2. 定义核心提示词模板
这里是我踩过无数坑后总结的“黄金提示词”结构,它比简单说“写一篇笔记”有效十倍。
# 1. 系统提示词 - 设定AI角色和核心任务SYSTEM_PROMPT=""" 你是一位资深的小红书美食探店博主,擅长撰写具有强烈吸引力和代入感的爆款笔记。你的风格特点是: 1. **标题抓人**:使用感叹句、疑问句、包含数字和emoji,突出最大亮点。 2. **正文沉浸**:采用“场景化开头+细节描述+真实感受+实用信息”的结构。语言口语化,多使用“咱就是说”、“一整个爱住”、“谁懂啊”等网络用语,搭配合适的emoji。 3. **标签精准**:添加约10个相关话题标签,包括1-2个宽泛流量标签(如#上海探店)、5-6个精准标签(如#外滩餐厅)、以及2-3个风格标签(如#氛围感餐厅)。 请根据用户提供的主题,生成一篇完整的小红书笔记。 """# 2. 用户提示词模板 - 注入具体主题和要求defgenerate_user_prompt(topic:str,additional_notes:str="")->str:prompt=f""" 请围绕以下主题生成一篇小红书爆款笔记: **主题**:{topic}{additional_notes}**请严格按照以下格式输出,不要有任何多余的解释:** ## 标题 [你的笔记标题] ## 正文 [你的笔记正文] ## 标签 [你的话题标签,每行一个] """returnprompt3. 调用AI生成内容
defgenerate_note(topic:str)->Dict[str,str]:"""生成单篇笔记的核心函数"""try:response=client.chat.completions.create(model=MODEL,messages=[{"role":"system","content":SYSTEM_PROMPT},{"role":"user","content":generate_user_prompt(topic)}],temperature=0.7,# 创造性设为0.7,在稳定性和新颖性间取得平衡max_tokens=1500# 控制输出长度)full_content=response.choices[0].message.content# 简单解析输出,分割成标题、正文、标签parts=full_content.split("## ")result={}forpartinparts:ifpart.startswith("标题"):result["title"]=part.replace("标题","").strip()elifpart.startswith("正文"):result["body"]=part.replace("正文","").strip()elifpart.startswith("标签"):result["hashtags"]=part.replace("标签","").strip()returnresultexceptExceptionase:print(f"生成笔记时出错:{e}")returnNone# 使用示例if__name__=="__main__":topic="上海外滩露台餐厅,能看到绝美江景和陆家嘴三件套"note=generate_note(topic)ifnote:print(f"标题:{note['title']}")print(f"\n正文:\n{note['body']}")print(f"\n标签:\n{note['hashtags']}")一次可能的输出示例:
标题:在外滩花¥500+吃一顿饭,就为了这view值了!🌃
正文:咱就是说,外滩的夜景真的看一万次都不会腻!这次发现的这家宝藏露台餐厅,直接把我拿捏了…(详细正文)
标签:#上海外滩 #露台餐厅 #江景餐厅 #魔都探店 #约会餐厅 #氛围感 #上海美食 #周末去哪儿 #宝藏餐厅分享 #城市夜景
4. 批量生成与文件保存
defbatch_generate_notes(topics:List[str],output_dir:str="./notes"):"""批量生成笔记并保存为Markdown文件"""importos os.makedirs(output_dir,exist_ok=True)fori,topicinenumerate(topics):print(f"正在生成第{i+1}篇:{topic}")note=generate_note(topic)ifnote:filename=os.path.join(output_dir,f"note_{i+1:03d}.md")withopen(filename,'w',encoding='utf-8')asf:f.write(f"#{note['title']}\n\n")f.write(f"{note['body']}\n\n")f.write(f"{note['hashtags']}")print(f" 已保存至:{filename}")else:print(f" 生成失败:{topic}")踩坑记录
- 内容空洞,缺乏细节:早期提示词只给了主题,AI生成的内容全是“环境很好、食物不错、推荐大家来”的套话。解决方案:在用户提示词中加入“请具体描述至少3个菜品的口味、外观和你的感受”、“描述一下傍晚时分的氛围变化”等具体指令。
- 标签流于形式:AI生成的标签总是#上海 #美食 #探店那几个,不精准。解决方案:在系统提示词中明确标签分类(流量、精准、风格),并提供一个优质标签库让AI参考。
- 风格不稳定:同一批生成的笔记,有的很“网感”,有的像新闻稿。解决方案:强化系统提示词中的“人设”部分,并提供一个风格参考样本。可以在用户提示词里加入:“请参考以下语气和风格:‘谁懂啊家人们!这家店真的绝绝子!’”。
- 事实性错误:AI可能会编造不存在的菜品价格或营业时间。解决方案:这是目前AI的硬伤。必须在人工审核环节重点核对所有具体信息。也可以在提示词中强调“对于不确定的信息如人均消费,请使用‘大约’、‘左右’等词汇”。
- 成本失控:用GPT-4批量生成,如果字数不限,成本很快飙升。解决方案:在API调用中严格设置
max_tokens参数;对于正文部分,可以先让GPT生成一个详细大纲,再扩充,比直接生成全文更可控。
效果对比
项目上线后,内容生产效率发生了质变:
- 效率:从人均每天2-3篇,提升到单人(审核者)每天可处理20-30篇初稿。
- 质量稳定性:AI产出的内容基本都能达到“良好”基线,避免了人工状态不佳时的低质量产出。约30%的初稿经过简单微调即可发布。
- 数据表现:采用AI辅助生成的笔记,其互动率(赞藏评)平均提升了约15%。核心原因是AI能稳定地植入“爆款元素”(如悬念标题、情绪表达、热门标签),而人工创作时这些元素时有时无。
最重要的心得:这个项目的成功,不在于AI写得比人好,而在于它把人从“写作”的体力劳动中解放出来,让人能更专注于“策划”和“运营”。AI是永不疲倦的初级写手,而人是把握方向、注入灵魂的主编。两者结合,才是未来内容生产的正确姿势。
「如有问题欢迎评论区交流,持续更新中…」