
手把手教你用 Coze 搭建一个 24 小时自动更新的行业新闻机器人
实战工作流|从采集、去重、摘要到定时派发,一套讲清
更新日期:2026-04-08
先说结论:这件事用 Coze 能做,而且非常适合用工作流来做
如果你的目标是每天自动抓取某个行业的新资讯,筛掉营销软文和重复稿,整理成“标题 + 导语 + 要点 + 推送版本”,再按固定时间发到你的消息入口,那么 Coze 是一套足够顺手的方案。
它的优势不在于“单次聊天多聪明”,而在于你可以把整件事拆成明确的节点:采集、循环处理、代码去重、相关性判断、摘要生成、数据库记录、结果派发。这样做出来的机器人,比单纯让模型“帮我整理新闻”更稳定,也更容易长期维护。
官方文档已经明确展示过“给扣子派发一个定时任务”“每天早上 10 点收集 AI 行业动态,生成一份早报发给我”这样的场景;而开放文档侧也公开了工作流、代码节点、HTTP 请求节点、知识库检索节点、数据库、API / Web SDK / 自定义渠道发布等能力。
| 本文给你的不是概念图:而是一套更适合真正上线的路线:默认从“HTTP 请求 RSS/API + 代码去重 + 数据库记录 + 定时派发”开始。等第一版跑稳后,再加知识库沉淀、多渠道发布和企业权限治理。 |
一、为什么 Coze 适合做“24 小时更新”的新闻机器人?
- 工作流天然适合这种“固定输入—固定处理—固定输出”的自动化任务。Coze 官方把工作流定义为一组按顺序执行的可执行指令,用来实现业务逻辑或完成特定任务。
- 它不只是大模型节点。你还可以把插件、HTTP 请求、循环、数据库、代码节点和知识库检索组合起来,形成一条真正可维护的流水线。
- 发布形式比较灵活。开放文档写明,智能体可以发布为 API、Web SDK 或自定义渠道;渠道集成文档也明确支持网站、App、应用商店和终端厂商等自定义渠道。
- 如果你想把历史资讯沉淀下来,Coze 还有知识库与数据库两条路径:知识库更适合检索和追问,数据库更适合保存结构化记录,例如 URL、发布时间、是否已推送、标签、来源分数等。

图 1:行业新闻机器人建议工作流
二、先定路线:你到底要做哪一种新闻机器人?
很多人一上来就想做“全自动新闻编辑部”。这通常会把项目做重。更稳的做法,是先按数据来源来选路线:

图 2:三种最稳的搭建路线
三、正式开工前,你要准备什么?
- 一个 Coze 账号与可用工作空间。
- 至少一条可用的资讯来源:RSS、公开 API、企业内部 API,或者联网搜索类插件。
- 一份行业关键词表:主关键词、排除词、来源白名单、来源黑名单。
- 一个投递出口:Coze 内部消息、飞书、网页前端、API 接口,或你自己的中间服务。
- 一个去重策略:推荐最少保存 title_hash、url、source、published_at、pushed_at 五类字段。
| 最容易被忽略的准备项:不是模型,而是“来源与去重”。如果来源不可控、去重规则没有设计好,再强的模型也会把旧稿、同源转载和营销稿一起推给你。 |
四、手把手搭建:从 0 到 1 的 Coze 工作流
第 1 步:创建项目与工作流
进入 Coze 后先创建一个智能体或应用,把它命名为“行业新闻机器人”。如果你偏向纯自动化,建议优先用工作流承接核心逻辑,而不是把所有规则都写进系统提示词。工作流更稳定,也更容易调试。
第 2 步:定义输入参数
建议在开始节点定义 5 个基础输入:industry_keywords、exclude_keywords、source_whitelist、time_window_hours、top_n。即便你现在只做一个行业,也建议参数化;后面要扩行业,只换参数不用重写流程。
第 3 步:配置采集节点
最稳的做法有三种:① 用 HTTP 请求节点访问 RSS / API;② 用联网搜索或搜索类插件先拿候选链接;③ 通过外部脚本先抓好候选列表,再把结果喂给 Coze。小白想快速起步,可以先选搜索;想长期稳定运营,优先 HTTP。
第 4 步:让候选资讯进入循环
把采集结果标准化成数组,每条至少包含 title、url、source、published_at、summary/raw_text。然后接一个循环节点,让后面的判断逻辑逐条执行。这样定位错误时最省心。
第 5 步:用代码节点做第一轮去重
Coze 的代码节点支持编写自定义逻辑,非常适合做 title 归一化、URL 清洗、时间格式统一、相似标题合并等工作。经验上,这一层能先帮你去掉 30%—60% 的重复噪音。
第 6 步:用大模型节点做第二轮判断
这一轮不要让模型“自由发挥”,而是给它一个明确评分框架:相关性、时效性、可信度、信息密度、是否营销。输出尽量用 JSON:score、reason、keep、topic_tag、risk_flag。
第 7 步:生成摘要与推送文案
把保留下来的内容再统一过一遍大模型节点,生成两套版本:一套给内部阅读(信息更完整),一套给外部推送(更短、更像标题党,但不能失真)。推荐固定输出字段:headline、lead、three_points、why_it_matters。
第 8 步:写入数据库,避免重复推送
数据库非常关键。Coze 文档提到数据库表支持单用户和多用户两种查询模式。你至少要把已推送 URL、标题哈希、推送时间、行业标签存进去,下一次执行时先查库,再决定是否发送。
第 9 步:设置定时任务
如果你是在扣子官方环境内使用定时能力,建议先从“每天 2 次或 4 次”开始,而不是一上来 24 次。这样更容易评估信用点或调用成本。Coze 官方文档还特别提醒:如果定时任务在多个渠道触发,会按渠道分别计费。
第 10 步:选择发布渠道
如果只是自己用,可以先在 Coze 内部完成;如果想嵌到网站,用 Web SDK 或 API 更灵活;如果在企业内部落地,可评估飞书 / 企业商店 / Chat SDK 等渠道。记住:先把单一出口跑通,再考虑多渠道分发。
五、直接能抄的 Prompt 模板
| 模板 1|相关性判断:你是行业编辑台的初筛编辑。请根据给定新闻条目,判断它是否属于【新能源 / 跨境电商 / AI / 你自己的行业】。评分维度:1)相关性 2)时效性 3)可信度 4)信息密度 5)营销倾向。请严格输出 JSON:{“keep”:true/false,”score”:0-100,”topic”:””,”reason”:””,”risk_flag”:””}。 |
| 模板 2|摘要成稿:请把以下新闻改写为晨报条目,输出字段:headline(18-28 字)、lead(40-70 字)、three_points(3 条要点,每条不超过 28 字)、why_it_matters(说明对行业从业者的影响,不超过 60 字)。要求:忠于原意,不夸张,不使用‘震惊’‘重磅’等情绪化词。 |
| 模板 3|推送文案:请把下面的晨报条目改写成适合飞书群/企业群推送的版本:1 行标题 + 3 行要点 + 1 行行动建议。语言尽量清晰、专业、短句化。 |
六、给你一套推荐的字段结构
| 字段 | 类型 | 作用 | 建议来源 |
| title | string | 新闻原始标题 | 采集节点 |
| url | string | 原始链接,做去重核心键 | 采集节点 |
| source | string | 媒体或站点名称 | 采集节点 |
| published_at | datetime | 发布时间,便于时间窗过滤 | 采集节点 |
| norm_title | string | 清洗后的标题 | 代码节点 |
| title_hash | string | 相似标题去重 | 代码节点 |
| relevance | number | 行业相关性评分 | LLM 节点 |
| credibility | number | 可信度评分 | LLM / 规则 |
| headline | string | 用于最终推送的标题 | 摘要节点 |
| lead | string | 一段式导语 | 摘要节点 |
| pushed_at | datetime | 记录是否已推送 | 数据库节点 |
七、上线前最值得做的 5 个优化
- 增加来源白名单与排除词。比如“招聘”“报名”“课程优惠”“直播预告”等可先做硬过滤。
- 把“最近已推送链接”做成数据库查询,执行前先查一遍,再决定是否继续处理。
- 对摘要节点启用固定输出格式,最好是结构化字段,不要直接生成一整段散文。
- 把日报和快讯拆开:快讯强调时效,日报强调完整;不要试图用一个模板解决所有场景。
- 保留人工复核入口。真正对外发布时,推荐先把结果发到内部群或网页后台,由运营确认后再二次分发。
八、常见翻车点与避坑建议
| 问题 | 典型表现 | 解决建议 |
| 只靠搜索结果 | 每天内容风格不稳定,来源忽上忽下 | 尽快切到 RSS / API 或自建候选源 |
| 没有去重层 | 同一新闻被多家转载,重复推送 | 代码节点 + 数据库双层去重 |
| 模型提示过于宽泛 | 生成结果太花哨、偏营销、失真 | 固定评分标准 + JSON 输出 |
| 发布时间未标准化 | 旧稿混进当天快讯 | 统一时区与 datetime 格式 |
| 一上来多渠道分发 | 难排查,成本也容易失控 | 先单一出口跑稳,再复制扩展 |
九、FAQ
1. Coze 能不能完全代替人工编辑?
不建议这样理解。更合理的定位,是让 Coze 承担“搜集、清洗、初筛、摘要、排版”这些机械重复环节,把人工编辑留在“选题判断、价值判断、语气校准、最终发布”这一步。
2. 没有 RSS / API,还能做吗?
能。第一版可以先用联网搜索或搜索类插件拿候选结果,然后逐步迁移到更稳定的源。只是从长期稳定性看,能拿到结构化源最好。
3. 为什么文章里反复强调数据库?
因为新闻机器人最怕重复推送。数据库是你的“记忆”,它决定了机器人知不知道哪些内容已经发过。
4. 要不要把新闻都写进知识库?
如果你后面还想做“历史回顾、趋势总结、专题问答”,值得写;如果只是做快讯推送,先用数据库就够了。
5. 一天推送多少次最合适?
多数团队从 2 次、4 次开始更稳。只有当来源质量、去重规则、推送模板都稳定后,再提高频率。
十、相关阅读
- 《从录音到公号文只需 5 分钟:我的 AI 播客转文章自动化方案》
- 《深度拆解:如何利用 AI 每天批量产出 50 条高质量短视频脚本?》
- 《一人公司实战:我如何用 AI 辅助完成了从产品策划到代码实现的全过程》
- 《开源还是闭源?中小企业选择 AI 大模型方案的 3 个核心维度》
附:写作口径说明
- 本文按 2026-04-08 可查的 Coze 官方公开资料整理,包括扣子/Coze 官方文档中心与开放平台文档。
- 定时任务、工作流、代码节点、数据库、知识库、HTTP 请求节点、API / Web SDK / 自定义渠道发布等信息,均以官方当前公开页面为准。
- 套餐、信用点、渠道能力与具体上线形式后续都可能调整,落地前建议再次核对官方文档。