发现全球最佳 AI 工具

从零教你部署与精通,掌握实战变现工作流

Coze 行业新闻机器人自动化工作流封面图

手把手教你用 Coze 搭建一个 24 小时自动更新的行业新闻机器人

面向内容团队、运营、编辑部与企业知识管理场景的实战教程,系统拆解如何利用 Coze 搭建一个 24 小时自动更新的行业新闻机器人。文章覆盖工作流架构、采集来源、去重机制、摘要生成、数据库记录、定时推送与多渠道发布,并附可直接套用的 Prompt 模板、字段结构和 FAQ。

手把手教你用 Coze 搭建一个 24 小时自动更新的行业新闻机器人

实战工作流|从采集、去重、摘要到定时派发,一套讲清

更新日期:2026-04-08

先说结论:这件事用 Coze 能做,而且非常适合用工作流来做

如果你的目标是每天自动抓取某个行业的新资讯,筛掉营销软文和重复稿,整理成“标题 + 导语 + 要点 + 推送版本”,再按固定时间发到你的消息入口,那么 Coze 是一套足够顺手的方案。

它的优势不在于“单次聊天多聪明”,而在于你可以把整件事拆成明确的节点:采集、循环处理、代码去重、相关性判断、摘要生成、数据库记录、结果派发。这样做出来的机器人,比单纯让模型“帮我整理新闻”更稳定,也更容易长期维护。

官方文档已经明确展示过“给扣子派发一个定时任务”“每天早上 10 点收集 AI 行业动态,生成一份早报发给我”这样的场景;而开放文档侧也公开了工作流、代码节点、HTTP 请求节点、知识库检索节点、数据库、API / Web SDK / 自定义渠道发布等能力。

本文给你的不是概念图:而是一套更适合真正上线的路线:默认从“HTTP 请求 RSS/API + 代码去重 + 数据库记录 + 定时派发”开始。等第一版跑稳后,再加知识库沉淀、多渠道发布和企业权限治理。

一、为什么 Coze 适合做“24 小时更新”的新闻机器人?

  1. 工作流天然适合这种“固定输入—固定处理—固定输出”的自动化任务。Coze 官方把工作流定义为一组按顺序执行的可执行指令,用来实现业务逻辑或完成特定任务。
  2. 它不只是大模型节点。你还可以把插件、HTTP 请求、循环、数据库、代码节点和知识库检索组合起来,形成一条真正可维护的流水线。
  3. 发布形式比较灵活。开放文档写明,智能体可以发布为 API、Web SDK 或自定义渠道;渠道集成文档也明确支持网站、App、应用商店和终端厂商等自定义渠道。
  4. 如果你想把历史资讯沉淀下来,Coze 还有知识库与数据库两条路径:知识库更适合检索和追问,数据库更适合保存结构化记录,例如 URL、发布时间、是否已推送、标签、来源分数等。

图 1:行业新闻机器人建议工作流

二、先定路线:你到底要做哪一种新闻机器人?

很多人一上来就想做“全自动新闻编辑部”。这通常会把项目做重。更稳的做法,是先按数据来源来选路线:

图 2:三种最稳的搭建路线

三、正式开工前,你要准备什么?

  • 一个 Coze 账号与可用工作空间。
  • 至少一条可用的资讯来源:RSS、公开 API、企业内部 API,或者联网搜索类插件。
  • 一份行业关键词表:主关键词、排除词、来源白名单、来源黑名单。
  • 一个投递出口:Coze 内部消息、飞书、网页前端、API 接口,或你自己的中间服务。
  • 一个去重策略:推荐最少保存 title_hash、url、source、published_at、pushed_at 五类字段。
最容易被忽略的准备项:不是模型,而是“来源与去重”。如果来源不可控、去重规则没有设计好,再强的模型也会把旧稿、同源转载和营销稿一起推给你。

四、手把手搭建:从 0 到 1 的 Coze 工作流

第 1 步:创建项目与工作流

进入 Coze 后先创建一个智能体或应用,把它命名为“行业新闻机器人”。如果你偏向纯自动化,建议优先用工作流承接核心逻辑,而不是把所有规则都写进系统提示词。工作流更稳定,也更容易调试。

第 2 步:定义输入参数

建议在开始节点定义 5 个基础输入:industry_keywords、exclude_keywords、source_whitelist、time_window_hours、top_n。即便你现在只做一个行业,也建议参数化;后面要扩行业,只换参数不用重写流程。

第 3 步:配置采集节点

最稳的做法有三种:① 用 HTTP 请求节点访问 RSS / API;② 用联网搜索或搜索类插件先拿候选链接;③ 通过外部脚本先抓好候选列表,再把结果喂给 Coze。小白想快速起步,可以先选搜索;想长期稳定运营,优先 HTTP。

第 4 步:让候选资讯进入循环

把采集结果标准化成数组,每条至少包含 title、url、source、published_at、summary/raw_text。然后接一个循环节点,让后面的判断逻辑逐条执行。这样定位错误时最省心。

第 5 步:用代码节点做第一轮去重

Coze 的代码节点支持编写自定义逻辑,非常适合做 title 归一化、URL 清洗、时间格式统一、相似标题合并等工作。经验上,这一层能先帮你去掉 30%—60% 的重复噪音。

第 6 步:用大模型节点做第二轮判断

这一轮不要让模型“自由发挥”,而是给它一个明确评分框架:相关性、时效性、可信度、信息密度、是否营销。输出尽量用 JSON:score、reason、keep、topic_tag、risk_flag。

第 7 步:生成摘要与推送文案

把保留下来的内容再统一过一遍大模型节点,生成两套版本:一套给内部阅读(信息更完整),一套给外部推送(更短、更像标题党,但不能失真)。推荐固定输出字段:headline、lead、three_points、why_it_matters。

第 8 步:写入数据库,避免重复推送

数据库非常关键。Coze 文档提到数据库表支持单用户和多用户两种查询模式。你至少要把已推送 URL、标题哈希、推送时间、行业标签存进去,下一次执行时先查库,再决定是否发送。

第 9 步:设置定时任务

如果你是在扣子官方环境内使用定时能力,建议先从“每天 2 次或 4 次”开始,而不是一上来 24 次。这样更容易评估信用点或调用成本。Coze 官方文档还特别提醒:如果定时任务在多个渠道触发,会按渠道分别计费。

第 10 步:选择发布渠道

如果只是自己用,可以先在 Coze 内部完成;如果想嵌到网站,用 Web SDK 或 API 更灵活;如果在企业内部落地,可评估飞书 / 企业商店 / Chat SDK 等渠道。记住:先把单一出口跑通,再考虑多渠道分发。

五、直接能抄的 Prompt 模板

模板 1|相关性判断:你是行业编辑台的初筛编辑。请根据给定新闻条目,判断它是否属于【新能源 / 跨境电商 / AI / 你自己的行业】。评分维度:1)相关性 2)时效性 3)可信度 4)信息密度 5)营销倾向。请严格输出 JSON:{“keep”:true/false,”score”:0-100,”topic”:””,”reason”:””,”risk_flag”:””}。
模板 2|摘要成稿:请把以下新闻改写为晨报条目,输出字段:headline(18-28 字)、lead(40-70 字)、three_points(3 条要点,每条不超过 28 字)、why_it_matters(说明对行业从业者的影响,不超过 60 字)。要求:忠于原意,不夸张,不使用‘震惊’‘重磅’等情绪化词。
模板 3|推送文案:请把下面的晨报条目改写成适合飞书群/企业群推送的版本:1 行标题 + 3 行要点 + 1 行行动建议。语言尽量清晰、专业、短句化。

六、给你一套推荐的字段结构

字段类型作用建议来源
titlestring新闻原始标题采集节点
urlstring原始链接,做去重核心键采集节点
sourcestring媒体或站点名称采集节点
published_atdatetime发布时间,便于时间窗过滤采集节点
norm_titlestring清洗后的标题代码节点
title_hashstring相似标题去重代码节点
relevancenumber行业相关性评分LLM 节点
credibilitynumber可信度评分LLM / 规则
headlinestring用于最终推送的标题摘要节点
leadstring一段式导语摘要节点
pushed_atdatetime记录是否已推送数据库节点

七、上线前最值得做的 5 个优化

  • 增加来源白名单与排除词。比如“招聘”“报名”“课程优惠”“直播预告”等可先做硬过滤。
  • 把“最近已推送链接”做成数据库查询,执行前先查一遍,再决定是否继续处理。
  • 对摘要节点启用固定输出格式,最好是结构化字段,不要直接生成一整段散文。
  • 把日报和快讯拆开:快讯强调时效,日报强调完整;不要试图用一个模板解决所有场景。
  • 保留人工复核入口。真正对外发布时,推荐先把结果发到内部群或网页后台,由运营确认后再二次分发。

八、常见翻车点与避坑建议

问题典型表现解决建议
只靠搜索结果每天内容风格不稳定,来源忽上忽下尽快切到 RSS / API 或自建候选源
没有去重层同一新闻被多家转载,重复推送代码节点 + 数据库双层去重
模型提示过于宽泛生成结果太花哨、偏营销、失真固定评分标准 + JSON 输出
发布时间未标准化旧稿混进当天快讯统一时区与 datetime 格式
一上来多渠道分发难排查,成本也容易失控先单一出口跑稳,再复制扩展

九、FAQ

1. Coze 能不能完全代替人工编辑?

不建议这样理解。更合理的定位,是让 Coze 承担“搜集、清洗、初筛、摘要、排版”这些机械重复环节,把人工编辑留在“选题判断、价值判断、语气校准、最终发布”这一步。

2. 没有 RSS / API,还能做吗?

能。第一版可以先用联网搜索或搜索类插件拿候选结果,然后逐步迁移到更稳定的源。只是从长期稳定性看,能拿到结构化源最好。

3. 为什么文章里反复强调数据库?

因为新闻机器人最怕重复推送。数据库是你的“记忆”,它决定了机器人知不知道哪些内容已经发过。

4. 要不要把新闻都写进知识库?

如果你后面还想做“历史回顾、趋势总结、专题问答”,值得写;如果只是做快讯推送,先用数据库就够了。

5. 一天推送多少次最合适?

多数团队从 2 次、4 次开始更稳。只有当来源质量、去重规则、推送模板都稳定后,再提高频率。

十、相关阅读

附:写作口径说明

  • 本文按 2026-04-08 可查的 Coze 官方公开资料整理,包括扣子/Coze 官方文档中心与开放平台文档。
  • 定时任务、工作流、代码节点、数据库、知识库、HTTP 请求节点、API / Web SDK / 自定义渠道发布等信息,均以官方当前公开页面为准。
  • 套餐、信用点、渠道能力与具体上线形式后续都可能调整,落地前建议再次核对官方文档。
Facebook
LinkedIn
Reddit
X
Email
WhatsApp
Telegram
Pinterest
Mix

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注