Case Study

Selected Builds

WindClaw vs 东方财富 Skills

AI 投研产品对比案例页

Case index

从这里开始阅读

先看结论,再按需要下钻到单产品拆解、测试方法和附录材料。

Overview

这页不是把两份体验报告简单贴上来,而是把产品分析、并行测试、逐题重评分和原始问答证据串成一个招聘可读的案例。我要展示的不是“我会做表”,而是我能把一个主观、复杂、容易失真的使用体验问题,收束成可比较、可解释、可复核的判断框架。

My role

独立完成选题、评判标准设计、问题集搭建、双产品并行测试、逐题重评分和最终结论整理。

Products2 款
Prompts28 题
Score axes4 维
Appendix docs6 份

Comparison summary

对比总览

东方财富 Skills 整体领先

如果从 AI 产品经理招聘的视角看,这个案例最重要的不是“谁赢了”,而是我如何定义胜负。结论层面,东方财富 Skills 在题意承接、结构化表达和长文成稿感上更成熟;WindClaw 在单标数据快查、表格组织和部分简单查询场景里并不弱,但一旦进入新闻、政策、舆情或筛选类任务,题意偏移和边界失控的问题会更明显。

谁更强

东方财富 Skills 的优势在于更贴题,也更像真正完成一份分析任务;WindClaw 更像结构好看的金融问答生成器。

各自优势

东方财富 Skills 更强在政策、舆情、策略和横向比较;WindClaw 更稳在字段明确、范围收敛的单标数据查询和表格化输出。

共同短板

两者一旦检索不准,都不愿意停下来,而是继续把结构写满,用泛化分析补足内容,容易掩盖时间错位、对象错配和口径混杂。

我的赛道判断

这次案例让我更确认金融 AI 的核心护城河仍然是准确、及时、可核验的数据能力。产品体验当然重要,但在投研场景里,可靠信息源始终先于炫目的交互形式。

Final judgment真正决定这类产品上限的,不是模型会不会写,而是系统能不能在信息不足时克制收口,并清楚告诉用户“我知道什么、不知道什么”。

Product dossiers

单产品拆解

同样的结构,用来强调两款产品的能力边界、测试表现和最终判断。

Dossier 01

东方财富 Skills

东方财富 Skills 更像一个已经能拿来交付初稿的金融检索 + 投研表达助手。它把资讯搜索、金融数据、智能选股和账户管理拆成明确 skill,再借东方财富自有 API 和数据库去支撑输出,所以整体更像有产品化边界的系统,而不只是套壳对话。

产品定位与能力边界

核心能力是把东方财富的金融数据库接进 openclaw,让模型不只靠训练知识和网页搜索回答问题。强项在 A 股数据查询、新闻检索、政策梳理、选股和结构化长文输出;边界是依赖特定数据库口径,部分研究报告和海外信息的权威性判断仍不够稳。

功能 / 设计逻辑

它把投研流程拆成资讯搜索、金融数据、智能选股、自选管理和模拟组合管理几个模块,本质是在降低普通用户提问门槛,同时保留金融数据的专业口径。对产品经理而言,这种“任务能力模块化”的设计很值得看,因为它兼顾了明确入口和数据库约束。

测试表现摘要

在新闻、舆情、政策、对比和策略类题目里,东方财富 Skills 更经常正面回应题目要求,而不是绕开问题。它的结构也更稳定,常常能形成“结论 - 数据 - 解释 - 风险”这种接近成稿的阅读顺序。

评分表现摘要

28 题重评分后,它的主要加分项是题意承接能力、结构化表达和中长篇分析成熟度。主要失分点在财报时间错位、筛选题板块污染,以及少数长文里把综合判断写得过于确定。

优势

  • 更像真正按题作答,而不是围绕题目组织一段像答案的内容。
  • 结构化输出稳定,适合直接当研究初稿或汇报材料底稿。
  • 在政策、舆情、策略类任务上更接近“分析成品”。

风险 / 短板

  • 长文一旦拿到的证据不够稳,仍会继续包装成完整结论。
  • 筛选题在板块定义和样本清洁度上仍会失控。
一句话判断如果目标是快速得到一份可读、可继续加工的投研初稿,东方财富 Skills 明显更适合作为工作流入口。

Dossier 02

WindClaw

WindClaw 的产品气质更强金融终端工具感,背后是 Wind 数据库和一组面向投研任务的模板入口。它的优点不是“会说”,而是给用户一种可以直接在专业语境下聊股票、谈策略、做对比的感觉。

产品定位与能力边界

WindClaw 强在结构化金融数据和专业投研语境,尤其适合个股、估值、配置和框架型分析。但它对实时 web 搜索依赖额外配置,新闻、公告、政策和研报获取明显受限,导致很多非结构化信息题目只能退化成数据或趋势概览。

功能 / 设计逻辑

它用“聊股票、找机会、做对比、谈大势、论策略”这类任务入口把复杂投研流程产品化,让用户不必先想 prompt 结构,就能进入一个熟悉的研究动作里。这是很典型的“面向任务而不是面向功能”设计。

测试表现摘要

WindClaw 在单标数据、多字段查询和部分框架型长文里读起来很顺,表格也漂亮。但一旦题目明确要求新闻事件、舆情进展、具体政策或研究报告,它很容易用销量、财务或泛行业背景替代真正的问题。

评分表现摘要

28 题重评分后,它的主要优势是信息整理能力、表格化输出和简单数据快查;失分主要来自题不对题、事实与推断混写,以及筛选口径前后不一。也就是说,它经常看起来比真实质量更完整。

优势

  • 单标数据快查和字段明确的任务整体较稳。
  • 表格组织、框架铺陈和阅读体验普遍不错。
  • 任务式入口很符合真实投研工作流。

风险 / 短板

  • 新闻、舆情、政策和研报题容易偏题,用概览替代精确回答。
  • 已披露数据、预测值和推断常混写,边界不够清楚。
一句话判断如果用户已经知道自己想问什么、且问题更偏结构化数据,WindClaw 仍然有价值;但要直接拿来做事实要求高的研究判断,风险更大。

How I evaluated it

测试与评分方法

这次案例刻意把“体验感受”拆成可以重复执行的评测流程。核心不是给两个产品打一个主观印象分,而是控制问题、时间、追问、上下文和判分口径,让结果尽量反映产品能力本身,而不是模型偶然发挥。

评分标准

我把回答质量拆成四个维度:内容完整性与准确性、结构清晰度、格式可用性、解读质量。这个标准专门针对金融分析场景,重点看它有没有正面回答题目、事实边界是否清楚、读者能否快速定位结论与证据,以及解读有没有建立在已证实信息上。

测试约束

所有题目尽量保持相同 prompt、相同追问轮数限制、相近测试时间,并控制上下文窗口,避免把“调教产品”的结果误当成产品本身能力。同时我也单独区分了“拿不到数据”和“拿到数据但不会组织表达”这两类问题。

问题设计

题库覆盖新闻检索、公司公告、板块异动、政策研究、数据查询、多条件筛选、横向比较、宏观判断和配置建议。这样既能测简单字段能力,也能测复杂场景下的命中率、结构化表达和克制程度。

重评分方式

对两份原始测试报告,我又做了一轮逐题重评分和外部事实抽核,避免初始体验报告被模型表达风格误导。重评分文档因此承担“量化结果”和“失分理由”两层作用,是这次案例里最接近判断底稿的部分。

Appendix

原文附录

下面保留 6 份 Markdown 文档。产品深度分析和 28 题体验评分继续保留页内阅读,但默认折叠,按需展开查看;两份原始测试实录因为篇幅过长,改为直接下载查看。

Appendix group

东方财富 Skills

产品深度分析和 28 题评分保留页内阅读,但默认折叠,原始测试实录改为下载查看。

产品深度分析

东方财富 Skills 产品深度分析

展开原文

东方财富Skills产品深度分析

  1. 功能全景图

Skill 名称功能概述适用场景使用示例
妙想资讯搜索 skill1. 实时新闻:聚合权威资讯源,提供最新金融新闻 2. 关键词搜索:支持股票名称、代码、概念等搜索 3. 时间筛选:可限定最近一周、一月等时间范围 4. 事件追踪:支持追踪特定事件、概念的热度变化1. 查找特定股票的最新消息和公告 2. 了解某个行业或概念的近期动态 3. 追踪市场热点和舆论趋势 4. 关注宏观经济要闻1. 搜索个股新闻:格力电器最新研报、贵州茅台机构观点 2. 搜索板块 / 主题:商业航天板块近期新闻、新能源政策解读 3. 综合解读:今日大盘异动原因、北向资金流向解读
妙想金融数据 skill1. 支持标的范围:当前支持沪深京 A 股 2. 财务指标查询:PE、PB、ROE 等核心指标 3. 财报数据:营收、利润、毛利率、净利率等 4. 实时和历史行情:当日实时及多年历史行情查询 5. 同比环比:包含同比和环比变化数据1. 了解公司的估值水平(PE、PB) 2. 分析公司的盈利能力(ROE、毛利率) 3. 对比多家公司的基本面数据 4. 查看公司历史业绩变化1. 查询单项指标:查一下贵州茅台的 PE 是多少 2. 查询多项指标:帮我查一下招商银行的 PE、PB 和 ROE
妙想智能选股 skill1. 多条件组合筛选:同时设置多个筛选条件 2. 技术面选股:按均线、MACD、成交量等指标筛选 3. 基本面选股:按 PE、ROE、营收增速等财务指标筛选1. 寻找低估值的价值股 2. 筛选技术形态良好的成长股 3. 构建特定行业的股票池 4. 过滤不符合投资标准的股票1. 按估值筛选:帮我选出 PE 小于 15 的银行股 2. 按盈利能力筛选:选出 ROE 大于 20%,且毛利率大于 30% 的股票 3. 多条件组合:帮我筛选 PE 在 10-20 之间,ROE 大于 15%,市值大于 500 亿的股票
妙想自选管理 skill链接东方财富通行证自选股数据(仅支持 A 股),通过 openclaw 查询和管理自选股1. 自然语言请求 2. 查询自选股 3. 管理(添加 / 删除)自选股 4. openclaw 与东方财富同步1. 查询自选股:查询我的自选股列表 2. 添加自选股:把贵州茅台添加到我的自选股列表 3. 删除自选股:把贵州茅台从我的自选股列表删除
妙想模拟组合管理 skill提供东方财富模拟组合管理能力,支持组合新建、持仓查询、买入卖出、撤单、委托查询、资金查询等

数据来源于东方财富妙想Skills使用文档

注意:为什么东方财富妙想Skills能实现对准确金融信息的查询与反馈?

普通 skill 往往只是提示词模板,模型只能靠自己已有知识,或者普通网页搜索。东方财富这套 skill 不是单纯的提示词,它明确接了东方财富官方 API。Agent能够通过skill连接并查询东方财富的专业数据库,并根据skill中的提示词模板,得到用户想要的信息

  1. 核心功能深度拆解

鉴于资讯搜索 、金融数据、智能选股功能相近,而自选管理、模拟组合管理功能相近,所以将其拆成两部分分析(拆分依据:能否进行交互,而不是只是单方面信息查询)

功能一:资讯搜索 、金融数据、智能选股

  1. 功能描述:详见功能全景图,主要是在AI助手中与其进行对话,从而获得想要的信息 但需要注意的是,三者不仅底层任务逻辑(模板)不同,调用的API也不同。通过公开的skill安装文案来看,三者的调用的API分别是
    1. 资讯搜索 → /finskillshub/api/claw/news-search
    2. 金融数据 → /finskillshub/api/claw/query
    3. 智能选股 → /finskillshub/api/claw/stock-screen
    4. 虽然没有说明数据库的问题,但是大概率共享同一底层金融数据体系
  2. 设计逻辑:
    1. 投研能力模块化:将复杂的投研流程打包,降低了用户的使用门槛,提高了用户下判断、做研究的效率
    2. 信息可靠性:通过提供来自于东方财富数据库的信息,有效减少了LLM在遇到自己知识盲区时生成幻觉的可能性,将金融场景中—信息失真与数据过期这个两个重要问题解决
  3. 具体使用体验:产品完整程度很高,虽然在及时信息获取上还有问题,但是证明高端信息库的API+专业机构出品的skills+openclaw平台是可行的
  4. 我的评价:输出的内容不仅能看,还能用。能够给出比较具确切的判断和相应的理由,即使专业度有所欠缺,但是对于普通用户已经是可用的了

功能二:自选管理、模拟组合管理

  1. 功能描述:详见功能全景图,主要是与AI助手对话,通过自然语言控制AI助手实现对自选账户的自选股进行管理;对模拟证券账户进行买入、卖出等实际操作

总的来说,自选管理不涉及资金账户状态;模拟组合管理涉及仓位与交易行为。

  1. 设计逻辑:

    1. 增强用户黏性:降低用户进行账户管理和投资行为的时间成本,仅通过自然语言就能实现账户管理,在相同投资产品中具有显著优势
    2. 个性化服务:通过AI助手,不仅能够实现账户管理,还能保留、复盘用户的操作行为,增强留存与再次使用的可能性
    3. 未来拓展:模拟组合能够实现仓位与交易行为从侧面说明东方财富有能力做到交易行为在AI产品上的落地,为未来真实账户的交易行为AI化奠定基础
  2. 具体使用体验测试(分功能测试)

    (1)资讯搜索 、金融数据、智能选股

    1. 注意:具体的使用场景建立在用户自己的openclaw框架上,由于使用底层模型、消息平台、配置问题等影响,同样的用户需求得到的体验也可能不同
    2. 对于新闻、政策、消息等数据反应及时且内容确切
    3. 对国内外新闻都有涉及,而且范围能延伸到2026年的近几个月
    4. 行业研究报告的获取是较为可观的
    5. 大多数题目都能正面对应用户要求,而不是问新闻、政策,回答数据
    6. 结构化表达能力,如标题、分段、表格等完善,用于专业行研工作中比较方便
    7. 有自己的行研逻辑框架,但是不确定是skill的能力还是模型的能力

    见 AI投研产品具体使用体验测试 文档

    (2)自选管理、模拟组合管理

    1. 模拟组合的使用首先需要将东方财富的skills与自己在东方财富上的模拟账户绑定才能使用
    2. 能够完成其所宣传的相应操作,报告:买入、卖出、撤单、查询资金(内容很详细,包括:初始资金、总资产、账户余额、可用余额、冻结金额、持仓市值等),还能按照时间范围查询交易记录,并给出具体的反馈。每次使用openclaw下达命令,到有信息反馈都不超过1分钟
    3. 自选管理支持自然语言查询,股票名称可以是中文全称或常用简称(股票代码),数据包含实时行情:价格、涨跌幅、市盈率等
    4. 除了股票、基金ETF也能实现在自选股列表添加、删除的操作。但是不提供ETF持仓明细查询功能。一般从使用openclaw下达命令,到有信息反馈的时间范围1-2分钟之间
  3. 价格标准

暂时没有具体的价格名录

  1. 每日调用次数(免费版)

资讯搜索 、金融数据、智能选股:50次

模拟组合管理:1000次

自选管理:200次

  1. 会员版福利

资讯搜索 、金融数据、智能选股:300次

模拟组合管理:3000次

自选管理:400次

  1. 如何解锁会员权益
    1. 在东方财富证券开户,直接免费领取3个月会员权益
    2. 账户等级达到V2(月度日均持有资产达到10万元),每月都能免费领取会员版
28题体验评分

东方财富 Skills 28题体验评分

展开原文

东方财富 Skills 28题体验评分结果

评判对象:/Users/sutianrun/Desktop/compare/东方财富skills产品体验报告.md

评判标准:金融分析型产品体验评判标准 v1
评判口径:外部事实抽核 + 文档内容评估
说明:本次重点看四件事:有没有正面回答题目、关键事实是否站得住、结构是否便于扫读、解读是否建立在已证实信息上。

逐题评分

序号题目简称内容完整性与准确性结构清晰度格式可用性解读质量简要原因
1比亚迪2024年报公告总结1/53/5清单1/5回答自己已明确承认“实际数据显示的是2023年业绩预告”,且净利润写成“2900-3100亿元”明显失真,属于严重时间错位和数值错配。
22026年1月新能源行业重大新闻4/54/5清单3/5这次确实列出了政策、行业和企业事件,明显比用销量替代新闻更贴题;不足是部分事件时间边界和重要性筛选仍偏松。
32026年1月A股半导体上涨原因4/54/5清单4/5已按政策、行业消息、资金面分层展开,核心驱动解释较完整;少量论据跨到1月之后,时点纯度略弱。
4小米汽车2025年舆情追踪4/54/5清单4/5能按“起因-发酵-回应-进展”组织具体事件,明显命中题目要求;不足是部分事件延伸到2026年,且个别细节仍需官方结论支撑。
52024年并购重组政策与影响4/55/5清单4/5“国九条”“并购六条”和交易所规则修订都覆盖到了,主线清楚;个别市场活跃度数据和地方配套延伸偏多,但不影响主体判断。
62025年AI行业研究报告3/54/5清单3/5终于给出了3份报告和结论,但报告权威性不均,尤其第三份更像行业观察而非代表性研究报告,信源质量一般。
7贵州茅台最新价/PE/总市值4/54/5清单3/5核心字段和时间都给到了,且与抽核行情基本一致;问题是延展分析偏模板化,信息增量有限。
8宁德时代成交额/换手率/PB4/54/5清单3/5题目字段回答完整,还补了A/H两地口径;不过港股信息属于额外展开,核心解读仍偏常规。
9比亚迪近三年营收/归母净利润/ROE3/54/5表格3/5近三年营收和净利给得较完整,但表格本身缺少ROE列,ROE只在后文文字里补充,完整性被拖了一档。
10招商银行近五年总资产/净利/负债率4/54/5表格3/5五年维度终于补齐,且抽核与已披露年报口径大体一致;不足是A/H并列展开较冗长,核心信息可以更收敛。
11贵州茅台 vs 五粮液估值对比4/55/5表格4/5PE、PB、ROE都正面回答,且估值溢价和盈利能力关系解释清楚,属于完成度较高的对比题。
12宁德时代 vs 比亚迪核心指标对比4/54/5表格4/5市值、PE、净利润增速都答到了,差异也解释得较清楚;不足是少量A/H混用和年度预测延伸让口径略复杂。
13A股ROE>15%公司筛选2/54/5表格2/5虽然做了筛选,但“代表性公司”里混入了 *ST 和异常样本,且自称代表性却明显缺少质量筛选,口径不严。
14消费板块PE<25公司筛选4/54/5表格3/5基于消费相关指数成份做筛选,结果比上一版更有依据;不过“代表性”仍偏向贴着25倍上限挑样本,结论价值一般。
15消费股PE<30且三年营收增长3/54/5表格3/5条件筛选比前面更完整,但“消费股”边界被放得很宽,汽车零部件占比偏高,题意贴合度不算理想。
16制造业净利>5亿且负债率<60%4/54/5表格3/5条件基本命中,名单也比上一版干净;但“制造业”仍混入部分泛题材口径,且代表性选择带有较强主观性。
17芯片板块净利润增长快公司筛选2/54/5表格2/5仍然存在板块污染,PCB、面板、通信设备等被一并纳入“芯片板块”,导致筛选结果失真。
18新能源板块ROE+换手率筛选1/54/5表格1/5结果中出现 *ST威尔、ST德豪、冰川网络 等明显非新能源核心样本,属于严重板块错配,筛选结果基本不可直接用。
19宁德时代基本面与投资逻辑4/55/5清单4/5基本面、商业模式、竞争优势、投资逻辑和风险都覆盖到了,结构很成熟;少量细节数据和券商预期偏多,证据边界略松。
20腾讯最近一期财报解读4/55/5清单4/5收入来源、利润改善和市场关注信号三部分都答到了,且与官方2025业绩方向基本一致;部分AI投入细项更像综合口径,严谨性稍弱。
21A股低估方向挖掘4/54/5清单4/5给出了3个方向、对应逻辑、催化剂和风险,整体完成度不错;“低估”判断仍带一定主观性,但不影响整体可用性。
22机构增配赛道与龙头识别4/54/5清单4/5这次不再是原始表堆砌,而是能明确说出赛道、依据和龙头,完成度明显提升;少量持仓和资金口径仍需用户二次核验。
23理想 vs 小鹏投资价值4/55/5表格4/5商业模式、盈利能力、估值逻辑、成长性四个维度都展开了,投资者分层建议也清楚;不足是预测值和券商目标价占比略高。
24茅台/五粮液/汾酒投资价值4/55/5表格4/5对稳健型投资者的判断逻辑比较完整,财务、估值、风险和配置建议都覆盖到了,属于质量较高的对比题。
25未来一个季度A股主线判断4/55/5清单4/5主线、辅助主线、支持逻辑和反证风险都写全了,结构非常完整;因为本质是判断题,事实分主要受宏观假设影响而非硬错误。
26新能源车产业链周期判断4/55/5清单4/5周期阶段、驱动力变化和未来两个季度观察变量都很清楚,读者可直接拿来跟踪;不足是部分全球统计口径未单独注明来源。
27100万中风险权益配置方案4/55/5表格4/5配置比例、动态调整条件、风险提示和执行节奏都覆盖到位,实操性很强;少量收益假设偏理想化,但不构成硬伤。
28机器人板块是否值得关注4/55/5清单4/5产业趋势、估值、催化和拥挤度四维回答完整,结论也相对克制;弱点在于部分产业进展和资金热度数据偏综合口径,不够“硬”。

总评

整体表现

这份东方财富 Skills 报告整体表现为中上水平,明显优于上一份对照样本

  • 优势集中在题意匹配度更高、答案组织更完整、分析展开更像正式投研输出
  • 短板集中在个别题目事实口径错误、筛选题板块污染、部分长文过度依赖综合研报式表述

简单说,它已经不只是“会排版”,而是大部分题目都能正面回答;但一旦进入选股筛选、板块归类或具体公告口径,仍会暴露出一些金融产品里很关键的严谨性问题。

最常见的3类问题

  1. 时间口径或财报口径错位

    • 典型如第1题,把2023年的业绩预告拿来回答2024年年报公告,且数值级别明显异常。
  2. 板块筛选污染

    • 芯片、新能源这类筛选题里,常出现明显不属于目标板块的样本,严重影响可用性。
  3. 分析很完整,但证据边界偏松

    • 长文分析题通常框架很好,但会混入较多综合判断、券商预期和推演性表述,需要用户自己二次核实。

最稳定的2-3类能力

  1. 题意承接能力

    • 相比许多泛化回答,这份报告大多数题目都能正面对应用户要求,不再频繁出现“问新闻答数据”的偏题。
  2. 结构化表达能力

    • 标题、分段、表格、总结、风险提示都比较齐全,扫读和引用都方便。
  3. 中长篇投研式分析能力

    • 在公司分析、行业趋势、主线判断和配置建议等题型上,逻辑框架比较成熟。

适合纳入评判表格的精简结论

东方财富 Skills 的优势是答题贴题度高、结构化能力强、长文分析较成熟;主要短板是个别题目存在财报时间错位,以及筛选题中板块归类不严、样本污染明显。

外部抽核要点

本次重点抽核的关键事实包括:

  • 比亚迪2024年年报公告题中,回答实际引用的是2023年业绩预告,且数值级别明显异常
  • 2024年并购重组政策的关键时间点里,“并购六条”发布时间为2024年9月24日
  • 腾讯2025年度业绩核心财务方向与官方年报公告基本一致
  • 贵州茅台2026年3月27日行情数据与报告中的价格、市值口径大体一致

参考来源:

原始体验实录

东方财富 Skills 原始体验报告

原始测试实录过长,不在页面内展开,保留 Markdown 下载以供完整查看。

Download Markdown

Appendix group

WindClaw

产品深度分析和 28 题评分保留页内阅读,但默认折叠,原始使用体验改为下载查看。

产品深度分析

WindClaw 产品深度分析

展开原文

WindClaw产品深度分析

一、战略层:先回答“这个产品为什么存在”

  1. 产品使命 / 商业使命

    1. 产品解决的问题是什么(为用户带来了什么价值)

    将原来复杂且门槛高的 AI 投研流程,变成普通投资者也能上手的产品

    1. 产品定位是怎样的

    是一个AI 投研智能体平台,支持多 Agent 协同与本地运行的专业化投研工具

  2. 核心用户需求

    1. 表层需求:满足用户及时获得想要的金融信息与知识(快速获得行情、财务、公告、行业信息的读取与分析)
    2. 深层需求:帮助用户实现投资决策(保证决策建立在专业数据之上)
    3. 痛点:解决了普通投资者在无法及时获得关注的金融产品的相关信息,在面对繁杂的信息时不知道该如何做决策的问题
  3. 战略契合与冲突:

    1. 契合:投资者可以获得真实可靠的金融信息,并且可以在AI的帮助下以专业的视角进行研究并做判断
    2. 冲突:WindClaw的定位是低门槛的 AI 投研工具,但是其内载的金融研究流程强调“深度研究、事实核验、专业数据驱动”的专业性。这意味着产品必须同时满足易用性专业深度,但是这两者天然存在冲突。工具的门槛再低,如果使用者不清楚其中运行的原理,必然无法得到自己真正想要的判断。而且如果所有投资者都能在WindClaw的帮助下做出正确且专业的判断,那整个市场应该是无法获利的。(所有人都挣钱,意味着所有人都不挣钱)(其他行业似乎是参与者越多,蛋糕越大;但金融市场是零和博弈,无论有多少人参与进来,必然有人挣钱,有人亏钱,这就和用户使用这款产品的目标产生了冲突:当用户挣不到钱,甚至亏钱,他还会使用这个产品么)
  4. 我的看法:WindClaw在低门槛专业性之间做了怎样的权衡?

    1. 如果只追求低门槛,那就是一个纯粹的信息展示平台,没有判断公司是否具有投资价值的功能、没有从已知信息中挖掘潜在投资机会的功能——这与没有AI赋能之前的wind平台似乎没有什么区别
    2. 如果只追求专业性,就应该彻底专业化WindClaw,保证信息来源的绝对可靠与及时,同时规范化AI投研流程——首先,及时保证信息与流程的规范,AI得出的投资建议就一定可靠么?(毕竟专业分析师很多时候也无法做到正确的判断);其次,假如AI的投资建议真的没有问题,所有人都用一样的投资建议,岂不是所有人都挣不到钱

二、范围层

  1. 功能全景图

我的投资小龙虾万得官方智能体
微信ClawBot连接WindClaw与微信,发送指令,随时随地控制WindClaw最新动态WindClaw最新的相关信息
聊股票一起分析公司的基本面、商业模式和竞争优势,判断它是否值得投资。精选案例Wind Alice金融大模型的相关调研分析报告
找机会让投资小龙虾帮你从已知信息中,挖掘潜在投资机会。常见问题对Wind Alice使用的模型,以及数据的透明性、输入数据的安全性、金融场景的合规性的相关解释
做对比通过横向比较不同公司或行业,找到更优选择。关于我们相关内容
谈大势讨论宏观经济、行业趋势和市场周期,理解市场的大方向。
论策略一起寻找新的投资思路和市场机会,挖掘可能跑出来的行业和股票。
  1. 核心功能深度拆解

    功能一:微信ClawBot

    1. 功能描述:连接WindClaw与微信,发送指令,随时随地控制WindClaw。点击即会出现一个二维码,用微信扫描后就能将WindClaw与微信连接,在微信界面就能看到微信clawbot从而与WindClaw联系。
      1. 核心功能:通过微信clawbot直接要求:股票分析、市场研究、宏观政策、基金与资产配置、信息收集与整理
      2. 具体实现方法:直接在微信clawbot中提出要求
      3. 特点:优先使用 Wind 金融数据;能够记住用户的偏好,不断优化服务
    2. 设计逻辑:
      1. 跨平台服务:通过多数用户最经常使用的微信平台,随时获得用户想要的信息,且能保证信息来源的可靠性,符合产品设计中低门槛、信息来源确切的定位
      2. 复杂能力简单化:各种复杂的投研能力被简化成一句话就能触发,降低操作门槛
      3. 增强用户黏性:首先,微信是多数用户最常使用的社交平台之一,与微信绑定不仅能提高被使用的可能性,还能通过微信的聊天、朋友圈以及公众号等平台分享投研信息,满足用户的投资社交需求;其次,通过不断与WindClaw沟通,其能够记住用户偏好,不断优化服务,强调了长期陪伴和习惯养成能力
    3. 用户心理:
      1. 即时性心理:能够在想到问题时立刻能问,不想等回到电脑再操作
      2. 连续服务心理:面对不理解的专业问题能够立刻得到答案,并且系统能记住偏好、逐步理解用户常问方向
      3. 专业信任心理:鉴于Wind平台的专业性,比起可能有幻觉的其他LLM,更优先选择WindClaw
    4. 我的评价:微信ClawBot是WindClaw降低用户门槛理念的最直接的体现

功能二:聊股票\找机会\做对比\谈大势\论策略

  1. 功能描述:不同功能之间的区别主要在于分析框架的不同,除此之外底层模型和数据库来源没有任何区别
    1. 分析框架主要分为三个:个股分析、市场分析、宏观分析
    2. 板块分析对象问题特征具体主题个股分析单只股票"XXX 公司/股票怎么样?"投资逻辑梳理 - 公司为什么值这个价 基本面分析 - 商业模式、竞争力 财务分析 - 资产负债表、利润表、现金流 技术分析 - 股价走势、量价关系 资金面解读 - 主力/机构资金动向 公司速览 - 一页纸速懂一家公司 战略分析 - 管理层长期规划 财报解读 - 最新财报详细拆解 同业比较 - 与竞争对手对比 机构研究汇总 - 分析师观点汇总 优劣机会分析 - SWOT 分析 重大事件点评 - 并购、重组等事件 近期事件动态 - 最新业务进展 近日异动原因 - 股价为什么大涨大跌 投资者问答精粹 - 机构调研问答(总共15个)市场分析大盘/市场整体"今天股市怎么样?"、"市场情绪如何?"全球股市联动综述 - 跨市场风险传导 全球金融市场综述 - 股票/债券/商品/外汇整体表现 盘前市场综述 - 开盘前重点关注 盘中市场简评 - 盘中异动解释 盘后市场简报 - 收盘复盘 新股情报 - 新股发行申购 再融资情报 - 定增配股影响 每日大宗交易解读 - 机构大宗买卖 每日龙虎榜解读 - 游资席位动向 南向沪港通解读 - 港股通资金流向 市场情绪解读 - 投资者信心指标(总共11个)宏观分析国家/区域/全球"美联储加息有什么影响?"、"中国经济怎么样?"全球宏观综述 - 全球经济/通胀/政策主线 宏观经济综述 - 中美欧等大国经济数据 国际关系解读 - 地缘政治对经济影响 财政策解读 - 政府收支/赤字/基建 货币政策简报 - 利率/央行操作/流动性 区域经济分析 - 省市产业结构/增长潜力(总共6个)
    3. 聊股票:分析公司的基本面、商业模式和竞争优势。包括:梳理公司投资逻辑,分析公司基本面、资金面,对公司股票做技术分析,了解公司情况,公司财报解读等
    4. 找机会:挖掘潜在投资机会。包括:判断市场被低估的板块或主体方向,提供资金布局信息,机构持仓情况,龙头公司的判断等
    5. 做对比:横向比较不同公司或行业。包括:同行业公司对比,同板块股票对比,国内外同行业股票对比,不同股票市场对比等
    6. 谈大势:讨论宏观经济、行业趋势和市场周期。包括:龙虎榜数据分析,全球市场情绪判断,各国财政政策分析,全球宏观动向,国家经济解读等
    7. 论策略:寻找新的投资思路和市场机会。包括:自有资金配置,市场主线判断,分析行业是否值得关注,板块走势分析等
    8. 注意:WindClaw的回复逻辑是基于用户问的问题内容,而不是基于用户之前选择的模板。不同的问题界面的选择更像是给用户提供预设的问题,而不是真的只能通过模板回答问题。
    9. 核心功能:根据Wind数据库的专业数据,回复用户提出的问题。相当于是LLM模型加上Wind的专业数据库,所以输出内容的质量很高。重要的是,当用户提出能够给出具体的投资建议的时候,WindClaw会给出具体且确切的投资意见,甚至会给出具体仓位配置建议、期权策略或对冲方案等
    10. 特点:数据来源可靠,输出内容清晰,会给出具体的投资建议
  2. 设计逻辑:
    1. 专业投研流程产品化:对不同的专业投资问题提供不同但对应的模板,方便用户进行信息的收集与判断。大大降低了普通用户进行专业投研的门槛,同时也为专业投资者的研究节省了时间
    2. 复杂能力简单化:解决了深层金融信息不知道从哪里获得;获得金融信息不知道如何处理的金融深层调研问题
  3. 用户心理:
    1. 节省判断成本:未必清楚该如何组织分析框架,但知道自己是想“聊股票”还是“找机会”。任务式入口降低了提问负担
    2. 结果可信:信息来源可信、可核验、及时,解决了用户对金融信息的强准确性、强及时性的要求
    3. 效率高:用户不是想单纯获取信息,而是希望直接得到围绕个股、行业、市场、策略的结构化分析,并得到确切的投资建议
  4. 我的评价:虽说本质上只是可靠的金融信息源与LLM的结合,但是能做到信息源的可靠与集成平台的结合,只有Wind这样的龙头才能做到。而且基于详细分析与简洁判断的结合,完全覆盖了从普通用户到专业投资者的用户范围,这是WindClaw最为核心的功能体现

功能三:自动化任务

  1. 功能描述:

    1. 核心功能:创建定时任务以自动化 AI 工作流。任务可以在指定时间发送消息、运行查询或执行操作。
    2. 具体实现方法:WindClaw 通过 Cron 定时任务系统 实现自动化
    3. 具体表现如下:
    4. 类型示例频率定时资讯推送每日盘前/盘后市场简报每天固定时间数据监控持仓股票价格异动提醒实时/分钟级例行报告周度行业综述、月度宏观分析每周/每月简单查询定时获取汇率/利率数据按需设定定期整理自动整理聊天记录生成周报每日/每周
    5. 交互式操作、破坏性操作、实时决策、隐私敏感等操作无法实现自动化
    6. 特点:任务在云端网关执行,不依赖本地机器。即使网络断开,任务会等待网络恢复自动进行;自动化;多个任务可同时进行
  2. 设计逻辑:

    1. 提升工作连续性:任务在后台持续执行,不依赖用户一直守在本地界面
    2. 减少高频重复工作:替用户接管重复劳动,并对信息做自动化解析与结构化处理。提高工作效率
    3. 避免高风险行为:对破坏性、隐私敏感操作等行为不做自动化,保留较高的边界
  3. 用户心理:

    1. 稳定性预期:WindClaw能够长期、持续执行自动化任务,且任务数据来源有保障
    2. 风险控制心理:把重复性工作交给系统,但不会让 AI 做高风险操作。自动化边界清晰,增强信任
  4. 我的评价:本质上是openclaw的低风险应用。但是很符合金融场景,尤其是金融数据的定时推送,无论对于普通投资者买股票还是专业投资者做研究都很有用

  5. 具体使用体验:

    1. 如果要获取全球(国外)新闻,需要额外配置 Brave Search API等数据源(如果有相应的API,claw可以帮忙配置)
    2. 没有实时的 Web 搜索能力,新闻数据来源于Wind 系统,而Wind 的新闻/公告数据库通常有1-2 周的延迟。如果想要联网搜索,需要自己额外配置相应的API
    3. 不是完全无法获得金融信息,但是接口只能支持结构化金融数据,类似于股票价格、成交量、涨跌幅;而非结构化新闻/公告无法获得,Wind 的新闻数据库有1-2 周延迟
    4. 经过检测,新闻、政策等内容的延迟可能远不止1-2周,wind无法显示2026 年 1 月政策新闻
    5. 对政策方面的内容几乎没有太多有效的结果,查询并购重组相关监管政策,甚至2024年的政策数据也是不全的
    6. 对于研报的获取也是一塌糊涂,我让其列出2025年发布的人工智能行业研究报告,列出3份具有代表性的报告,并总结其结论,WindClaw无法做到;要求其列出3份华泰在2026年1月发布的关于人工智能行业的研究报告,也无法直接获取
    7. 结构化金融数据获取方面表现优异

更多内容见 AI投研产品具体使用体验测试 中关于WindClaw的测评情况

  1. 价格标准

img

其他:每日免费赠送5000积分

28题体验评分

WindClaw 28题体验评分

展开原文

WindClaw 28题体验评分结果

评判对象:/Users/sutianrun/Desktop/WindClaw产品使用体验.md

评判标准:金融分析型产品体验评判标准 v1
评判口径:外部事实抽核 + 文档内容评估
说明:本次以“是否回答到题、关键事实是否站得住、结构是否清楚、分析是否克制”为主;外部核验采用关键事实抽查,不等同于逐项审计。

逐题评分

序号题目简称内容完整性与准确性结构清晰度格式可用性解读质量简要原因
1比亚迪2024年报公告总结4/55/5表格4/5外部抽核显示年报核心数据与官方年报大体一致,但题目要求覆盖“业绩预告/快报/正式财报公告”,回答实际上只落在正式年报。
22026年1月新能源行业重大新闻1/54/5表格2/5题目要“重要新闻/重大事件”,回答基本没有列新闻事件,而是用销量、装机和财务数据替代,属于明显题不对题。
32026年1月A股半导体上涨原因3/55/5表格3/5资金面拆解较完整,但“政策因素”主要是推断,缺少对应月份的具体政策或行业消息支撑,区分度不够扎实。
4小米汽车2025年舆情追踪1/54/5清单1/5题目要求梳理具体舆情事件、发酵、回应和进展,回答大多是基于销量和传闻做推演,缺少可核验事件与官方回应。
52024年并购重组政策与影响2/53/5清单2/5外部抽核显示“并购六条”发布时间是2024年9月24日,不是回答中写的5月;同时政策覆盖明显不足,影响分析偏泛。
62025年AI行业研究报告1/54/5清单2/5题目要列“3份代表性报告”,回答却变成公司/产业概览,没有给出报告名称、机构和核心结论,核心任务未完成。
7贵州茅台最新价/PE/总市值4/55/5表格3/5字段齐全、时间写明,外部行情抽核与文中数值接近;不足在于解释较泛,更多是常规描述。
8宁德时代成交额/换手率/PB4/55/5表格3/5回答直接命中题目字段,时间也给出;解读属于常规估值描述,深度一般。
9比亚迪近三年营收/净利/ROE2/54/5表格3/5“近三年”却只给了2023、2024和“2025暂无数据”,既没有补足2022,也没有把时间口径解释得足够清楚。
10招商银行近五年总资产/净利/负债率2/54/5表格3/5外部抽核显示最新已披露口径更接近2025三季报而非完整2025年报,回答把未充分披露的年度数据直接写满,准确性存疑。
11贵州茅台 vs 五粮液估值对比4/55/5表格4/5指标选择与结论对应关系较好,表格清晰,结论也区分了“质量溢价”和“估值性价比”。
12宁德时代 vs 比亚迪核心指标对比3/54/5表格3/5把实际数据、预测数据和缺失项混在一张表里,虽然能看出比较逻辑,但口径不够统一。
13A股ROE>15%公司筛选2/54/5表格2/5回答先说“剔除ST/*ST及异常样本”,结果名单里仍出现风险警示和一次性因素很强的公司,筛选纪律不够严格。
14消费板块PE<25公司筛选3/54/5表格3/5基本完成筛选任务,但“消费板块”边界偏宽,部分公司归类更像泛消费而非狭义消费。
15消费股PE<30且三年营收增长2/54/5表格2/5多家公司行业归类明显放宽,如安防、汽车零部件、商用车被并入消费股,导致筛选口径偏离题意。
16制造业净利>5亿且负债率<60%4/55/5表格3/5条件匹配度整体较高,名单可读性也不错;不足是“代表性公司”主观性较强,缺少筛选时间点说明。
17芯片板块净利润增长快公司筛选2/54/5表格2/5名单中混入了并非严格芯片板块的公司,且包含风险警示样本,板块定义和筛选口径都不够严谨。
18新能源板块ROE+换手率筛选3/54/5表格3/5结果数量解释清楚,但换手率口径没有展开说明,且板块边界依然偏宽,属于可用但不够严。
19宁德时代基本面与投资逻辑3/55/5表格3/5框架完整、可读性强,但大量2025经营细项和竞争格局判断缺少明确出处,部分结论说得过满。
20腾讯最近一期财报解读4/55/5表格4/5外部抽核显示收入、利润、毛利率等核心方向与官方2025年度业绩基本一致;不足是部分细分拆解和回购表述偏推算。
21A股低估方向挖掘3/54/5清单3/5提供了3个方向、催化剂和风险,完成度不错,但个别“低估”依据与文中估值分位表述存在张力,论证不够扎实。
22机构增配赛道与龙头识别1/51/5表格1/5基本是原始大表堆砌,既没有提炼“哪些赛道被增配”,也没有清楚给出依据和龙头,几乎不可直接使用。
23理想 vs 小鹏投资价值3/55/5表格3/5对比框架完整,但使用了较多2025-2026口径数据和预测,部分财务与交付表述缺少清晰来源说明。
24茅台/五粮液/汾酒投资价值3/55/5表格4/5“稳健型投资者”视角切得较准,结论也有可读性;问题在于较多2025-2026预测值被直接纳入核心判断。
25未来一个季度A股主线判断3/54/5清单3/5有主线、有反证风险,形式完整;但核心判断对短期宏观、政策和资金的假设较重,证据链不算强。
26新能源车产业链周期判断3/55/5表格4/5周期框架、观察变量和风险提示都比较成熟,但部分关键数据和阶段划分缺少更直接的可核验证据。
27100万中风险权益配置方案4/55/5表格4/5对配置思路、比例、动态调整和风险提示覆盖完整,实操性强;主要扣分点是对未来市场环境的判断较依赖场景假设。
28机器人板块是否值得关注2/55/5表格2/5分析框架很完整,但部分关键依据明显可疑,例如ETF资金流出数值异常夸张,导致结论基础不稳。

总评

整体表现

WindClaw 这 28 题的整体表现属于中等偏上,但分化明显

  • 优势主要集中在结构组织、表格化呈现、分析框架完整
  • 短板主要集中在题意匹配、事实严谨性、筛选口径一致性

如果只看“好不好读”,整体体验不差;但如果按金融分析产品的标准看“是否真回答到点上、能不能直接用于判断”,质量波动很大。

最常见的3类问题

  1. 题不对题

    • 新闻、政策、舆情、研报类题目,常被替换成销量、财务数据或泛行业背景,导致核心任务没完成。
  2. 事实与推断边界不清

    • 已披露数据、市场预期、推测性政策利好经常混写,读起来像确定事实,但核验后并不都站得住。
  3. 筛选口径不严

    • 板块定义经常放宽,个别样本与题目条件并不完全一致,甚至出现“先声明剔除,后面又列入”的自我冲突。

最稳定的2-3类能力

  1. 信息整理能力

    • 回答普遍有标题、分段、表格和总结,扫读体验较好。
  2. 简单数据查询能力

    • 单标行情、估值、多字段展示类题目整体较稳,尤其是字段明确、范围较小的任务。
  3. 中长篇分析框架搭建能力

    • 在基本面分析、周期判断、配置建议等题型上,结构和逻辑框架通常比较完整。

适合纳入评判表格的精简结论

可直接摘录为一句话总评:

WindClaw 的长处是结构清晰、表格化能力强、分析框架完整;短板是新闻/政策/舆情类题目经常题不对题,且部分答案存在事实与推断混写、筛选口径不严的问题。

外部核验依据

本次重点抽核了以下高风险事实:

  • 比亚迪2024年年度报告核心财务数据与年报披露基本一致
  • “并购六条”正式发布时间为2024年9月24日,不是5月
  • 腾讯2025年度业绩公告已正式披露,核心收入和利润方向可核验
  • 招商银行“近五年”若按最新已披露口径,更接近2022年报-2025三季报,并非完整2025年报

参考来源:

原始体验实录

WindClaw 原始使用体验

原始测试实录过长,不在页面内展开,保留 Markdown 下载以供完整查看。

Download Markdown

What this case proves

我想证明的不是“我会写一份竞品分析”,而是我能定义问题、控制变量、设计标准,并把体验判断转化成更可信的产品结论。