结果 | Financial 10-K Text Agent

预注册主预测

Ridge Rank IC = 0.2395

对未来 20 日实现波动率有正向样本外排序信息；原始 p 值 0.00067。

正确解读 模型预测波动率较高的公司，之后通常也排在较高波动率位置；这不是收益或交易结论。

得到支持波动率排序

预注册主预测规格完全覆盖，且方向为正。

尚未建立可交易 alpha

主组合 Sharpe -0.8539，原始 p 值 0.1147。

通俗解释

Rank IC 表示什么，又不表示什么

Rank IC 衡量的是排序一致性，因此回答风险排序问题，而不是投资收益问题。

衡量什么 两个排序之间的一致程度

模型按预测未来波动率排列公司，Rank IC 将该顺序与实际实现波动率顺序比较。

正值意味着什么 预测风险较高的公司之后通常也排得更高

正值表示在该固定面板中存在有用的排序信息，不代表点预测完全准确。

不能证明什么 预测精度、因果效应或交易利润

这些需要单独的指标和更强数据；预注册组合检验没有建立 alpha。

运行摘要

应用级公开证据

500

SEC 10-K 年报

8,133

样本外预测

520,465

特征记录

594

测试规格

26

检验族

100%

合格样本外覆盖率

0

关键审计失败

2

已披露范围警告

一条真实记录，全链路展示

追踪一份 10-K 如何通过数据管线

这条 MSFT 2022 财年实例把 SEC 原始年报、解析文本、质量控制、文本特征和防泄漏测试标签连接起来。

真实 v4 记录 Microsoft Corporation · FY2022 · SEC EDGAR 原文节选已缩短

1原始年报

Microsoft FY2022 10-K

SEC 接收时间：2022-07-28 16:06:19 UTC。
查看 SEC 原始文件 ↗
2解析结果

ITEM 1A. RISK FACTORS

规范化为 Risk Factors · item_1a

“Our operations and financial results are subject to various risks and uncertainties, including those described below…”
3质量门槛

正常 · 纳入

10,344 词 · 70,310 字符 · 未被排除出段落级特征。
4特征输出

金融词典特征

负面词
459 · 4.44%

不确定词
332 · 3.21%

正面词
112

诉讼词
198
5时间切分

2022 测试集

事件日 2022-07-28；实现波动率标签窗口为 2022-07-29 至 2022-08-25。

训练 2016–2020 · 验证 2021 · 测试 2022 · 20 日 embargo

查看记录标识与完整性哈希

Document ID: sec:0000789019:0001564590-22-026876:msft-10k_20220630.htm
解析器版本: sec-10k-section-parser-v0
原始文件 SHA-256: d8c69513cd820ecdfa3b22decf2672591ced88996188c218d3ffa1439b6b528f
段落 SHA-256: b9fd4b02912605455cb3af934ee6b68001a8abfc44bf999310069f5788b436c3

探索一组产物

查看一条预测背后的证据

在年报、预测、模型和审计记录之间切换。以下数值来自已发布的 v4 运行，并非为网页编造的演示数据。

Filing manifest

MSFT · FY2022 10-K

已解析

来源: SEC EDGAR
接收时间: 2022-07-28 16:06:19 UTC
段落: item_1a · Risk Factors
使用策略: include

Prediction record

未来 20 日实现波动率

测试观测

预测值0.01502

实际值0.01377

标签窗口: 2022-07-29 → 2022-08-25
标签质量: complete
Model ID: ridge::realized_volatility_1_20::train_2016_2020__val_2021_2021__test_2022_2022

这条观测仅用于展示记录关联和时间对齐，不能单独验证模型准确性。

Model manifest

综合文本 Ridge

工作区干净

配置: alpha=10.0 · standard scaler
特征数: 395
观测数: 训练 208 · 验证 45 · 测试 50
随机种子: 42
代码状态: 4d94dcf59e8f09ccd5b23e2902ec342e8c029126 ↗

查看已发布模型清单 ↗

Audit report

数据泄漏控制与数据边界

范围警告

通过
特征前视
预测时间之后生成的特征记录为 0。
通过
TF-IDF 拟合范围
违反仅在训练窗口拟合的清单为 0。
通过
模型选择
使用非验证集指标选模的调参日志为 0。
警告
市场数据边界
FMP/Yahoo 混合来源使本项目属于应用级试验，而不是等价于 CRSP/WRDS 的正式复现。

查看已发布审计报告 ↗

预注册主结果

综合文本 Ridge

realized_volatility_1_20, 用 ALL_SPLITS Rank IC 评价。

Rank IC0.2395

原始 p 值0.00067

支持正向探索性波动率排序证据。

最佳探索性观察结果

仅 TF-IDF/SVD 的 Ridge

最强的模型比较观察结果，不是预注册主结论。

Rank IC0.3668

NW t-stat5.4055

RMSE 0.00992.

特征消融

原始与行业中性 Rank IC

在 split 内行业去均值后，文本表示仍保留正向排序诊断。

原始 Rank IC行业中性 Rank IC

仅 TF-IDF/SVD

0.3668 / 0.3416

行业 + 文本

0.3296 / 0.3251

仅行业

0.2924 / 0.0000

仅词典

0.2244 / 0.2465

综合文本

0.2395 / 0.2023

特征集	估计器	Rank IC	行业中性 Rank IC	RMSE
仅 TF-IDF/SVD	Ridge	0.3668	0.3416	0.00992
行业 + 文本	Ridge	0.3296	0.3251	0.01076
仅行业	Industry mean	0.2924	0.0000	0.00913
仅词典	Ridge	0.2244	0.2465	0.00984
综合文本	Ridge	0.2395	0.2023	0.01932

Bootstrap 推断

主 Rank IC 置信区间

使用 2,000 次确定性重抽样。橙色线表示零；区间跨过零时，在该聚类方式下结论不充分。

95% 置信区间零

Split4 个样本外簇

[-0.0050, 0.4841]

事件日事件日聚类

[0.0719, 0.3743]

Ticker公司聚类

[0.1091, 0.3522]

诚实解读：原始主信号在事件日和 ticker 聚类下保持为正，但 split bootstrap 只有四个样本外簇，因此结论不充分。

估计量	方法	点估计	95% CI	p-value
原始 Rank IC	Split bootstrap	0.2395	[-0.0050, 0.4841]	0.111
原始 Rank IC	事件日 bootstrap	0.2395	[0.0719, 0.3743]	0.005
原始 Rank IC	Ticker 聚类 bootstrap	0.2395	[0.1091, 0.3522]	0.001
行业中性 Rank IC	Split bootstrap	0.2023	[-0.1157, 0.5202]	0.117
行业中性 Rank IC	事件日 bootstrap	0.2023	[-0.1546, 0.4273]	0.366
行业中性 Rank IC	Ticker 聚类 bootstrap	0.2023	[-0.1787, 0.4181]	0.357

覆盖率与控制

原始标签覆盖率为 49.6%，合格样本外覆盖率为 100%，模型预期预测覆盖率为 98.546%，主预测 / 主组合覆盖率为 100%。

数据边界

本公开数据实验使用 FMP/Yahoo 混合市场数据和应用级市值估计，不是 CRSP/WRDS 等价的无幸存者偏差复现。

代表性证据文件

查看公开文件

因子卡片最快结果摘要实证报告完整文字报告特征消融文本与行业对比审计报告覆盖率与警告多重检验规格族 Parser 复核section 质量附录

可复现性

在本地运行公开代码

git clone https://github.com/uiclxh/financial-10k-text-agent.git
cd financial-10k-text-agent
python -m pip install -e ".[dev]"
python -m ruff check .
python -m pytest

公开仓库不包含原始授权输入数据。

结果与文件

Ridge Rank IC = 0.2395

Rank IC 表示什么，又不表示什么

应用级公开证据

追踪一份 10-K 如何通过数据管线

Microsoft FY2022 10-K

`ITEM 1A. RISK FACTORS`

正常 · 纳入

金融词典特征

2022 测试集

查看一条预测背后的证据

MSFT · FY2022 10-K

未来 20 日实现波动率

综合文本 Ridge

数据泄漏控制与数据边界

综合文本 Ridge

仅 TF-IDF/SVD 的 Ridge

原始与行业中性 Rank IC

主 Rank IC 置信区间

覆盖率与控制

数据边界

查看公开文件

在本地运行公开代码