跳转到主要内容
对比对象: 接入方式:OTel + 官方转换器——events: otelEvents({ dialects: [otel.codex] }): 工具调用和 usage 从 codex CLI 原生 OTLP(config.toml 的 [otel] 块)的 span 派生,瀑布图 经官方 mapCodexSpans 归一;span 上没有的消息文本由官方转换器 fromCodexThreadEvents 从原生 ThreadEvent 帧翻译。没有 HITL(Codex SDK 不支持)。eval 测的是真实编码任务 (在工作目录里写文件、跑命令),断言直接读磁盘验证。应用由你自己启动(pnpm start), eval 不代管进程。应用侧 src/backend/* 逐字节未变。 接入的全部代码变更(生成时从两个目录实测统计):

文件清单

codex-sdk/
├── package.json                    修改
├── tsconfig.json                   修改
├── pnpm-workspace.yaml             修改
├── niceeval.config.ts              新增
├── agents/
│   └── codex-sdk.ts                新增
├── evals/
│   ├── basic-qa.eval.ts            新增
│   ├── create-file.eval.ts         新增
│   ├── run-command.eval.ts         新增
│   └── session-isolation.eval.ts   新增
└── experiments/
    └── codex-sdk.ts                新增

应用侧的变更(只有依赖声明)

新增的 adapter、evals 与 experiments