Software Engineering Philosophy Dimension 3: Ethics - 系统应该允许什么 26

问责与可解释性

核心问题

当系统做出影响用户的决定时，谁负责？用户能否理解？

现代软件系统会做很多决定：

是否允许登录
是否允许购买
是否允许访问课程
是否通过审核
是否推荐某个内容
是否标记为风险
是否封禁账号
是否允许退款
是否展示某个价格

这些决定不只是技术结果。它们会影响人的机会、权益、金钱、声誉和体验。

所以系统必须回答两个问题：

Accountability：谁对这个决定负责？
Explainability：这个决定能不能被理解和追溯？

自动化不消除责任

一个危险说法是：

这是系统自动判的。

这句话不能作为责任终点。

系统自动做决定，并不意味着没人负责。

因为自动化系统是人设计的：

谁定义了规则？
谁选择了指标？
谁批准上线？
谁设置阈值？
谁监控误伤？
谁处理申诉？

自动化可以提高效率，但不能把责任藏起来。

核心句：

自动化可以执行决定，但不能承担责任。

Decision Record：记录决定

高影响决定应该留下 decision record。

例如风控拒绝提现：

type DecisionRecord = {
  decisionId: string
  subjectId: string
  decisionType: "withdrawal_rejected"
  outcome: "rejected"
  reasonCodes: string[]
  policyVersion: string
  decidedAt: Date
  actor: "system" | "human"
  requestId: string
}

它至少要回答：

对谁做了决定？
做了什么决定？
为什么？
用的是哪版规则？
什么时候做的？
是系统还是人做的？
能否复查？

没有 decision record，团队只能事后猜。

Reason Code：解释的最小单位

不要只返回：

Rejected

要有稳定 reason code：

ACCOUNT_SUSPENDED
COURSE_ARCHIVED
PAYMENT_RISK_HIGH
REFUND_WINDOW_EXPIRED
ORGANIZATION_MEMBERSHIP_INACTIVE

Reason code 的价值：

用户能获得更清楚提示
客服能解释
工程能排查
监控能聚合
审计能复盘
申诉能定位

注意：不是所有 reason 都适合完整暴露给用户。

例如风控场景，如果暴露太细，攻击者会绕过规则。

所以可以区分：

internalReason: PAYMENT_RISK_DEVICE_MISMATCH
userFacingReason: PAYMENT_COULD_NOT_BE_VERIFIED

原则：

系统内部要足够可解释，对外解释要兼顾透明和安全。

可解释性不是暴露所有细节

可解释性不等于把所有算法、规则、阈值都公开。

尤其在风控、反作弊、安全系统里，过度透明会帮助攻击者。

好的可解释性是：

给出足够让用户理解和纠正的信息，同时不破坏系统安全。

例如：

你的课程未通过审核，因为封面图不符合平台规范。
请上传清晰、无侵权、无诱导性文字的封面图后重新提交。

这比：

审核失败。

更好。

但不需要暴露：

模型分数 0.734，阈值 0.72，命中了规则 RISK_17。

Appeal：申诉和纠错路径

高影响决定必须有纠错路径。

例如：

封禁账号
拒绝提现
下架课程
拒绝认证
风控拦截
内容审核失败

申诉系统应该有：

可提交申诉
可补充材料
可查看状态
有 SLA
有人工复核
有复核记录
有最终结果说明

没有申诉路径的自动化决策，会变成不可挑战的权力。

核心句：

影响越大，越需要可纠错。

Audit Trail：审计链

责任需要证据。

高风险操作和决定应该有 audit trail：

type AuditTrailEntry = {
  actorId: string
  action: string
  resourceType: string
  resourceId: string
  before?: unknown
  after?: unknown
  reason?: string
  occurredAt: Date
  requestId: string
}

适合审计的行为：

管理员修改权限
客服查看敏感信息
手动退款
课程下架
账号封禁
数据导出
impersonation
风控人工放行

审计不是为了吓人，而是为了：

让权力可追溯。

Policy Version：规则版本

很多系统会忽略规则版本。

例如用户在 2026-06-01 被风控拒绝。

之后规则改了。

一个月后用户申诉，团队要知道：

当时用的是哪版规则？

所以高影响决策要记录：

policyVersion
modelVersion
ruleSetVersion
thresholdVersion

否则你无法复现当时的判断。

这对风控、审核、推荐、定价、权限都很重要。

Human-in-the-loop：人类在回路中

不是所有决定都应该完全自动化。

可以按影响程度分层：

低影响：自动决定
中影响：自动决定 + 可申诉
高影响：自动初筛 + 人工复核
极高影响：人工批准 + 系统辅助

例如：

评论垃圾检测：自动隐藏 + 可申诉
课程下架：自动标记 + 人工确认
大额提现拒绝：风控提示 + 人工复核
永久封号：人工批准

人类介入不是为了否定自动化，而是为了给高影响场景留下判断和责任。

Accountability 检查清单

设计自动决策时问：

这个决定会影响用户什么权益？
决定是系统做的、人做的，还是混合做的？
谁负责这套规则？
是否记录 reason code？
是否记录 policy/model/rule version？
用户能否获得可理解解释？
用户能否申诉或纠错？
客服能否查看证据链？
工程能否复现当时判断？
高风险操作是否有 audit trail？

小结

自动化可以执行决定，但不能承担责任。
高影响决定应该留下 decision record。
Reason code 是解释、监控、审计和申诉的基础。
可解释性不是暴露所有细节，而是让用户理解和纠错。
影响越大，越需要申诉路径。
审计链让权力可追溯。
高影响规则要记录 policy/model/rule version。
人类介入是高影响系统里的责任机制。