Software Engineering Philosophy Dimension 3: Ethics - 系统应该允许什么 25

公平性与偏见

核心问题

系统的决定是否对不同人产生了不合理的不公平？

软件系统经常看起来中立：

只是一个排序算法。
只是一个推荐模型。
只是一个风控规则。
只是一个审核策略。
只是一个评分系统。

但这些系统都会影响用户机会：

谁被看见？
谁被推荐？
谁被拒绝？
谁被审核？
谁被限流？
谁被标记为风险？
谁更容易获得资源？

所以公平性不是只属于 AI 模型的问题。

任何做排序、推荐、分配、审核、风控的系统，都有公平性问题。

偏见不一定来自恶意

很多偏见不是有人故意歧视。

它可能来自：

历史数据本身有偏
样本不均衡
代理变量
指标选择
反馈回路
冷启动问题
审核标准不一致
系统默认值

例如课程推荐系统只优化点击率。

结果可能是：

标题党课程获得更多曝光
深度课程被压下去
新讲师没有机会
已经热门的课程越来越热门
小众主题永远没有足够数据

系统没有恶意，但结果仍然偏。

核心句：

偏见常常不是写在代码里的歧视，而是藏在数据、指标和反馈回路里的倾斜。

指标就是价值判断

推荐系统优化什么，就会塑造什么。

如果优化：

click-through rate

系统会偏向吸引点击的内容。

如果优化：

watch time

系统会偏向让用户停留更久的内容。

如果优化：

course completion

系统可能偏向短课程或容易完成的课程。

如果优化：

revenue

系统可能偏向高价课程。

没有中立指标。

每个指标都在告诉系统：

什么结果更重要。

所以设计指标时要问：

这个指标鼓励什么行为？
它会牺牲什么？
谁会因此受益？
谁会因此被边缘化？
有没有 guardrail metric？

代理变量

有时候系统没有直接使用敏感属性，但用了代理变量。

例如不使用年龄，但使用：

毕业年份
工作年限
职位级别

不使用地区，但使用：

邮编
学校
公司
IP 地址
设备价格

这些变量可能间接反映敏感属性。

所以公平性检查不能只问：

我们有没有用敏感字段？

还要问：

有没有变量在事实上充当敏感字段的代理？

反馈回路会放大偏见

排序和推荐系统特别容易形成反馈回路。

例如：

热门课程获得更多曝光
  -> 更多点击
  -> 更多购买
  -> 系统认为它更好
  -> 获得更多曝光

这会造成 winner-takes-all。

新课程、新讲师、小众主题很难突破。

如果系统只相信历史表现，就会持续奖励已经有优势的人。

缓解方式：

新内容探索流量
曝光配额
多样性约束
分层排序
冷启动扶持
指标分组观察

审核与风控的误伤

风控系统通常在两个错误之间权衡：

False Positive：误杀正常用户
False Negative：放过坏行为

例如反作弊系统：

误杀：正常用户被封号。
漏判：作弊用户继续获利。

不同业务会选择不同权衡。

但伦理问题在于：

被误伤的人是否有申诉和纠错路径？

如果系统自动封号，但用户无法知道原因、无法申诉、无法恢复，那就把机器判断变成了不可挑战的权力。

公平性需要分组观察

整体指标正常，不代表每个群体都正常。

例如：

总体课程推荐点击率提升 5%

但拆开看：

头部讲师 +12%
新讲师 -18%
英语课程 +9%
小语种课程 -25%
高价课程 +15%
免费课程 -8%

所以公平性需要分组指标。

可能的分组：

新用户 / 老用户
新创作者 / 头部创作者
不同地区
不同语言
不同组织规模
不同价格区间
不同课程主题
被风控命中 / 未命中用户

注意：分组观察本身也要遵守隐私和合规，不能为了公平性无限收集敏感数据。

Explainability：给出可理解原因

当系统做出影响用户机会的决定时，应该尽可能提供解释。

例如：

你的课程暂未推荐，因为缺少封面图、课程完成率数据不足、最近退款率较高。

比：

系统评估未通过。

更有帮助。

可解释性不是要求暴露所有算法细节，而是：

用户应该知道自己被影响的大致原因，以及是否有改善或申诉路径。

Human Review：人类复核

高影响决策不应完全没有人工纠错。

例如：

封号
拒绝提现
下架课程
拒绝企业认证
标记欺诈
大额退款拒绝

如果自动系统做错，用户需要有路径让人介入。

人工复核也要有标准，否则会变成另一种不一致。

需要：

审核指南
决策理由
审核记录
二次复核
质量抽检

公平性检查清单

设计排序、推荐、审核、风控系统时问：

这个系统影响谁的机会或权利？
优化指标是什么？它鼓励什么？
有没有 guardrail metric？
是否可能使用敏感属性的代理变量？
是否会形成强者更强的反馈回路？
新用户、新内容、小群体是否有机会？
是否观察分组指标？
误伤用户是否能知道原因？
是否有申诉或人工复核路径？
是否能审计过去的决定？

小结

公平性不只属于 AI，所有排序、推荐、审核、风控系统都有公平性问题。
偏见常藏在数据、指标和反馈回路里，不一定来自恶意。
指标是价值判断，没有中立指标。
代理变量可能间接引入敏感属性。
总体指标正常，不代表每个群体都正常。
高影响自动决策需要解释和申诉路径。
公平性不是让系统没有差异，而是避免不合理、不可解释、不可纠正的不公平。