[EN] 多模型路由是 Token 中转站的重要商业能力。不同模型在价格、速度、上下文长度、稳定性和效果上都有差异。如果所有请求都固定发给一个模型,中转站就很难优化成本,也无法应对上游故障。通过路由策略,普通摘要任务可以走低成本模型,复杂推理任务走高质量模型,高峰期自动切换备用供应商。客户看到的是一个稳定入口,后台则根据策略动态调度。这样既能控制毛利,也能提升服务可用性。多模型路由越成熟,中转站越像 AI 基础设施,而不是简单代理。