Skip to content

【案例】AI竞技场 (跨厂商 AI 模型对比平台) #13

@Unicosmos

Description

@Unicosmos
Image

我做了什么

开发了一个跨厂商 AI 模型对比平台。通过阿里云百炼统一 API 同时调用 DeepSeek、Kimi、GLM、MiniMax、Qwen 等厂商的 38 个模型,在文本对话、图片理解、文生图三个场景下对比输出质量、响应速度和成本。

使用的工具

  • OpenWork / 百炼 CLI
  • Skill 名称:bailian-model-config、model-arena-pattern
  • 其他:Node.js 原生 http 模块(零外部依赖)、阿里云百炼 DashScope API

效果展示

三标签体系:文本对话(14 个可用模型)、图片理解(9 个可用模型)、文生图(7 个可用模型)

核心特性

  • SSE 流式输出,逐 token 实时渲染,先到先显示
  • 模型选择器按 8 个厂商分组,自由勾选对比
  • 同步滚动一键联动所有结果卡片
  • 每个模型显示预估费用(含官方定价页链接)
  • 启动时自动探测 38 个模型可用性,不可用模型自动置灰

架构models.json 注册表驱动,增删模型只需编辑 JSON,无需改代码。

踩坑记录

  • 生图 API 端点不对:初始用了 /v1/images/generations(返回 404 空响应),改为 /api/v1/services/aigc/multimodal-generation/generation 后正常
  • 第三方厂商 vision 模型不可用:百炼 compatible-mode 对 vision 的支持仅限 Qwen 系列,其他厂商在百炼上没有视觉版本
  • 部分模型 ID 不匹配:百炼上实际可用 ID 与预期不同(如 qwen-turbo-latest 不可用但 qwen-turbo 可用),通过健康探测自动标记

Metadata

Metadata

Assignees

No one assigned

    Labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions