Skip to content

One: Введение в проект + Практика с Qwen

CLIProxyAPI — это инструмент для проксирования AI с открытым исходным кодом, написанный на Go. Возможно, из-за его скромного названия многие до сих пор с ним не знакомы. До того как я наткнулся на него, чтобы «бесплатно получить» модель Gemini, я перепробовал несколько инструментов обратного проксирования, таких как AIStudioProxyAPI, AIStudio-Build-Proxy и Gemini-FastAPI, но у всех были свои недостатки.

После того как я открыл для себя CLIProxyAPI и активно использовал его в течение нескольких месяцев, я могу с уверенностью сказать: с точки зрения производительности, функциональности или применимости это лучший инструмент для проксирования AI, который я когда-либо использовал, без исключений. Не будет преувеличением назвать его «божественным инструментом».

Официальный адрес репозитория: https://github.com/router-for-me/CLIProxyAPI

Что именно он умеет?

Возможности ПОПоддерживаемые модели
Предоставляет API эндпоинты, совместимые с OpenAI/Gemini/Claude/Codex, для CLI моделейgemini-2.5-pro
Добавлена поддержка OpenAI Codex (серия GPT) (вход через OAuth)gemini-2.5-flash
Добавлена поддержка Claude Code (вход через OAuth)gemini-2.5-flash-lite
Добавлена поддержка Qwen Code (вход через OAuth)gemini-2.5-flash-image-preview
Добавлена поддержка iFlow (вход через OAuth)gpt-5
Добавлена поддержка Gemini Web (вход через Cookie)gpt-5-codex
Поддержка потоковых (streaming) и непотоковых ответовclaude-opus-4-1-20250805
Поддержка вызова функций (function calling) и инструментовclaude-opus-4-20250514
Мультимодальный ввод (текст, изображения)claude-sonnet-4-20250514
Поддержка нескольких аккаунтов и балансировка нагрузки round-robin (Gemini, OpenAI, Claude, Qwen и iFlow)claude-sonnet-4-5-20250929
Простой процесс аутентификации в CLI (Gemini, OpenAI, Claude, Qwen и iFlow)claude-3-7-sonnet-20250219
Поддержка API ключей Gemini AIStudioclaude-3-5-haiku-20241022
Поддержка многоаккаунтного поллинга Gemini CLIqwen3-coder-plus
Поддержка многоаккаунтного поллинга Claude Codeqwen3-coder-flash
Поддержка многоаккаунтного поллинга Qwen Codeqwen3-max
Поддержка многоаккаунтного поллинга iFlowqwen3-vl-plus
Поддержка многоаккаунтного поллинга OpenAI Codexdeepseek-v3.2
Подключение к вышестоящим OpenAI-совместимым провайдерам (например, OpenRouter) через конфигурациюdeepseek-v3.1
Переиспользуемый Go SDKdeepseek-r1
deepseek-v3
kimi-k2
glm-4.6
tstars2.0
и другие модели, поддерживаемые iFlow

Вкратце, основные преимущества CLIProxyAPI включают:

  • Нет необходимости устанавливать Gemini CLI, чтобы преобразовать его авторизацию в универсальный API Key, позволяя вам вызывать полнофункциональные модели Gemini 2.5 Pro, Gemini 2.5 Flash и Gemini 2.5 Flash Lite в любом приложении. Когда официальная квота модели исчерпана, он автоматически переключается на Preview модель (например, gemini-2.5-pro-preview-05-06), позволяя использовать до 1000 вызовов в день, легко достигая «Gemini freedom».
  • Нет необходимости устанавливать Qwen Code, чтобы преобразовать его авторизацию в универсальный API Key, позволяя вам вызывать модели Qwen3 Coder Plus и Qwen3 Coder Flash где угодно, достигая «Qwen3 Coder freedom».
  • Нет необходимости устанавливать Codex, чтобы преобразовать его авторизацию в универсальный API Key, позволяя вам вызывать модели GPT-5 и GPT-5-Codex где угодно. Особенно с текущей акцией на бесплатные Team аккаунты, легко достичь «GPT freedom».
  • Преобразуйте веб-версию Gemini в API Key для вызова веб-моделей, таких как Nano Banana, в любом месте (требуется поддержка клиента. Согласно отзывам пользователей, бесплатную версию веб-аккаунтов Gemini можно вызывать около 100 раз в день, в то время как пользователи Gemini Pro могут достигать 1000 раз).
  • Мощные возможности балансировки нагрузки. CLIProxyAPI поддерживает интеграцию нескольких аккаунтов из разных источников (будь то API Keys или OAuth-авторизации) для балансировки нагрузки и циклического опроса (round-robin polling), что означает, что вы можете легко удвоить свою квоту вызовов.
  • Чрезвычайно низкое потребление ресурсов. Стоит отметить, что программа потребляет очень мало системных ресурсов. Сама программа весит всего около 10MB, использование памяти при запуске составляет менее 10MB, а пиковое использование памяти в течение длительного периода — всего около 100MB, поэтому она может бесперебойно работать практически на любом компьютере. Программа очень проста в использовании. Официально предоставляются не только бинарные файлы и методы развертывания Docker для различных платформ, но также EasyCLI и Web UI, которые очень удобны для новичков. Все настройки управляются через файл конфигурации config.yaml и поддерживают hot-reloading — изменения вступают в силу немедленно без перезапуска программы. Для полного ознакомления с пунктами конфигурации см. «Zero: Подробное объяснение конфигурации».

Практическое руководство: Преобразование Qwen Code в API Key

Ниже мы рассмотрим пример преобразования Qwen Code в API Key на платформе Windows, чтобы продемонстрировать конкретное использование CLIProxyAPI.

  1. Загрузка и распаковка

    Сначала загрузите предварительно скомпилированный исполняемый файл из официального репозитория и распакуйте его в любую папку. В этом примере я поместил его в директорию Z:\CLIProxyAPI. Нам понадобятся только два файла, показанные на рисунке.

  2. Редактирование файла конфигурации

    Переименуйте config.example.yaml в config.yaml, затем откройте его в текстовом редакторе. Вам нужно только оставить и изменить следующие базовые параметры конфигурации:

    yaml
    port: 8317
    
    # Пожалуйста, укажите путь к папке в соответствии с вашим фактическим расположением
    auth-dir: "Z:\\CLIProxyAPI\\auths"
    
    request-retry: 3
    
    quota-exceeded:
      switch-project: true
      switch-preview-model: true
    
    api-keys:
      # Пожалуйста, установите ключ самостоятельно, он используется для доступа клиента к прокси
      - 'ABC-123456'
  3. Получение авторизации

    Откройте терминал в директории CLIProxyAPI, введите cli-proxy-api --qwen-login и нажмите Enter. Программа автоматически откроет браузер. Пожалуйста, войдите в свой аккаунт Qwen в браузере и завершите авторизацию.

После завершения авторизации вернитесь в терминал, и программа попытается получить информацию об аутентификации. После успешного завершения она попросит вас ввести email или никнейм (как показано красной стрелкой на рисунке). Это просто псевдоним, используемый для идентификации аккаунта, и его можно заполнить произвольно. Здесь я ввел qwen-example. После нажатия Enter вы увидите, что файл аутентификации был успешно создан и сохранен в местоположении, указанном в auth-dir в конфигурационном файле.

Совет: Если система не открывает браузер автоматически, не беспокойтесь. Вручную скопируйте URL, отмеченный красной рамкой в терминале, и вставьте его в браузер для завершения авторизации.

  1. Запуск Proxy-сервиса Вышеуказанные шаги завершают аутентификацию аккаунта. Теперь давайте официально запустим прокси-сервис. Дважды щелкните по исполняемому файлу (cli-proxy-api.exe), и появится следующее окно, указывающее на успешный запуск.

  1. Настройка и тестирование в клиенте

    На данном этапе все готово. Ниже мы используем Cherry Studio для тестирования.

    • Добавьте нового провайдера моделей в Cherry Studio.

    • Тип провайдера моделей может быть любым, кроме Azure. Здесь мы возьмем OpenAI-Response в качестве примера. Имя провайдера можно настроить произвольно, например, CLIProxyAPI.

    • API Key: Введите ключ, который вы установили самостоятельно в config.yaml, в данном примере это ABC-123456.
  • API Address: Введите адрес и порт нашего локального сервиса. Помните номер порта 8317 в файле конфигурации? Здесь мы вводим http://127.0.0.1:8317.

    • Нажмите «Manage Models», и вы увидите модель Qwen Code, загруженную через прокси.

    • После добавления модели давайте протестируем её.

Как видите, модель успешно вернула сообщение. Разве весь процесс настройки не очень прост?

Лицензия MIT.