One: Введение в проект + Практика с Qwen
CLIProxyAPI — это инструмент для проксирования AI с открытым исходным кодом, написанный на Go. Возможно, из-за его скромного названия многие до сих пор с ним не знакомы. До того как я наткнулся на него, чтобы «бесплатно получить» модель Gemini, я перепробовал несколько инструментов обратного проксирования, таких как AIStudioProxyAPI, AIStudio-Build-Proxy и Gemini-FastAPI, но у всех были свои недостатки.
После того как я открыл для себя CLIProxyAPI и активно использовал его в течение нескольких месяцев, я могу с уверенностью сказать: с точки зрения производительности, функциональности или применимости это лучший инструмент для проксирования AI, который я когда-либо использовал, без исключений. Не будет преувеличением назвать его «божественным инструментом».
Официальный адрес репозитория: https://github.com/router-for-me/CLIProxyAPI
Что именно он умеет?
| Возможности ПО | Поддерживаемые модели |
|---|---|
| Предоставляет API эндпоинты, совместимые с OpenAI/Gemini/Claude/Codex, для CLI моделей | gemini-2.5-pro |
| Добавлена поддержка OpenAI Codex (серия GPT) (вход через OAuth) | gemini-2.5-flash |
| Добавлена поддержка Claude Code (вход через OAuth) | gemini-2.5-flash-lite |
| Добавлена поддержка Qwen Code (вход через OAuth) | gemini-2.5-flash-image-preview |
| Добавлена поддержка iFlow (вход через OAuth) | gpt-5 |
| Добавлена поддержка Gemini Web (вход через Cookie) | gpt-5-codex |
| Поддержка потоковых (streaming) и непотоковых ответов | claude-opus-4-1-20250805 |
| Поддержка вызова функций (function calling) и инструментов | claude-opus-4-20250514 |
| Мультимодальный ввод (текст, изображения) | claude-sonnet-4-20250514 |
| Поддержка нескольких аккаунтов и балансировка нагрузки round-robin (Gemini, OpenAI, Claude, Qwen и iFlow) | claude-sonnet-4-5-20250929 |
| Простой процесс аутентификации в CLI (Gemini, OpenAI, Claude, Qwen и iFlow) | claude-3-7-sonnet-20250219 |
| Поддержка API ключей Gemini AIStudio | claude-3-5-haiku-20241022 |
| Поддержка многоаккаунтного поллинга Gemini CLI | qwen3-coder-plus |
| Поддержка многоаккаунтного поллинга Claude Code | qwen3-coder-flash |
| Поддержка многоаккаунтного поллинга Qwen Code | qwen3-max |
| Поддержка многоаккаунтного поллинга iFlow | qwen3-vl-plus |
| Поддержка многоаккаунтного поллинга OpenAI Codex | deepseek-v3.2 |
| Подключение к вышестоящим OpenAI-совместимым провайдерам (например, OpenRouter) через конфигурацию | deepseek-v3.1 |
| Переиспользуемый Go SDK | deepseek-r1 |
| deepseek-v3 | |
| kimi-k2 | |
| glm-4.6 | |
| tstars2.0 | |
| и другие модели, поддерживаемые iFlow |
Вкратце, основные преимущества CLIProxyAPI включают:
- Нет необходимости устанавливать Gemini CLI, чтобы преобразовать его авторизацию в универсальный API Key, позволяя вам вызывать полнофункциональные модели Gemini 2.5 Pro, Gemini 2.5 Flash и Gemini 2.5 Flash Lite в любом приложении. Когда официальная квота модели исчерпана, он автоматически переключается на Preview модель (например,
gemini-2.5-pro-preview-05-06), позволяя использовать до 1000 вызовов в день, легко достигая «Gemini freedom». - Нет необходимости устанавливать Qwen Code, чтобы преобразовать его авторизацию в универсальный API Key, позволяя вам вызывать модели Qwen3 Coder Plus и Qwen3 Coder Flash где угодно, достигая «Qwen3 Coder freedom».
- Нет необходимости устанавливать Codex, чтобы преобразовать его авторизацию в универсальный API Key, позволяя вам вызывать модели GPT-5 и GPT-5-Codex где угодно. Особенно с текущей акцией на бесплатные Team аккаунты, легко достичь «GPT freedom».
- Преобразуйте веб-версию Gemini в API Key для вызова веб-моделей, таких как Nano Banana, в любом месте (требуется поддержка клиента. Согласно отзывам пользователей, бесплатную версию веб-аккаунтов Gemini можно вызывать около 100 раз в день, в то время как пользователи Gemini Pro могут достигать 1000 раз).
- Мощные возможности балансировки нагрузки. CLIProxyAPI поддерживает интеграцию нескольких аккаунтов из разных источников (будь то API Keys или OAuth-авторизации) для балансировки нагрузки и циклического опроса (round-robin polling), что означает, что вы можете легко удвоить свою квоту вызовов.
- Чрезвычайно низкое потребление ресурсов. Стоит отметить, что программа потребляет очень мало системных ресурсов. Сама программа весит всего около 10MB, использование памяти при запуске составляет менее 10MB, а пиковое использование памяти в течение длительного периода — всего около 100MB, поэтому она может бесперебойно работать практически на любом компьютере. Программа очень проста в использовании. Официально предоставляются не только бинарные файлы и методы развертывания Docker для различных платформ, но также EasyCLI и Web UI, которые очень удобны для новичков. Все настройки управляются через файл конфигурации
config.yamlи поддерживают hot-reloading — изменения вступают в силу немедленно без перезапуска программы. Для полного ознакомления с пунктами конфигурации см. «Zero: Подробное объяснение конфигурации».
Практическое руководство: Преобразование Qwen Code в API Key
Ниже мы рассмотрим пример преобразования Qwen Code в API Key на платформе Windows, чтобы продемонстрировать конкретное использование CLIProxyAPI.
Загрузка и распаковка
Сначала загрузите предварительно скомпилированный исполняемый файл из официального репозитория и распакуйте его в любую папку. В этом примере я поместил его в директорию
Z:\CLIProxyAPI. Нам понадобятся только два файла, показанные на рисунке.
Редактирование файла конфигурации
Переименуйте
config.example.yamlвconfig.yaml, затем откройте его в текстовом редакторе. Вам нужно только оставить и изменить следующие базовые параметры конфигурации:yamlport: 8317 # Пожалуйста, укажите путь к папке в соответствии с вашим фактическим расположением auth-dir: "Z:\\CLIProxyAPI\\auths" request-retry: 3 quota-exceeded: switch-project: true switch-preview-model: true api-keys: # Пожалуйста, установите ключ самостоятельно, он используется для доступа клиента к прокси - 'ABC-123456'Получение авторизации
Откройте терминал в директории CLIProxyAPI, введите
cli-proxy-api --qwen-loginи нажмите Enter. Программа автоматически откроет браузер. Пожалуйста, войдите в свой аккаунт Qwen в браузере и завершите авторизацию.
После завершения авторизации вернитесь в терминал, и программа попытается получить информацию об аутентификации. После успешного завершения она попросит вас ввести email или никнейм (как показано красной стрелкой на рисунке). Это просто псевдоним, используемый для идентификации аккаунта, и его можно заполнить произвольно. Здесь я ввел qwen-example. После нажатия Enter вы увидите, что файл аутентификации был успешно создан и сохранен в местоположении, указанном в auth-dir в конфигурационном файле.

Совет: Если система не открывает браузер автоматически, не беспокойтесь. Вручную скопируйте URL, отмеченный красной рамкой в терминале, и вставьте его в браузер для завершения авторизации.
- Запуск Proxy-сервиса Вышеуказанные шаги завершают аутентификацию аккаунта. Теперь давайте официально запустим прокси-сервис. Дважды щелкните по исполняемому файлу (
cli-proxy-api.exe), и появится следующее окно, указывающее на успешный запуск.

Настройка и тестирование в клиенте
На данном этапе все готово. Ниже мы используем Cherry Studio для тестирования.
- Добавьте нового провайдера моделей в Cherry Studio.

- Тип провайдера моделей может быть любым, кроме Azure. Здесь мы возьмем
OpenAI-Responseв качестве примера. Имя провайдера можно настроить произвольно, например,CLIProxyAPI.

- API Key: Введите ключ, который вы установили самостоятельно в
config.yaml, в данном примере этоABC-123456.
API Address: Введите адрес и порт нашего локального сервиса. Помните номер порта
8317в файле конфигурации? Здесь мы вводимhttp://127.0.0.1:8317.
- Нажмите «Manage Models», и вы увидите модель Qwen Code, загруженную через прокси.

- После добавления модели давайте протестируем её.

Как видите, модель успешно вернула сообщение. Разве весь процесс настройки не очень прост?