Быстрый старт
С помощью этой инструкции вы создадите деплоймент языковой модели и проверите ее работу.
Перед началом работы
Заголовок раздела «Перед началом работы»В веб-консоли выберите нужный проект. Если у вас нет проекта, создайте его.
В списке сервисов выберите GPT Model Hub. При первом запуске нажмите кнопку Активировать, для этого необходима роль
admin.Создайте сервисный аккаунт с именем
sa-inferencerи рольюgpt.inferencer. От имени этого сервисного аккаунта вы будете обращаться к модели.Создайте API-ключ для сервисного аккаунта
sa-inferencerи сохраните его.Установите утилиту
jq.
Деплоймент модели
Заголовок раздела «Деплоймент модели»- В веб-консоли выберите нужный проект.
- В списке сервисов выберите GPT Model Hub и нажмите кнопку Создать.
- Выберите подходящую вам модель для деплоймента. В этом руководстве в качестве примера используется модель
qwen3-32b. - Нажмите кнопку Создать.
Работа с моделью
Заголовок раздела «Работа с моделью»Для работы с OpenAI-совместимым API используется базовый URL https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1.
Доступно два режима ответа модели:
- Опция
streamingотключена — модель возвращает ответ модели одним сообщением, без разбиения на части; - Опция
streamingвключена — модель возвращает ответ частями по мере генерации.
Запрос без streaming
Заголовок раздела «Запрос без streaming»curl https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1/chat/completions \-H 'Content-Type: application/json' \-H "Authorization: Bearer <API-ключ сервисного аккаунта sa-inferencer>" \-d '{ "model": "qwen3-32b", "messages": [ { "role": "user", "content": "Привет!" } ] }' | jq .Запрос со streaming
Заголовок раздела «Запрос со streaming»curl https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1/chat/completions \-H 'Content-Type: application/json' \-H "Authorization: Bearer <API-ключ сервисного аккаунта sa-inferencer>" \-d '{ "model": "qwen3-32b", "stream": true, "stream_options": { "include_usage": true }, "messages": [ { "role": "user", "content": "Привет!" } ] }'Запрос с изображением
Заголовок раздела «Запрос с изображением»Модели с поддержкой изображений могут обрабатывать изображения, переданные в сообщении пользователя. Признак поддержки отображается в таблице доступных моделей.
curl https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1/chat/completions \-H 'Content-Type: application/json' \-H "Authorization: Bearer <API-ключ сервисного аккаунта sa-inferencer>" \-d '{ "model": "kimi-k2-instruct", "messages": [ { "role": "user", "content": [ { "type": "text", "text": "Что на картинке?" }, { "type": "image_url", "image_url": { "url": "https://mws.ru/uploads/grant_promo_banner_3fdd0964ae_730f25981e.png" } } ] } ] }' | jq .