Быстрый старт
С помощью этой инструкции вы создадите деплоймент языковой модели и проверите ее работу.
Перед началом работы
Заголовок раздела «Перед началом работы»В веб-консоли выберите нужный проект. Если у вас нет проекта, создайте его.
В списке сервисов выберите GPT Model Hub. При первом запуске нажмите кнопку Активировать, для этого необходима роль
admin.Создайте два сервисных аккаунта:
- Сервисный аккаунт с именем
sa-cliс рольюgpt.deployment.editor. От имени этого сервисного аккаунта будет инициализирована MWS CLI и создан деплоймент. - Сервисный аккаунт с именем
sa-inferencerс рольюgpt.inferencer. От имени этого сервисного аккаунта вы будете обращаться к модели.
Создайте ключи доступа:
- Для сервисного аккаунта
sa-cliсоздайте авторизованный ключ и сохраните его в отдельном файле. - Для сервисного аккаунта
sa-inferencerсоздайте API-ключ и сохраните его.
Установите и настройте утилиту MWS CLI:
- Инициализируйте профиль. Используйте авторизованный ключ сервисного аккаунта
sa-cli.
Установите утилиту
jq.
Деплоймент модели
Заголовок раздела «Деплоймент модели»Получите список доступных базовых моделей:
bash mws gpt model listВыберите подходящую вам модель. В этом руководстве в качестве примера используется модель
qwen3-32b.Создайте деплоймент модели:
bash mws gpt deployment create qwen3-32b --body 'metadata:displayName: "qwen3-32b"description: "Модель для быстрого старта"spec:model: "gpt/projects/<имя проекта>/models/qwen3-32b"'
Работа с моделью
Заголовок раздела «Работа с моделью»Для работы с OpenAI-совместимым API используется базовый URL https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1.
Доступно два режима ответа модели:
- Опция
streamingотключена — модель возвращает ответ модели одним сообщением, без разбиения на части; - Опция
streamingвключена — модель возвращает ответ частями по мере генерации.
Запрос без streaming
Заголовок раздела «Запрос без streaming»curl https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1/chat/completions \-H 'Content-Type: application/json' \-H "Authorization: Bearer <API-ключ сервисного аккаунта sa-inferencer>" \-d '{ "model": "qwen3-32b", "messages": [ { "role": "user", "content": "Привет!" } ] }' | jq .Запрос со streaming
Заголовок раздела «Запрос со streaming»curl https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1/chat/completions \-H 'Content-Type: application/json' \-H "Authorization: Bearer <API-ключ сервисного аккаунта sa-inferencer>" \-d '{ "model": "qwen3-32b", "stream": true, "stream_options": { "include_usage": true }, "messages": [ { "role": "user", "content": "Привет!" } ] }'Запрос с изображением
Заголовок раздела «Запрос с изображением»Модели с поддержкой изображений могут обрабатывать изображения, переданные в сообщении пользователя. Признак поддержки отображается в таблице доступных моделей.
curl https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1/chat/completions \-H 'Content-Type: application/json' \-H "Authorization: Bearer <API-ключ сервисного аккаунта sa-inferencer>" \-d '{ "model": "kimi-k2-instruct", "messages": [ { "role": "user", "content": [ { "type": "text", "text": "Что на картинке?" }, { "type": "image_url", "image_url": { "url": "https://mws.ru/uploads/grant_promo_banner_3fdd0964ae_730f25981e.png" } } ] } ] }' | jq .