Перейти к содержимому

Быстрый старт

С помощью этой инструкции вы создадите деплоймент языковой модели и проверите ее работу.

  1. В веб-консоли выберите нужный проект. Если у вас нет проекта, создайте его.

  2. В списке сервисов выберите GPT Model Hub. При первом запуске нажмите кнопку Активировать, для этого необходима роль admin.

  3. Создайте сервисный аккаунт с именем sa-inferencer и ролью gpt.inferencer. От имени этого сервисного аккаунта вы будете обращаться к модели.

  4. Создайте API-ключ для сервисного аккаунта sa-inferencer и сохраните его.

  5. Установите утилиту jq.

  1. В веб-консоли выберите нужный проект.
  2. В списке сервисов выберите GPT Model Hub и нажмите кнопку Создать.
  3. Выберите подходящую вам модель для деплоймента. В этом руководстве в качестве примера используется модель qwen3-32b.
  4. Нажмите кнопку Создать.

Для работы с OpenAI-совместимым API используется базовый URL https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1.

Доступно два режима ответа модели:

  • Опция streaming отключена — модель возвращает ответ модели одним сообщением, без разбиения на части;
  • Опция streaming включена — модель возвращает ответ частями по мере генерации.
bash
curl https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1/chat/completions \
-H 'Content-Type: application/json' \
-H "Authorization: Bearer <API-ключ сервисного аккаунта sa-inferencer>" \
-d '{
"model": "qwen3-32b",
"messages": [
{
"role": "user", "content": "Привет!"
}
]
}' | jq .
bash
{
"id": "chatcmpl-c37a7ecbae094877b28654dbbfa14b81",
"created": 1758740886,
"model": "qwen3-32b",
"object": "chat.completion",
"choices": [
{
"finish_reason": "stop",
"index": 0,
"logprobs": null,
"message": {
"content": "Привет! Как я могу помочь?",
"role": "assistant",
"audio": null,
"refusal": null,
}
}
],
"usage": {
"completion_tokens": 45,
"prompt_tokens": 72,
"total_tokens": 117,
},
}

В этом примере в поле usage:

  • prompt_tokens — количество входящих токенов запроса (токенов промпта);
  • completion_tokens — количество исходящих токенов, сгенерированных моделью (токенов ответа).

Входящие и исходящие токены тарифицируются отдельно.

bash
curl https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1/chat/completions \
-H 'Content-Type: application/json' \
-H "Authorization: Bearer <API-ключ сервисного аккаунта sa-inferencer>" \
-d '{
"model": "qwen3-32b",
"stream": true,
"stream_options": {
"include_usage": true
},
"messages": [
{
"role": "user", "content": "Привет!"
}
]
}'
bash
{"id":"chatcmpl-e999cff5eb274f70988477c978c7d9f7","created":1775157501,"model":"qwen3-32b","choices":[{"delta":{"content":"Пр","reasoning":null,"reasoning_content":null,"refusal":null,"role":"assistant"},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk"}
{"id":"chatcmpl-e999cff5eb274f70988477c978c7d9f7","created":1775157501,"model":"qwen3-32b","choices":[{"delta":{"content":"ив","reasoning":null,"reasoning_content":null,"refusal":null},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk"}
{"id":"chatcmpl-e999cff5eb274f70988477c978c7d9f7","created":1775157501,"model":"qwen3-32b","choices":[{"delta":{"content":"ет","reasoning":null,"reasoning_content":null,"refusal":null},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk"}
{"id":"chatcmpl-e999cff5eb274f70988477c978c7d9f7","created":1775157501,"model":"qwen3-32b","choices":[{"delta":{"content":"","reasoning":null,"reasoning_content":null,"refusal":null},"finish_reason":null,"index":0,"logprobs":null}],"object":"chat.completion.chunk"}
...
{"id":"chatcmpl-e999cff5eb274f70988477c978c7d9f7","created":1775157501,"model":"qwen3-32b","choices":[{"delta":{"content":null,"reasoning":null,"reasoning_content":null,"refusal":null},"finish_reason":null,"index":0,"logprobs":null}],"usage":{"completion_tokens":21,"prompt_tokens":12,"total_tokens":33},"object":"chat.completion.chunk"}
{"id":"chatcmpl-e999cff5eb274f70988477c978c7d9f7","created":1775157501,"model":"qwen3-32b","choices":[{"delta":{"content":null,"reasoning":null,"reasoning_content":null,"refusal":null},"finish_reason":null,"index":0,"logprobs":null}],"usage":{"completion_tokens":21,"completion_tokens_details":{"reasoning_tokens":0},"prompt_tokens":12,"total_tokens":33},"object":"chat.completion.chunk"}

В этом примере в поле usage:

  • prompt_tokens — количество входящих токенов запроса (токенов промпта);
  • completion_tokens — количество исходящих токенов, сгенерированных моделью (токенов ответа).

Входящие и исходящие токены тарифицируются отдельно.

Модели с поддержкой изображений могут обрабатывать изображения, переданные в сообщении пользователя. Признак поддержки отображается в таблице доступных моделей.

bash
curl https://gpt.mwsapis.ru/projects/<имя проекта>/openai/v1/chat/completions \
-H 'Content-Type: application/json' \
-H "Authorization: Bearer <API-ключ сервисного аккаунта sa-inferencer>" \
-d '{
"model": "kimi-k2-instruct",
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Что на картинке?" },
{ "type": "image_url", "image_url": { "url": "https://mws.ru/uploads/grant_promo_banner_3fdd0964ae_730f25981e.png" } }
]
}
]
}' | jq .
bash
{
"choices": [
{
"finish_reason": "stop",
"index": 0,
"logprobs": null,
"message": {
"audio": null,
"content": " На картинке изображена **3D-иллюстрация**, представляющая облачную платформу. Основные элементы:\n\n- **Серебристо-белая структура** в виде модульного блока или сервера с выдвижными секциями слева, похожими на жёсткие диски или хранилища данных\n- **Ярко-красный прямоугольный модуль** с надписью белым текстом: **«MWS Cloud Platform»**\n- **Серебряная наградная розетка** с лентой, прикреплённая к красному модулю — символизирует качество, надёжность или премиальный статус платформы\n- **Плоские серебристые панели** внизу, возможно, имитирующие интерфейс или дополнительные модули\n\nОбщий стиль — современный, минималистичный, с глянцевыми поверхностями и мягкими тенями. Изображение, вероятно, является частью корпоративного брендинга для облачной платформы MWS.",
"refusal": null,
"role": "assistant"
}
}
],
"created": 1777483458,
"id": "chatcmpl-be7b6c068b5c871d",
"model": "kimi-k2-instruct",
"object": "chat.completion",
"usage": {
"completion_tokens": 298,
"prompt_tokens": 1282,
"total_tokens": 1580
}
}