Создание перевода (Не поддерживается)

⚠️ Внимание: В настоящее время этот эндпоинт помечен как "(Не поддерживается)". Он может быть устаревшим, временно недоступным или находиться на стадии тестирования. Перед интеграцией в продакшен, пожалуйста, уточните доступность API у ответственного за серверную часть.

1. Основная информация об API

Описание: Переводит аудиофайлы в текст на английском языке.
Метод запроса: POST
URL запроса: https://api.codingplanx.ai/v1/audio/translations
Content-Type: multipart/form-data

2. Параметры запроса

2.1 Параметры заголовка (Header)

Обычно требуется передать токен авторизации (например, Authorization: Bearer <Ваш-Токен>). Подробности см. в глобальной спецификации аутентификации.

2.2 Параметры тела запроса (Body, form-data)

Параметр	Тип	Обязательно	Описание	Пример
`file`	`file`	Да	Объект аудиофайла для перевода (Внимание: необходимо загрузить сам файл, а не строку с его именем).<br>Поддерживаемые форматы: `flac`, `mp3`, `mp4`, `mpeg`, `mpga`, `m4a`, `ogg`, `wav` или `webm`.	`test.m4a`
`model`	`string`	Да	ID используемой модели.<br>Примечание: обычно это `whisper-1`.	`gpt-4o-transcribe`
`prompt`	`string`	Нет	Необязательный текст для управления стилем модели или продолжения предыдущего аудиосегмента.<br>Внимание: текст промпта должен быть на английском языке.	`Translate the following German speech into English.`
`response_format`	`string`	Нет	Указывает формат вывода результата перевода.<br>Допустимые значения: `json`, `text`, `srt`, `verbose_json`, `vtt`. По умолчанию: `json`.	`json`
`temperature`	`number`	Нет	Температура семплирования, значение от `0` до `1`, по умолчанию `0`.<br>- Более высокие значения (например, `0.8`) сделают вывод более случайным.<br>- Более низкие значения (например, `0.2`) сделают вывод более сфокусированным и детерминированным.<br>- Если установлено значение `0`, модель будет использовать логарифмическую вероятность для автоматического повышения температуры до достижения определенного порога.	`0`

3. Описание ответа

3.1 Формат успешного ответа

Если response_format по умолчанию или явно задан как json, возвращается следующий объект JSON:

Поле	Тип	Обязательно	Описание
`text`	`string`	Да	Переведенный и распознанный чистый текст на английском языке.

4. Примеры запроса и ответа

4.1 Пример запроса cURL

curl --location --request POST 'https://api.codingplanx.ai/v1/audio/translations' \
--header 'Authorization: Bearer <YOUR_API_KEY>' \
--form 'file=@"/C:/Users/Administrator/Desktop/test.m4a"' \
--form 'model="gpt-4o-transcribe"' \
--form 'response_format="json"' \
--form 'temperature="0"'

4.2 Пример успешного ответа (HTTP 200)

{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you heading today?"
}

5. Часто задаваемые вопросы (FAQ)

Q1: В названии API указано «Не поддерживается», могу ли я по-прежнему его использовать?

A: Эта пометка обычно означает, что данная модель или эндпоинт на текущем шлюзе/платформе находится в стадии бета-тестирования, не полностью совместима или ее обслуживание приостановлено. Рекомендуется перед использованием связаться с администратором платформы для подтверждения или использовать стандартный API транскрибации речи (Transcriptions) в качестве альтернативы.

Q2: В чем разница между API перевода (Translations) и API транскрибации (Transcriptions)?

A: API транскрибации распознает аудио и преобразует его в текст на оригинальном языке аудиозаписи. API перевода, независимо от исходного языка аудио (например, немецкий, французский, китайский), распознает речь и сразу переведет ее в текст на английском языке.

Q3: Почему параметр prompt (подсказка) должен быть обязательно на английском языке?

A: Потому что целевым языком вывода для API перевода является английский. Использование подсказок на английском языке обеспечивает модели лучший контекст, указывает правильное написание имен собственных или задает нужный тон, что повышает точность итогового английского текста.

Q4: Есть ли ограничения на размер загружаемого аудиофайла?

A: Хотя в документации это явно не указано, согласно стандартным ограничениям базовых моделей (таких как Whisper), рекомендуется, чтобы размер одного аудиофайла не превышал 25 МБ. Если файл слишком большой, перед загрузкой рекомендуется его сжать или разделить на части и загружать по сегментам.

Q5: Какое значение temperature (температуры) лучше всего установить?

A: Для перевода аудио в первую очередь важна точность, а не креативность. Поэтому настоятельно рекомендуется оставить значение по умолчанию 0. При этом значении модель находится в состоянии высокой детерминированности, и результат перевода будет наиболее точным. Только если вы заметите, что при переводе определенных диалектов модель зацикливается или выдает серьезные ошибки, можно рассмотреть небольшое увеличение этого значения (например, до 0.2).