Audio (Speech & Transcription)
텍스트 음성 변환(TTS)과 음성 받아쓰기(STT)를 제공합니다. OpenAI Audio API와 호환됩니다.
텍스트 음성 변환#
POST/v1/audio/speech
POST /v1/audio/speech는 텍스트를 음성 오디오로 변환합니다. 요청에는 plm_로 시작하는 API 키가 필요합니다.
| 파라미터 | 타입 | 필수 | 설명 |
|---|---|---|---|
| model | string | 선택 | TTS 모델 ID. 기본값 tts-1. |
| input | string | 필수 | 변환할 텍스트. 최대 8,000자. |
| voice | string | 선택 | 음성 종류. 기본값 alloy. |
| response_format | string | 선택 | 오디오 형식(예: mp3). |
curl
curl https://router.pleum.ai/v1/audio/speech \
-H "Authorization: Bearer $PLEUM_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "tts-1",
"input": "Hello from PleumRouter.",
"voice": "alloy",
"response_format": "mp3"
}' \
--output out.mp3이 엔드포인트의 응답 본문은 JSON이 아니라 원시 오디오 바이트입니다. Content-Type은 형식에 따라
audio/mpeg(mp3) 등으로 설정됩니다. 비용은 본문이 아니라 응답 헤더 X-Cost-Krw·X-Cost-Usd로 반환됩니다. 과금은 입력 글자 수 기준입니다.받아쓰기#
POST/v1/audio/transcriptions
POST /v1/audio/transcriptions는 오디오 파일을 텍스트로 받아씁니다. 요청에는 plm_로 시작하는 API 키가 필요합니다.
이 엔드포인트는 multipart/form-data로 요청합니다 — JSON 본문이 아니라 파일을 폼 필드로 업로드합니다.
| 파라미터 | 타입 | 필수 | 설명 |
|---|---|---|---|
| file | file | 필수 | 받아쓸 오디오 파일. 폼 필드로 업로드. |
| model | string | 선택 | 받아쓰기 모델 ID(폼 필드). 기본값 whisper-1. |
curl
curl https://router.pleum.ai/v1/audio/transcriptions \
-H "Authorization: Bearer $PLEUM_API_KEY" \
-F file=@speech.mp3 \
-F model=whisper-1응답은 받아쓴 text와 사용된 model, 그리고 cost(원화 비용·환율·마크업)를 담은 JSON입니다. 과금은 오디오 길이(분) 기준입니다.
200 OK
{
"text": "Hello from PleumRouter.",
"model": "whisper-1",
"cost": {
"usd": 0.006,
"krw": 8,
"fx_rate": 1380.0,
"markup_rate": 3.0
}
}