Skip to content

Embeddings

텍스트의 임베딩 벡터를 생성합니다. OpenAI Embeddings API와 호환됩니다.

하나 또는 여러 입력 텍스트를 부동소수점 벡터로 변환합니다. OpenAI SDK를 plm_ API 키와 PleumRouter base URL로 그대로 사용할 수 있습니다.

POST/v1/embeddings

요청 본문#

파라미터타입필수설명
modelstring선택임베딩 모델 ID. 기본값 text-embedding-3-large.
inputstring | string[]필수임베딩할 텍스트. 단일 문자열 또는 문자열 배열. 빈 배열은 400을 반환합니다.

model은 반드시 임베딩 모델이어야 합니다 — 채팅 모델을 지정하면 오류가 발생합니다. 사용 가능한 임베딩 모델 목록은 GET /v1/models에서 확인하세요.

request
curl https://router.pleum.ai/v1/embeddings \
  -H "Authorization: Bearer $PLEUM_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-large",
    "input": "The quick brown fox jumps over the lazy dog."
  }'

응답#

OpenAI 형식의 data(각 항목에 embedding 벡터와 index) / usage에 더해, PleumRouter는 cost(원화 비용·환율·마크업)를 추가로 반환합니다. 입력 배열의 순서와 index 순서가 일치합니다.

200 OK
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "embedding": [0.01, -0.02],
      "index": 0
    }
  ],
  "model": "text-embedding-3-large",
  "usage": {
    "prompt_tokens": 12,
    "total_tokens": 12
  },
  "cost": {
    "usd": 0.0001,
    "krw": 1,
    "fx_rate": 1380.0,
    "markup_rate": 3.0
  }
}

과금은 prompt_tokens 기준입니다. 임베딩은 입력 토큰만 발생하며 출력 토큰이 없습니다. cost 객체(원화)는 PleumRouter 확장입니다.

input에 빈 배열을 보내면 400이 반환됩니다. 배치 임베딩 시 입력 배열에 최소 하나 이상의 텍스트를 포함하세요.