Skip to content

30초 이하 짧은 음성 변환하기

1. 소개

짧은 음성 인식 API는 사용자가 제공한 음성 데이터를 텍스트로 변환하여 제공하는 서비스입니다. 이 API는 동기화 방식이 사용되어 동작하며, 이를 통해 음성 데이터에서 얻은 텍스트를 활용하여 응용 프로그램을 개발하거나 자동 음성 텍스트 변환 서비스를 구축할 수 있습니다.

WARNING

⚠️ 노래 음원 혹은 배경음악이 크게 들리는 오디오는 텍스트 변환을 지원하지 않습니다.

2. 예제

아래는 간단한 사용 예제입니다. 이 예제에서는 sample.wav라는 음성 파일을 API에 전송하고, API는 해당 음성을 텍스트로 변환하여 응답합니다.

POST

shell
curl 'https://apis.daglo.ai/stt/v1/sync/transcripts' \
  --header 'Authorization: Bearer <API_TOKEN>' \
  --form 'file=@"sample.wav"'
text
{
    "rid": "12345678-abcd-efgh-1234-abcdefghijkl",
    "sttResult": {
        "transcript": "안녕하세요. 액션 파워입니다. 음성 인식의 선두주자 액션 파워의 기술을 만나보세요. "
    }
}

3. 사용법

1) API Key 발급하기

  • API Console에 접속하여 회원가입 후 로그인합니다.
  • 토큰 메뉴에 들어가 새로운 토큰을 발급합니다.
  • 발급한 토큰 정보를 복사해 요청 시 인증 토큰 정보로 사용합니다.

2) 요청하기

  • 지정된 엔드포인트로 필요한 파라미터 정보를 포함해 요청합니다.
  • 보다 자세한 API 정보는 API Reference를 참고해주세요.

a. POST Transcribe short audio

  • Endpoint
shell
POST https://apis.daglo.ai/stt/v1/sync/transcripts

3) 지원 포맷

  • 파일 재생 시간: 30초 이내
  • 지원 파일 포맷

🔊 오디오

.3gp, .3gpp .ac3, .aac, .aiff, .amr, .au, .flac, .m4a, .mp3, .mxf, .opus, .ra, .wav, .weba

📹 비디오

.asx, .avi, .ogm, .ogv, .m4v, .mov, .mp4, .mpeg, .mpg, .wmv

WARNING

⚠️ 포맷이 같더라도 실제 내용(인코딩)이 다를 경우 받아쓰기가 진행되지 않을 수 있습니다.

4) 응답받기

  • Success
응답 코드 보기
  • 200

  • 204

    • No Content. 요청은 성공하였으나 반환한 결과가 없습니다.
    • 받아쓰기의 경우 받아쓰기는 완료되었으나, 결과가 비어있습니다.

    :::

  • Error

응답 코드 보기
  • 400: Bad Request. 요청 형식이 잘못 되었습니다.
  • 401: Unauthorized.
  • 403: Forbidden. 허용되지 않은 접근입니다.
  • 413: Payload Too Large. 요청이 너무 큽니다.
  • 415: Unsupported Media Type.
  • 429: Too Many Requests.
  • 500: Internal Server Error. 서버 오류입니다.
  • 503: 너무 많은 요청을 처리하고 있어 일시적으로 응답이 불가능한 상태입니다. 잠시 후 다시 시도해주세요.

업데이트 이력

  • 20240902 ver1.0 API 문서가 작성되었습니다.