다음을 통해 공유


빠른 시작: AI 스튜디오 채팅 플레이그라운드에서 채팅 모델과 듣고 말하기

Important

이 문서에 설명된 기능 중 일부는 미리 보기로만 제공될 수 있습니다. 이 미리 보기는 서비스 수준 계약 없이 제공되며, 프로덕션 워크로드에는 권장되지 않습니다. 특정 기능이 지원되지 않거나 기능이 제한될 수 있습니다. 자세한 내용은 Microsoft Azure Preview에 대한 추가 사용 약관을 참조하세요.

Azure OpenAI Service를 Azure AI Speech와 페어링하여 앱에서 듣고 말하기 기능을 사용할 수 있으므로 보다 풍부하게 상호 작용할 수 있습니다.

이 빠른 시작에서는 Azure OpenAI Service 및 Azure AI Speech를 사용하여 다음을 수행합니다.

  • 음성 텍스트 변환을 통해 도우미에게 말합니다.
  • 텍스트 음성 변환을 통해 도우미의 응답을 듣습니다.

음성 텍스트 변환 및 텍스트 음성 변환 기능은 AI 스튜디오 채팅 플레이그라운드에서 함께 또는 별도로 사용할 수 있습니다. 플레이그라운드를 사용하여 채팅 모델을 배포하기 전에 테스트할 수 있습니다.

필수 조건

채팅 플레이그라운드 구성

채팅 세션을 시작하기 전에 음성 텍스트 변환 및 텍스트 음성 변환 기능을 사용하도록 채팅 플레이그라운드를 구성해야 합니다.

  1. Azure AI 스튜디오에 로그인합니다.

  2. 프로젝트로 이동하거나 Azure AI 스튜디오에서 새 프로젝트를 만듭니다.

  3. 왼쪽 창에서 플레이그라운드>채팅을 선택합니다.

  4. 배포 드롭다운에서 배포된 채팅 모델을 선택합니다.

    모드와 배포가 강조 표시된 채팅 플레이그라운드의 스크린샷.

  5. 플레이그라운드 설정 단추를 선택합니다.

    플레이그라운드 설정으로 이동하는 옵션이 포함된 채팅 플레이그라운드의 스크린샷.

    참고 항목

    마이크 또는 스피커 단추를 선택하는 옵션도 표시됩니다. 이러한 단추 중 하나를 선택했지만 음성 텍스트 변환 또는 텍스트 음성 변환을 아직 사용하도록 설정하지 않은 경우 플레이그라운드 설정에서 사용하도록 설정하라는 메시지가 표시됩니다.

  6. 플레이그라운드 설정 페이지에서 상자를 선택하여 음성 기능을 사용하면 추가 비용이 발생한다는 것을 확인합니다. 자세한 내용은 Azure AI 음성 가격 책정을 참조하세요.

  7. 음성 텍스트 변환 사용텍스트 음성 변환 사용을 선택합니다.

    플레이그라운드 설정 페이지의 스크린샷.

  8. 말하기 및 듣기에 사용할 언어 로캘과 음성을 선택합니다. 사용 가능한 음성 목록은 선택한 로캘에 따라 달라집니다.

    일본어 음성이 선택된 플레이그라운드 설정 페이지의 스크린샷.

  9. 필요에 따라 몇 가지 샘플 텍스트를 입력하고 재생을 선택하여 음성을 사용해 볼 수 있습니다.

  10. 저장을 선택합니다.

채팅 세션 시작

이 채팅 세션에서는 음성 텍스트 변환과 텍스트 음성 변환을 모두 사용합니다. 음성 텍스트 변환 기능을 사용하여 도우미에게 말하고 텍스트 음성 변환 기능을 사용하여 도우미의 응답을 듣습니다.

  1. 아직 수행하지 않은 경우 플레이그라운드 구성 섹션의 단계를 완료합니다. 이 빠른 시작을 완료하려면 음성 텍스트 변환 및 텍스트 음성 변환 기능을 사용하도록 설정해야 합니다.

  2. 마이크 단추를 선택하고 도우미에게 말합니다. 예를 들어 "Xbox를 어디에서 구할 수 있는지 알아?"라고 말할 수 있습니다.

    사용하도록 설정된 마이크 아이콘과 보내기 단추가 강조 표시된 채팅 세션의 스크린샷.

  3. 보내기 단추(오른쪽 화살표)를 선택하여 도우미에게 메시지를 보냅니다. 도우미의 응답이 채팅 세션 창에 표시됩니다.

    도우미의 응답이 포함된 채팅 세션의 스크린샷.

    참고 항목

    스피커 단추가 켜져 있으면 도우미의 응답이 들립니다. 스피커 단추가 꺼져 있으면 도우미의 응답이 들리지 않지만 응답은 채팅 세션 창에 계속 표시됩니다.

  4. 시스템 프롬프트를 변경하여 도우미의 응답 형식 또는 스타일을 변경할 수 있습니다.

    예를 들어 다음을 입력합니다.

    "You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
    

    응답은 채팅 세션 창에 표시됩니다. 스피커 단추가 켜져 있으므로 응답도 들립니다.

    시스템 프롬프트가 편집된 채팅 세션의 스크린샷.

샘플 코드 보기

코드 보기 단추를 선택하여 Azure OpenAI 및 Speech Service에 대한 구성을 포함하는 샘플 코드를 보고 복사할 수 있습니다.

플레이그라운드에서 샘플 코드를 보기 위한 단추의 스크린샷.

샘플 코드를 사용하여 애플리케이션에서 음성 텍스트 변환 및 텍스트 음성 변환을 사용하도록 설정할 수 있습니다.

플레이그라운드에서 코드를 보는 스크린샷.

또 다른 예제는 음성 변환 채팅 코드 예제를 참조하세요.

리소스 정리

불필요한 Azure 비용이 발생하지 않도록 하려면 이 빠른 시작에서 만든 리소스가 더 이상 필요하지 않은 경우 삭제해야 합니다. 리소스를 관리하려면 Azure Portal을 사용하면 됩니다.

다음 단계