본문 바로가기
  • 머니100스토리
재테크 및 부업/데이터라벨링

데이터 라벨링 음성 분류 및 판별하는 방법

by 머니100스토리 2023. 3. 23.
728x90
반응형

데이터 라벨링 음성 분류 및 판별하는 방법
데이터 라벨링 음성 분류 및 판별하는 방법

오늘은 데이터 라벨링 작업 중 음성 분류 및 판별을 어떻게 하는지에 대하여 알려드리도록 하겠습니다.


데이터 라벨링 위성사진 도로 이미지 비교 판독하는 방법

데이터 라벨링 위성사진 도로 이미지 비교 판독하는 방법


가이드 숙지

프로젝트에 참여하여 작업을 진행한다면 먼저 해당 작업에 대한 가이드를 반드시 숙지하고 시작해야 합니다. 어떤 작업을 할 것인지, 어떤 방향으로 음성 판독을 해야 하는지에 대한 이해가 없다면 할당된 작업을 정확히 수행할 수 없습니다.


작업 진행과정

작업 진행은 먼저 제시된 음성을 듣고 자연스러움과 명료도, 억양에 대하여 평가를 합니다. 

크롬 자동번역 옵션 비활성화

음성 데이터 라벨링 작업을 하기 전 pc나 노트북의 자동번역 옵션을 비활성화해야 합니다.  크롬 - 설정 - 번역 - Google 번역 - 번역사용 버튼 비활성화로 끄기

크롬 자동번역 비활성화
크롬 자동번역 비활성화

음성 듣기

먼저 제시된 음성을 플레이 버튼을 클릭하여 들어봅니다.

한번 들어보고 음성이 잘 들리지 않거나 판단하기 어렵다면 플레이 버튼을 눌러 재 실행을 합니다. 음성은 사람이 실제로 녹음한 소리와 AI가 사람의 목소리를 대신하여하는 소리가 섞여서 나오므로 잘 들어보고 판단을 하면 됩니다. 제시되는 음성파일은 다양하므로 작업할 때 주의하여 듣고 판별해야 합니다. 성의 없이 대충 아무거나 선택하는 행동이 반복된다면 앞으로 작업에 참여할 수 없는 제재를 받을 수 있으니 주의해야 합니다.

음성 판별하기

제시되는 작업물을 듣고 작업자의 주관적인 판단으로 음성을 Bae, Poor, Fair, Good, Excellent 중 한 가지를 선택하여 판별하는 방식으로 진행합니다.

자연스러움

음성을 듣고 사람의 말하는 것과 비교하여 얼마나 자연스럽게 들리는지를 판별하는 방법입니다.

Bad : 매우 심하게 인위적인 느낌이 드는 정도

Poor : 확실하게 인위적인 느낌이 드는 정도

Fair : 어느 정도 인위적인 느낌이 드는 정도

Good : 사람이 말했다기에는 아주 작은 정도의 인위적인 느낌이 들지만 문제가 되지 않는 정도

Excellent : 완전히 사람이 말하는 음성처럼 들리는 정도

명료도

음성을 듣고 발음이 얼마나 정확한지 판별하는 방법입니다.

Bad : 문장을 도무지 이해할 수 없을 정도로 발음이 부정확한 정도

Poor : 상당히 많은 불명확한 발음들이 있으며 어떤 단어들은 완전히 이해할 수 없는 정도

Fair : 어느 정도의 불명확한 발음들이 있지만 전반적으로 용인할 수 있는 정도

Good : 아주 약간의 불명확한 발음은 있지만 꽤 명료하게 들리는 정도

Excellent : 매우 명료하게 잘 들리는 정도

억양

억양이 얼마나 문장하고 잘 어울렸는지, 사람이 하는 말처럼  들리는지 판별하는 방법

Bad : 매우 부자연스러운 억양으로 인해 문장과 아예 어울리지 않는 정도

Poor : 비정상적인 억양으로 인해 문장과 부조화스러움이 느껴지는 정도

Fair : 억양이 일반적이지 않아 문장과의 부조화스러움이 약간 느껴지는 정도

Good : 약간의 특이한 억양이 있으나 충분히 사람이 말하는 음성처럼 들리는 정도

Excellent : 완전히 사람이 말하는 음성처럼 들리는 정도

저장 및 제출

제시된 음성을 듣고 자연스러움, 명료도, 억양에 대하여 판별을 하고 선택하였다면 우측 하단 <저장>하기 버튼을 클릭한 다음 <작업제출>을 눌러 작업물을 제출합니다.


오늘은 이렇게 데이터 라벨링 중 음성 데이터 분석 및 판별하는 방법에 대하여 알려드렸습니다.

 

728x90
반응형

댓글