노션 Notion

듣기 편한 음성은? 유튜브 보다 궁금해져서 음성분석 프로그램(Praat)통해 분석해봄

앵그리피그 2024. 1. 28. 17:34
반응형

 

PRAAT 프로그램 초기화면

 

수많은 유튜브 영상 중에 내용도 좋고 꼭 보고 싶지만 오래 보지 못하는 영상이 있다 .  이유는 개인적이지만 음향(목소리와 주변음향)이 안정적이 못하면 바로 채널을 돌리곤 한다.
특히  몇몇 채널은 듣는 것만으로 신뢰와 편안함을 주는 반면 어떤 채널은 그와 정반대의 느낌을 주곤 한다.

나만의 생각일까 했는데 음향 특히 그중에 목소리가 안정적이고 속도도 편안한 채널의 댓글을 보면 내용 보다.

"목소리 좋아요" "집중이 잘되요" 등

나만 느끼고 생각하는 부분이 아니라는 걸 알았다. 

그래서 음향을 분석해서 객관적으로 어떤 차이가 있는지 알고 보고 싶어졌다.

우선 "음성분석 프로그램" 으로 구글 검색을 하니 대표적인 프로그램으로 '
PRAAT' 이 많이 보였다. 
원래 목적은 모바일 앱으로 간단히 측저할 수 있는 앱이 있다면 그걸 이용해 간단히 해보려고 했지만 
내가 찾지 못해서 인지 'PRAAT' 프로그램 튜토리얼 유튜브 영상이 있어 자연스럽게 이 프로그램으로 집중하게 됐다. 


우선 결과 부터 말하면 예상대로 수치로도 두개의 채널의 진행자 목소리 주파수가 현저하게 차이가 나는 것을 알수 있었다 
물론 내가 음성 전문가가 아니기 때문에 이 이유만으로 단정짓기는 어렵지만 일단 주파수 대역이 듣는 사람에게 편안함을 줄수 있고 그 변동 폭이 적은 것이 더 안정적이라는 것을 추측가능했다.

 
 

샘플 음성 분석

유튜브 한준TV와 하와이 대저택 채널 음성 분석

한준tv 음성 분석 그래프 

 
 
한준 TV
  • - Voice report for -- Date: Sun Jan 28 15:39:30 2024
Pitch:
Median pitch: 231.229 Hz (중간값)
Mean pitch: 
228.742 Hz (평균값)
Standard deviation: 33.421 Hz(표준편차)
Minimum pitch: 
146.805 Hz (최소 값)
Maximum pitch: 
290.865 Hz(최대 값)

Pulses:
Number of pulses: 989
Number of periods: 974
Mean period: 4.388530E-3
seconds Standard deviation of period: 0.676480E-3
하와이 대저택
  • - Voice report for -- Date: Sun Jan 28 15:41:41 2024
Pitch:
Median pitch: 118.140 Hz (중간값)
Mean pitch: 
123.777 Hz (평균값)
Standard deviation: 26.975 Hz (표준편차)
Minimum pitch: 
76.939 Hz (최소 값)
Maximum pitch: 
199.066 Hz (최대 값)

Pulses:
Number of pulses: 313
Number of periods: 292
Mean period: 8.070913E-3
seconds Standard deviation of period: 1.779641E-3

 

PRAAT 프로그램 사용법 

주요 내용과 화면 캡처는
https://www.youtube.com/@user-ke4jo5kh7r  이 채널을 참고했습니다

 

서진원

공부하는 복학생 오빠 의사소통 전문채널 #언어 #음성 #신경 #유창성 #조음 #청각

www.youtube.com

NEW 메뉴

모노 ,스테레오 채널 선택

음성 분석시 대부분 모노로 진행 함 - 용량 차이가 2개 가까이 남

[녹음 버튼 클릭시]

 

[new > sound>create sound form formule
이름  채널수  시간 설정  헤르즈

matrix. - 행렬 만들기

텍스트 그리드 - 음성에 이름을 적용

 

 

Open

cd 음질 정도 분석시 3시간 분량 분석 가능
모노채널 시 12시간 분석 가능

 

Save

 

다이나믹 메뉴

모디파이
리버스 - 거꾸로
scal intensity - 데시벨 수정 ?

analyse periodicity. - 피치 (주기적인)

 

기본 주파수 측정

 

 

음성 파일 분석하기 순서

1. 파일 오픈

2. 스테레오 파일 모노로 변환

3. 남성음성 분석 샘플

pitch settings

성인남자 : 75-300
성인여자 : 100-500
아동 : 200 - 600 *소리치는 아이의 목소리는 cilling 값을 2000까지 설정

cc - 주파수 성대진동
ac - 억양 높낮이

지정된 붉은 구간의 평균 주파수는 147 헤르츠

상세한 분석 리포트 정보

영역을 지정해야 리포트 보임

Pitch:
Median pitch: 148.679 Hz
Mean pitch: 151.162 Hz
Standard deviation: 33.166 Hz
Minimum pitch: 75.540 Hz
Maximum pitch: 198.054 Hz

음성 가공

소리가 높다 낮다는 pitch 값을 비교 한다

조작, 수정

1. manipulation

 

2. 대상 시간과 헤르츠 범위(원본 성별에 따라) 설정

수정이후

manipulation

소리 높낮이 소리 길이 조절 가능

소리 높낮이는 pitch 에서

3. manipulation 파일을 선택 후 pitch tier 선택함 별도 pitch tier 파일이 생김

4. pictch 파일에서 모디파이 > shift 프리퀀시

변경할 헤르츠 범위 설정

5. 두 파일을 선택해서 변경 누름

6. manipulation 눌러 변경 내용 확인

7. 저장하기

파일 선택 > play (overlap-add) 또는 get re~~ (overlap add) 선택 > save as wav

속도 측정 및 조정

  1. manipulation 파일 선택 > 상세 페이지에서 듀레이션 확인 기본세팅 1
  2. 1에서 작아지면 빨라지고 1에서 늘어라면 소기라 늘려짐
  3. manipulation 파일 > extract dutation tier 선택
  1. 상세화면 - 내용 없음
  1. modify >add point

 

3군데 포인트 시작, 변경점, 종료점 모두 설정해야함

파일 합치기

 

저장 - get rre~~ overlap add로

 

반응형