피아노가 사람 소리처럼 들리게 하려면 어떻게 해야 합니까?
다른 건반을 누르는 것은 오디오 신호의 선형 오버레이로 볼 수 있다. 피아노가 낼 수 있는 소리는 88 개 키의 소리의 선형 조합이다. 그런 다음 주파수 영역에서 볼 때, 서로 다른 주파수의 구성요소도 선형적으로 겹칩니다. 일반적으로 대부분의 사람들은 적어도 25 개의 음의 음높이 차이, 즉 1/4 반음을 구분할 수 있다. 사람이 말하는 주파수는 약 300 헤르츠에서 3400 헤르츠로 42 개의 반음에 해당한다. 간단히 말하자면, 사람이 다른 사람의 말을 들을 때 이 42*4 = 168 개의 다른 주파수의 음높이의 진폭을 구분하고 있다고 생각한다. 선형 대수학에 대한 지식이 있다면, 88 개의 키의 선형 조합이 168 주파수의 가능한 모든 조합을 덮을 수 없다는 것을 알게 될 것이다. 이는 두 개의 3D 벡터만 사용하는 선형 조합이 모든 3D 벡터를 나타낼 수 없는 것과 같습니다. 88 개의 키음의 어떤 조합이 300 Hz ~ 3400 Hz 범위 내에서 사람의 목소리에 매우 근접할 수 있지만, 이 주파수 범위 밖에서 어떤 표현이 나타날지 말하기는 어렵다. 청각감각을 바꿀 가능성이 높다. 게다가, 이런 교묘한 조합은 분명 매우 적을 것이다. 그렇지 않으면 피아노를 칠 때 사람 소리를 내기 쉽다. 이러한 관계를 감안하여 외국의 어떤 사람들은 컴퓨터를 통해 건반을 제어하여 피아노를 "말" 할 수 있는 로봇을 만들었다. 유관은 여기에 연결되어 있습니다 (사다리가 필요합니다): 자막을 보지 않으면 일부 시뮬레이션 인성이 들리고, 일부는 분간하기 어렵습니다. 결국, 168 주파수의 모든 조합을 88 개의 거문고음으로만 덮는다면, 접근해야 할 것이 많을 것이다. 그럼에도 불구하고, 비디오는 피아노로 사람 소리를 흉내내는 것이 전반적으로 가능하다는 것을 보여준다. 처음에는 신호 처리 과정을 선택했습니다. 한 실험의 내용은 한 사람이 먼저 다음 단락을 녹음한 다음 MATLAB 을 이용하여 푸리엽 분해를 하면 진폭이 가장 큰 주파수 성분만 남는다는 것이다.