"모방 발음을 인식할 수 있을까요? 클릭합니다 먼저 발음의 특수성과 안정성을 소개해야 합니다. 이것은 성문 인식의 기본 원리이다. 각종 교재에는 서로 다른 풍격의 표현이 있지만, 모두 같은 일을 말하고 있다. 내가 학생들에게 준 첫 번째 수업은 그들에게 이 원리를 기억하게 하는 것이다. ):
발음의 특수성으로 인해 발성 기관은 성문 시스템, 인후 시스템, 화성 문 아래 시스템으로 나뉜다. 사람마다 각자의 발성 기관이 있는데, 그것들의 모양과 구조는 모두 다르다. 매번 발음할 때마다 많은 발성 기관이 서로 협조하여 함께 운동해야 한다. 이것은 음성의 물리적 속성 (음성 4 요소라고도 함) 을 결정합니다: 음질, 음장, 음강, 음고. 이러한 물리량은 사람마다 다르기 때문에 소리는 성문도에서 서로 다른 성문 특징을 나타낸다. 이러한 성문 특징 매개변수에 따라 소리를 구분할 수 있을 뿐만 아니라 같은 사람의 목소리도 인식할 수 있다.
말의 안정성. 한 사람의 발성 기관이 성숙되면 해부구조와 생리상태는 안정적이지만, 발음의 사회심리적 속성 (예: 화자의 말하기 습관) 은 모든 사람이 서로 다른 시간에 같은 글을 쓰면 기본적인 음성 특징이 안정적이다. 따라서 사람의 채널을 관악기 속의 나팔로 볼 수 있습니다. 트럼펫과 트럼펫은 모두 트럼펫이지만 채널의 모양과 길이가 다르기 때문에 음질도 다르다.
현재 성문 인식 방법에는 두 가지가 있습니다.
첫째, 중국 사법실천에서 널리 사용되는' 인공인식' 인 전문가 감정인은 음성학 방법에 의존한다.
두 번째는 미래의 발전 방향에 대한' 자동 인식' 이다. 컴퓨터는 알고리즘을 통해 인간의 귀에 대한 음향 특성의 추출, 훈련 및 비교를 시뮬레이션한다.
그렇다면' 변성기' 는 어떤 심오한 것인가요? 변성기는 입력 오디오의 음색과 음조를 바꾸고 변경된 오디오를 출력하는 도구입니다 (바이두 백과). 사실 음속도 있는데 바이두 백과가 빠졌어요. 또 소리 크기는 말할 필요도 없고, 변성기 없이도 변할 수 있다. 그러면 음성 4 요소의 음질 (음색), 음조 (그에 상응하는 음고), 음향강도 (그에 상응하는 음속), 음길이 (그에 상응하는 음속) 가 모두 바뀌고, 음성의 물리적 속성도 달라진다. 어떻게 그들을 식별할 수 있을까요?
A' 변성기' 를 그렇게 심오하게 생각하지 마라
인식에서,' 변성기' 는 하나의 통로가 아닌가? 채널의 정의는 신호가 전송되는 채널이며, 우리의 인식을 성문 인식이라고 합니다. 사실, 분석과 검사는 실제 사람의 목소리가 아니라 사람의 녹음인 소리 신호입니다. 각종 녹음 장치는 채널로 볼 수 있고, 각종 인코딩 방식도 채널로 볼 수 있으며, 모두 소리 신호를 바꾸었다. 예를 들어 무전기, 전화, 모두 통로라고 할 수 있습니다. 너의 목소리는 무전기를 통해 전달되었고, 너의 청각은 이미 왜곡되었다. 너는 이미 채널이 음성 신호에 미치는 영향을 느꼈다. 현재 시중에 나와 있는' 변성기' 는 하드웨어든 소프트웨어든, 주로 기본 주파수를 바꿔 나지막한 목소리 (남성 소리) 를 날카로운 목소리 (여성 소리, 어린이 소리) 로 바꾸는 것이다. (음색 변화에 관해서는 음색이 바뀌었을 것이다. 재샘플링이 기본 주파수를 변경한 후 음색의 피크 특성이 변경되었을 것이다. 한편, * * * 진동봉의 변화는 전체적으로 변하며, 상대관계는 상수로 간주될 수 있다. ) 물론, 정확히 말하자면, 우리의 청각과 사회적 이해에서 이른바 남성, 여성, 어린이, 노인의 목소리일 뿐이다. 소리는 성적인 특징이 아니다. 남녀를 구분할 수 없고 통계만 할 수 있다. 반례는' 정' 의 목소리다. 그렇게 높고 성대가 길다. 인터넷으로 검색해 보세요. 들어보세요. 당신은 자신이 남자라고 생각합니까, 아니면 여자라고 생각합니까? 게다가 코난은 만화에서 변성기로 신기하게 그것을 마오리 오랑으로 만들었다. 현실에서는 이렇게 정확하게 할 수 없고, 이렇게 좋은 효과를 얻을 수 없다. 이론적으로, 그것은 단지 마오리 오랑에서 대량의 음향 데이터를 수집하기만 하면 된다.
"변성기" 는 의미의 모든 음향적 특징을 평가하는 것이 아니라 소리의 물리적 특성을 변화시킨다.
앞서 언급했듯이 일반적으로 사용되는 인공 음성 인식 방법의 주요 장점은 사투리 억양, 성어, 불필요한 단어, 음성 결함, 운율 특징 등 컴퓨터가 식별하기 어려운' 고급 성문 특징' 을 구분할 수 있다는 점이다. 이것은 어떤 "고급" 입니까? 우리가 아는 한 사람의 목소리를 분별하는 첫 번째 일은 이러한 특징을 통해서이다. 모방쇼는 모방할 때도 이런 특징을 매우 중시한다. 하지만 컴퓨터는 식별하기 어렵습니다. 이를 "고급 기능" 이라고 합니다. 네, 인간의 귀는 가장 정밀한 성문 인식 기기입니다. * * * 진동 피크, 기본 주파수 등과 같이 비전문가가 익숙하지 않은' 저수준 성문 특징' 은 컴퓨터에 가장 익숙하며, 심지어 소리가 강하고, 소리가 길고, VOT 도 컴퓨터에 의해 인식될 수 있다.
C "변성기" 는 음성의 물리적 속성을 변경하며, 샘플을 식별할 때도 같은 방법으로 샘플을 변경할 수 있습니다.
수동 식별이든 자동 식별이든 사건의 녹음인' 검사 자료' 와 용의자의 녹음인' 샘플' 을 통해 비교된다. 변성기는 특정 설정을 통해 변경된 "샘플" 이므로 동일한 설정으로 "샘플" 만 변경하면 됩니다. 앞서 언급했듯이, 변성기는 넓은 의미의 채널이다. 한 감정인이 소리가 왜곡되었다고 생각한 적이 있다.' 변성기' 의 경우 신호가 복원되기 전의 소리를 통해 검증해야 하기 때문이다. 이런 생각은 우선 현재의 기술 하에서는 채널 복구가 전혀 회복될 수 없고, 주로 고려하지 않는다. 우리는 분석된 기록을 식별하는데, 어느 것이 채널의 신호를 통해 처리된 결과가 아닌가? 아무리 높은 샘플링 속도와 미세한 정밀도도 이산 변화의 결과이다. 정말 사람 소리 같은 연속 신호와 같을 수 있을까? 모두 채널을 거쳐 신호를 거쳐 처리되지만, 차이가 크고, 청각감이 다르다.
질문 2: "음파는 지문과 마찬가지로 아무리 변해도 식별될 수 있다" 는 말이 맞나요?
대답: 아니요.
"음파" 라는 용어는 틀렸다. "음파" 라는 단어를 들을 때마다 나는 박쥐, 비전문가가 자주 사용하는 용어를 떠올린다. 성문 인식을 전문으로 하는 사람은 인식에 대한 이해가 좋고, 물리와 신호 처리에 대한 이해가 얕고, 박쥐 등 생물에 대한 이해가 많지 않다. 사법실천에서 판사 검사 공안기관 정찰원들은 모두 우리의 전문적인 의견을 권위로 삼았다. 각 로스쿨의 교수들은 서로 다른 견해를 가질 수 있지만, 그들은 계산할 수 있다고 말한다. 그들은 왜 판사가 필요합니까? 이 질문에 정확하게 대답하기 위해 바이두를 검색했는데, 안에 나오는 논문은 내가 직접 쓴 것이거나, 선생님이 쓴 것이거나, 내가 잘 아는 동료가 쓴 것이다. 즉, 바이두에 있는 이 모든 그럴듯한 해석들은 심지어 자기 모순에 대한 우리의 서로 다른 이해와 표현으로부터 나온 것이다. (윌리엄 셰익스피어, 윈스턴, 자기관리명언) "성문" 이라는 단어는 1980 년대 이 사법과학기술이 중국에 도입되었을 때 최초의 감정인에 의해 정의되었다. 이 제목은 음성 인식법에 따라 사용되는 음성지도로, 통속적이고 습관적으로 사용한다. "음성 인식" 은 전체 음성 인식의 총칭으로, 같은 음성 인식, 녹음의 진실성 검사, 음성의 잡음 감소, 신호 대 잡음비 증가를 포함한다. 단독 음성 신분의 인식이라고도 합니다. "성문" 은 주요 감정 근거인 성문의 약칭이다. 음성은 생물학적 특징의 총칭이기도 하다. 현재 감정방법이 발달하면서 성보도가 음향적 특징을 분석하는 방법만이 유일한 감정방법이 아니기 때문에' 법의음성감정' 이라고 부르는 것이 더 정확하고' 성문감정' 이라고 부르는 것이 더 편리하다. 간단히 말해서, 사랑은 아무리 불러도 좋지만,' 음파' 라고 부를 수는 없다.' 음파' 는 다른 뜻이기 때문이다.
"음파" 는 "성문" 과 다르다
번역과 이해의 차이로 인해 음파, 스펙트럼, 소리, 공진봉, 강도와 같은 단어들에서 유래한 것 같습니다. 감정인이 음파를 말하는 경우, 그것은 분명히 파형도 (그림 1 참조) 를 가리키며 강도를 가리킨다. 음성학의 성문 인식에서는 주요 특징이 아니라 공진봉 * * * 진동봉이 주요 특징이다 (그림 2 참조).