현재 위치 - 법률 상담 무료 플랫폼 - 특허 조회 - 오디오 압축 세부 사항 대전
오디오 압축 세부 사항 대전
오디오 압축 기술은 원시 디지털 오디오 신호 스트림 (펄스 코드 변조) 에 적절한 디지털 신호 처리 기술을 적용하는 것으로, 유용한 정보나 손실을 잃지 않고 무시할 수 있는 비트 전송률을 감소 (압축) 하는 것을 말합니다. 압축 인코딩이라고도 합니다. 압축 해제 또는 디코딩이라고 하는 해당 역변환이 있어야 합니다. 오디오 신호는 코덱 시스템을 통과한 후 많은 소음과 약간의 왜곡을 도입할 수 있습니다.

오디오 압축 기술의 출현과 초기 응용, 오디오 신호의 중복 정보, 스펙트럼 마스킹 효과. 시간 영역 마스킹 효과. , 압축 인코딩 방법, 압축 방법의 기타 구분, 오디오 압축 알고리즘의 주요 분류 및 일반 대표, 시간 영역 압축 (또는 파형 코딩) 기술, 하위 밴드 압축 기술, 오디오 압축 기술의 표준화 및 MPEG- 1, 오디오 압축 기술의 출현 및 초기 적용은 원시 디지털 오디오 신호 스트림 (펄스 코드 변조) 을 의미합니다 압축 해제 또는 디코딩이라고 하는 해당 역변환이 있어야 합니다. 오디오 신호는 코덱 시스템을 통과한 후 많은 소음과 약간의 왜곡을 도입할 수 있습니다. 디지털 신호의 장점은 분명하지만 스토리지 용량 요구 사항의 증가와 전송 시 채널 용량 요구 사항의 증가라는 단점도 있습니다. CD 를 예로 들면 샘플 비율은 44. 1KHz 이고 정량화 정확도는 16 비트인 경우 1 분 스테레오 오디오 신호가 1 을 차지합니다. 물론, 이 문제는 대역폭이 훨씬 높은 디지털 비디오 분야에서 더욱 두드러진다. 이 모든 비트가 필요합니까? PCM 코드 스트림으로 직접 저장하고 전송하는 데 큰 중복이 있음을 발견했습니다. 실제로 사운드는 최소 4: 1 무손실 압축, 즉 25% 의 숫자로만 모든 정보를 보존하고 비디오 분야에서는 수백 배나 압축할 수 있습니다. 이에 따라 한정된 자원을 활용하기 위해 압축 기술이 등장한 이후 많은 관심을 받고 있다. 오디오 압축 기술의 연구와 응용은 오랜 역사를 가지고 있다. 예를 들어, A 율과 U 율 코드는 ISDN 음성 전송에 적용된 간단한 준 순간 확장기입니다. 음성 신호에 대한 연구는 비교적 일찍 발전했고, 비교적 성숙했으며, 어댑티브 차이 PCM(ADPCM), 선형 예측 코딩 (LPC) 등의 기술을 광범위하게 응용했다. 방송 분야에서 오디오 압축 기술은 NICAM (거의 즉각적인 확장 오디오 멀티플렉싱) 과 같은 시스템에서 사용됩니다. 오디오 신호의 중복 정보 디지털 오디오 압축 인코딩은 신호가 청각적으로 왜곡되지 않도록 가능한 한 오디오 데이터 신호를 압축합니다. 디지털 오디오 압축 인코딩은 사운드 신호에서 중복 컴포넌트를 제거하여 수행됩니다. 리던던시 성분이란 오디오 속 사람의 귀가 감지할 수 없는 신호를 가리키며, 소리의 음색, 음조 등을 결정하는 데 도움이 되지 않는다. 중복 신호에는 사람의 귀 청각 범위 밖의 오디오 신호와 마스킹 오디오 신호가 포함됩니다. 예를 들어, 사람의 귀가 감지할 수 있는 소리 신호의 주파수 범위는 20 Hz ~ 20 kHz 이며, 다른 사람의 귀가 감지할 수 없는 주파수는 중복 신호로 간주될 수 있습니다. 또한, 인간의 청각의 생리학과 심리음향 현상에 따르면, 강한 신호와 약한 신호가 동시에 존재할 때, 약한 신호는 강한 신호에 의해 가려져 들리지 않기 때문에 약한 신호는 중복 신호로 간주되어 전송되지 않을 수 있다. 이것이 바로 인간의 청각의 마스킹 효과로, 주로 스펙트럼 마스킹 효과와 시간 영역 마스킹 효과를 나타낸다. 이제 각각 다음과 같이 소개합니다: 스펙트럼 마스킹 효과. 한 주파수의 음향이 일정 임계값보다 작으면 사람의 귀는 들리지 않는다. 이 임계값을 최소 청각 임계값이라고 합니다. 에너지가 더 높은 또 다른 소리가 나타나면 사운드 주파수 근처의 임계값이 많이 증가합니다. 이를 마스킹 효과라고 합니다. 통합지도의 시간 영역 마스킹 효과. 강한 신호와 약한 신호가 동시에 나타날 때도 시간 영역 마스킹 효과가 있다. 즉, 발생 시간이 매우 가까울 때도 마스킹 효과가 나타납니다. 기간 마스킹은 사전 마스킹, 동시 마스킹, 사후 마스킹의 세 부분으로 나뉩니다. 사전 마스킹이란 사람의 귀가 강한 신호를 듣기 전에 이미 있는 약한 신호가 가려져 짧은 시간 안에 들리지 않는 것을 말한다. 동시 마스킹이란 강한 신호와 약한 신호가 동시에 존재할 때 약한 신호가 강한 신호에 의해 가려져 들리지 않는 것을 말합니다. 후방 마스킹이란 강한 신호가 사라진 후 약한 신호를 다시 듣는 데 오랜 시간이 걸리는 것을 말합니다. 이를 후방 마스킹이라고 합니다. 이러한 차폐된 약한 신호는 중복 신호로 간주될 수 있다. 압축 인코딩 방법은 압축 원리에 따라 오디오 신호 인코딩은 파형 인코딩, 매개변수 인코딩 및 다양한 기술을 결합한 인코딩 형식 (1) 으로 나뉩니다. 파형 인코딩은 특정 속도로 오디오 신호의 시간 영역 또는 주파수 영역 파형을 직접 샘플링한 다음 진폭 샘플을 등급을 매겨 디지털 코드로 변환합니다. 파형 데이터에서 재구성된 신호 인코딩 시스템을 생성합니다. 이 신호 인코딩 시스템은 원본 사운드 파형과 최대한 일치하며 신호의 세부 사항 변경 및 다양한 전환 특징을 유지합니다. (2) 매개 변수 코딩은 먼저 언어 신호 및 자연 사운드와 같은 다양한 신호 소스를 기반으로 피쳐 모델을 설정합니다. 특징 매개변수와 인코딩을 추출함으로써 재구성된 사운드 신호는 가능한 한 어쿠스틱 의미를 유지하지만, 재구성된 신호의 파형은 어쿠스틱 신호의 파형과 크게 다를 수 있습니다. 일반적으로 사용되는 * * * 피크, 선형 예측 계수, 분할 필터 등의 매개변수 인코딩 기술은 저속 오디오 신호 인코딩을 가능하게 하며, 비트율은 2Kbit/s-4.8Kbit/s 로 압축할 수 있지만 음질은 중간, 특히 자연도가 낮으며 언어 전송 및 표현에만 적합합니다. (3) 혼합 인코딩, 파형 인코딩과 매개변수 인코딩을 결합하여 기존 파형 인코딩과 매개변수 인코딩의 약점을 극복하고 파형 인코딩의 높은 품질과 매개변수 인코딩의 낮은 비트율을 유지하려고 합니다. 4- 16 kbit/s 의 비트율로 고품질의 합성 사운드 신호를 얻습니다. 혼합 인코딩은 선형 예측 인코딩을 기반으로 합니다.

다른 압축 방법은 오디오 압축 영역으로 분류됩니다. 손실 압축과 무손실 압축의 두 가지 압축 방법이 있습니다! 우리가 자주 보는 MP3, WMA, OGG 는 모두 손실 압축이라고 합니다. 이름에서 알 수 있듯이 손실 압축은 오디오 샘플링 빈도와 비트율을 낮추는 것이며 출력된 오디오 파일은 원본 파일보다 작습니다. 또 다른 오디오 압축은 무손실 압축이라고 하는데, 이것이 바로 우리가 말하고자 하는 것이다. 무손실 압축은 원본 파일의 모든 데이터를 100% 유지하면서 오디오 파일의 볼륨을 줄일 수 있으며, 압축된 오디오 파일은 원본 파일과 동일한 크기와 비트율로 복구됩니다. 무손실 압축 형식은 APE, FLAC, WavPack, LPAC, WMALossless, AppleLossless, LA, OptimFROG, Shorten 이며 일반적인 메인스트림 무손실 압축 형식은 APE 뿐입니다 오디오 압축 알고리즘의 주요 분류와 일반적인 대표자는 일반적으로 무손실 압축과 손실 압축의 두 가지 주요 범주로 나눌 수 있으며, 압축 체계에 따라 시간 영역 압축, 변환 압축, 하위 밴드 압축 및 다양한 기술의 혼합 압축으로 나눌 수 있습니다. 압축 기술은 알고리즘의 복잡성 (시간 복잡성과 공간 복잡성 포함), 오디오 품질, 알고리즘 효율성 (압축비), 코덱 지연 등에 따라 크게 다릅니다. 각종 압축 기술의 응용도 다르다. 시간 영역 압축 (또는 파형 인코딩) 기술은 오디오 PCM 코드 스트림 샘플을 직접 처리하고 음소거 감지, 비선형 정량화, 차이 등을 통해 코드 스트림을 압축합니다. 이러한 압축 기술의 공통된 특징은 알고리즘의 복잡성이 낮고, 음질이 보통이며, 압축비가 낮다는 것입니다 (CD 음질 > 400kbps), 코덱 지연 시간이 가장 짧습니다 (다른 기술에 비해). 이 압축 기술은 일반적으로 음성 압축 및 낮은 비트율 응용 프로그램 (작은 소스 신호 대역폭) 에 사용됩니다. 시간 영역 압축 기술은 주로 G.7 1 1, ADPCM, LPC, CELP, 그리고 NICAM 및 서브 밴드 ADPCM(SB-ADPCM) 과 같은 이러한 기술에서 개발된 블록 디퓨저입니다 서브 밴드 압축 기술의 서브 밴드 코딩 이론은 Crochiere = 1976 에 의해 처음 제안되었습니다. 기본 아이디어는 신호를 여러 하위 밴드 내의 컴포넌트 합계로 분해한 다음 각 하위 밴드 컴포넌트에 대해 서로 다른 압축 전략을 사용하여 비트율을 낮추는 것입니다. 일반적인 하위 밴드 압축 기술 및 아래에 설명된 변환 압축 기술은 사운드 신호에 기반한 인간 인식 모델 (심리 음향 모델) 으로, 신호 스펙트럼을 분석하여 하위 밴드 샘플 또는 주파수 영역 샘플의 정량화 단계 등의 매개변수를 결정합니다. 따라서 감지 압축 인코딩이라고도 합니다. 이 두 가지 압축 방법은 시간 영역 압축 기술에 비해 훨씬 복잡하며 인코딩 효율성과 음질도 크게 향상되며 인코딩 지연도 그에 따라 증가합니다. 일반적으로 하위 밴드 인코딩의 복잡성은 변환 인코딩보다 약간 낮으며 인코딩 지연도 상대적으로 짧습니다. 오디오 압축 기술과 MPEG- 1 의 표준화는 디지털 오디오 압축 기술이 광범위하게 적용되고 시장 전망이 좋기 때문에 일부 연구기관과 회사들은 특허 기술과 제품을 개발하기 위해 전력을 다하고 있습니다. 이러한 오디오 압축 기술을 표준화하는 것이 중요합니다. MPEG- 1 오디오 (ISO/IEC11172-3) 는 오디오 압축 표준화에 큰 성공을 거두었습니다. MPEG- 1 에서 오디오 압축에는 1 층, 2 층 (MUSICAM, MP2 라고도 함) 및 3 층 (MP3 라고도 함) 의 세 가지 모드가 있습니다. 다양한 압축 기술에 대한 세밀한 고찰과 실제 응용 조건과 알고리즘의 실현 가능성 (복잡성) 에 대한 충분한 고려로 세 가지 모델이 광범위하게 적용되었다. VCD 에서 사용하는 오디오 압축 방식은 MPEG-1레이어 I 입니다. MUSICAM 은 적절한 복잡성과 뛰어난 음질로 디지털 스튜디오, DAB, DVB 등 디지털 튜플의 제작, 교환, 저장 및 전송에 널리 사용되고 있습니다. MP3 는 MUSICAM 과 ASPEC 의 장점을 기반으로 하는 혼합 압축 기술입니다. 당시 MP3 의 복잡성은 비교적 높아서 실시간 코딩에 불리하다. 그러나 낮은 비트율로 높은 수준의 음질로 인해 MP3 는 소프트 압축 해제와 인터넷 재생의 총아가 되었다. MPEG- 1 오디오 표준의 제정이 성공을 결정한다고 할 수 있는데, 이는 앞으로 논의할 MPEG-2 와 MPEG-4 오디오 표준의 제정에도 영향을 미칠 수 있다.