양조효모 게놈에는 약120,000 개의 염기쌍이 함유되어 있어 16 조의 염색체로 나뉜다. * * * 6275 개의 유전자가 있으며 그 중 약 5800 개가 실제 기능을 가질 수 있습니다. 유전자의 약 23% 가 인간과 동족인 것으로 추산됩니다. 효모 게놈 데이터베이스에는 효모 게놈에 대한 자세한 주석이 들어 있어 진핵 세포 유전학과 생리학을 연구하는 중요한 도구이다. 또 다른 중요한 양조효모 데이터베이스 [1] 는 헨의 단백질 서열 정보센터에서 유지한다.
양조효모의 시퀀싱 프로젝트가 시작되기 전에 전통적인 유전 방법을 통해 효모 중 약 2600 개의 RNA 나 단백질을 인코딩하는 유전자를 감정했다. 양조효모의 전체 게놈을 서열화하여 12068kb 의 전체 게놈 서열에 5885 개의 특정 단백질을 인코딩하는 오픈 독서 상자가 있는 것으로 밝혀졌다. 이것은 효모 게놈에 평균 2kb 당 단백질을 인코딩하는 유전자가 있다는 것을 의미한다. 즉, 전체 게놈의 72% 의 뉴클레오티드 서열은 오픈 독서 상자로 이루어져 있다. 이것은 효모 유전자의 배열이 다른 고등 진핵 생물보다 더 촘촘하다는 것을 보여준다. 예를 들어 선충의 게놈에는 평균 6kb 마다 단백질을 인코딩하는 유전자가 있습니다. 인간 게놈에서는 단백질을 인코딩하는 유전자를 평균 30kb 이상 발견할 수 있다. 효모 게놈의 밀착성은 유전자 사이의 간격이 짧고 유전자 속의 내용물이 부족하기 때문이다. 효모 게놈 오픈 읽기 상자의 평균 길이는 1450bp, 즉 483 개의 코돈, 가장 긴 것은 번호 염색체에 있는 알 수 없는 오픈 읽기 상자 (49 10 코돈), 소수의 오픈 읽기 상자가/KLOC-를 초과합니다. 효모 게놈에는 짧은 단백질을 인코딩하는 유전자도 있다. 예를 들어 PMP 1 유전자는 40 개의 아미노산으로 구성된 질막 지질을 인코딩한다. 또한 효모 게놈에는 약 140 개의 RNA 를 인코딩하는 유전자가 포함되어 있으며 염색체 수의 긴 끝에 배열되어 있습니다. SnRNA 를 인코딩하는 40 개의 유전자는 16 개의 염색체에 분산되어 있습니다. 43 개 가족에 속한 275 개의 tRNA 유전자도 게놈에 광범위하게 분포되어 있다. 표 1 은 효모 유전자가 각 염색체에 분포되어 있는 개요를 제공한다. 표 1 효모 염색체지도
염색체 수 길이 (BP) 유전자 수와 tRNA 유전자 수
I 23× 103894
ⅱ 807188 41013
ⅲ 315 ×10318210
ⅳ153197479627
V 569 202 27 1 13
ⅵ 270×10312910
ⅶ109 093 657233
ⅷ 561×10326911
ⅸ 439 8862 2110
X 745 44237924
8566 64 483 3116
10781715 3422
I924 430 45921
V7843 2841915
XV 109 2283 56020
X ⅵ 94 806 1487 17 시퀀싱은 효모 게놈의 광범위한 염기 조성 변화를 밝혀냈다. 대부분의 효모 염색체는 GC 가 풍부한 DNA 서열과 GC 가 누락된 DNA 서열로 다양한 정도로 광범위하게 구성되어 있다. GC 함량의 이러한 변화는 염색체 구조, 유전자 밀도 및 재구성 빈도와 관련이 있다. GC 함량이 높은 영역은 일반적으로 염색체 암 중간에 위치하며, 이 지역은 유전자 밀도가 높다. GC 함량이 낮은 영역은 일반적으로 텔로메레와 실크 입자와 가깝고, 이들 영역의 유전자 수는 상대적으로 적다. Simchen 등은 효모 유전 재편성, 즉 쌍사슬 파열의 상대적 발생률이 염색체가 GC 가 풍부한 지역과 결합되어 염색체에 따라 재구성 빈도가 다르다는 것을 확인했다. 작은 염색체 I, ⅲ, ⅳ, ⅸ 의 재조합 빈도는 전체 게놈의 평균 재조합 주파수보다 높다.
효모 게놈의 또 다른 뚜렷한 특징은 많은 중복 DNA 서열을 포함하고 있으며, 그 중 일부는 rDNA 와 CUP 1 유전자, Ty 인자 및 그에 따른 단일 LTR 서열과 같은 동일한 DNA 서열이다. 오픈 독서 상자나 유전자 간격 영역에는 대량의 삼뉴클레오티드 반복 서열이 있어 큰 관심을 끌고 있다. 일부 인간 유전병은 삼뉴클레오티드 반복수의 변화로 인해 발생하기도 하기 때문이다. 서로 고도로 동원되는 DNA 서열이 비교적 많은데, 이를 유전적 중복이라고 한다. 효모에 있는 많은 염색체의 끝에는 수십 킬로바이트 이상의 고도의 동족지역이 있는데, 이 지역은 유전적 풍도의 주요 영역이며, 이들 지역은 여전히 빈번한 DNA 재편성 과정을 진행하고 있다. 유전적 풍도의 또 다른 형태는 단일 유전자 반복이다. 그중 분산형이 가장 전형적이고, 또 다른 희귀한 유형은 클러스터 분포형 유전자 가족이다. 클러스터 동원지역 (CHR) 은 효모 게놈 시퀀싱에 의해 밝혀진 여러 염색체에 위치한 일부 동원대인데, 각 조각에는 서로 상응하는 동원유전자가 몇 개 포함되어 있다. 정렬 순서와 전사 방향은 매우 보수적이어서 작은 조각이 삽입되거나 삭제될 수 있습니다. 이러한 특징들은 클러스터 동원구가 염색체의 큰 조각 복제와 완전 분화 사이의 중간 산물이라는 것을 보여 주기 때문에 게놈 진화를 연구하는 좋은 재료이며 유전자 복제의 화석이라고 불린다. 염색체 끝 반복, 단일 유전자 반복 및 클러스터 동족구는 효모 게놈의 유전적 풍도의 일반적인 구조를 형성한다. 연구에 따르면, 유전적 풍도의 유전자 그룹은 종종 동일하거나 유사한 생리 기능을 가지고 있기 때문에, 그 중 하나 이상의 유전자 돌연변이는 식별 가능한 표현형을 보여주지 못하며, 이는 효모 유전자의 기능 연구에 매우 불리하다. 따라서 많은 효모 유전학자들은 유전적 풍도의 진정한 성격과 기능적 의미를 이해하고 그에 관련된 실험 방법을 개발하는 것이 주요 어려움과 중심 문제라고 생각한다.