현재 위치 - 법률 상담 무료 플랫폼 - 특허 조회 - 칩 시퀀싱의 문제점과 전망
칩 시퀀싱의 문제점과 전망
위챗 공식 계정을 본 트윗은 깊이 해석되었다

/s/7bqcpr1bmjazhv 408-sv6q

염색질 면역침전시퀀싱 (ChIP-seq) 은 DNA 결합단백질, 그룹단백질 변형 또는 핵소체에 대한 전체 게놈 분석 기술이다. 시퀀싱 비용이 감소함에 따라 ChIP-seq 는 유전자 조절과 표관 유전 메커니즘을 연구하는 데 없어서는 안 될 도구가 되었다. 이 문서에서는 이전 내용을 요약하고 ChIP-seq 가 현재 단계에서 주의해야 할 문제와 이 기술을 더 잘 활용하여 연구 결과를 얻을 수 있는 방법을 분석했습니다.

포름 알데히드는 고 투과성 가교제이지만 반응성이 아민으로 제한되기 때문에 가교 결합 효율이 낮습니다. 포유류 세포의 경우 최대 가교 효율은 1% 에 불과하다. DNA 에 머무는 시간이 5 초 미만인 단백질은 단백질에 의해 교차될 수 없다. 또한 포름알데히드는 다른 많은 관련이 없는 단백질을 DNA 에 교차시켜 후속 분석 데이터에 영향을 줄 수 있습니다. 포름 알데히드 가교 결합은 DNA 손상 반응 메커니즘을 유발하여 염색질 구성을 변화시켜 칩 결과를 왜곡시킨다는 보도가 나왔다. 가열과 낮은 PH 에서 가교 반응이 역전되기 때문에 DNA 와 단백질 가교 복합체의 안정성도 주목할 만한 문제다.

포름 알데히드 가교 단계가 있는지 여부에 따라 슬라이스는 두 가지 유형으로 나눌 수 있습니다. 하나는 포름알데히드가 교차하는 X-ChIP (교차 및 기계적 절단 슬라이스) 입니다. 다른 하나는 인터체인지 없는 칩, 즉 N 칩 (Native-Chip) 입니다. N 칩은 X 칩에 비해 많은 장점을 가지고 있습니다. (1) 해상도가 높습니다. (2) 포름 알데히드 가교 결합으로 인한 비특이적 단백질의 DNA 농축을 피한다. (3) 에피토프의 커버리지에 저항하기 위해 포름 알데히드 가교 결합을 피한다. (4) 샘플 손실을 줄였다. Mnase 를 사용했기 때문에 N-chip 은 그룹 단백질 수정 연구에만 적합하고 전사 인자 연구에는 적합하지 않습니다.

일반적으로 사용되는 크래킹효소는 MNase, 즉 마이크로구균 핵산효소로 핵소체 연결구 DNA 서열의 핵산효소를 분해한다. 염색질의 MNase 소화는 독립된 핵소체를 방출할 수 있다. MNase 효소 해독에는 한계가 있다. (1) A/T 염기 부위를 자르는 경향이 있어 핵소체 A/T 농축 지역의 표현이 실제 상황보다 낮다. (2)MNase 는 핵소체 경계에서 정확하게 절단할 수 없어 염색체 개방 위치와 실제 상황이 다르다. (3)MNase 는 취성 핵소체를 소화하는 경향이있다. (4)4)MNase 에서 얻은 DNA 단편은 상대적으로 짧아 후속 샘플의 PCR 증폭과 검사에 어려움이 있다.

초음파 중단은 효소만큼 온화하지 않고 균일하지 않은 중단으로 시퀀싱 결과의 배경 소음이 높아져 후속 데이터 분석에 영향을 미칠 수 있다는 연구결과가 나왔다. 인터럽트 모드를 선택할 때 (1) 연구 중인 단백질이 높은 표현이고 DNA 와 밀접하게 결합되어 있는 경우 (예: 그룹 단백질), 샘플은 교차 연결이 필요하지 않으며 효소 분해를 사용할 수 있습니다. (2) 연구 중인 단백질의 표현 풍도가 낮거나 DNA 와 긴밀하게 결합되지 않는 경우 (예: 전사 인자) 교합제로 샘플을 고정시켜 단백질과 DNA 형태를 안정시키는 것이 좋다. 이 경우 초음파 분쇄가 가장 좋습니다.

ChIP-seq 데이터는 게놈 동적 정보를 추정하거나 일부 실험 데이터로 세포 유형의 표관지도에 주석을 다는 데 사용할 수 있는 다양한 세포 유형을 분석하는 데 사용할 수 있습니다. 점점 더 많은 연구에 따르면, 표관 유전 정보는 유전자 표현과 염색체 구조 높이와 관련이 있어 유전자 표현과 염색체 형태를 예측하는 데 사용될 수 있다. 이 섹션에서는 그룹 단백질 수정 칩 시퀀스 분석을 위한 고급 응용 도구에 대해 간략하게 설명합니다.

ChIP-seq 실험에서 얻은 후성 유전 정보를 통해 유전자 표현 수준을 정량적으로 추정하기 위해 기계 학습에 기반한 다양한 방법을 개발했다. 예를 들어, CD4+T 세포의 유전자 표현을 예측하기 위해 (1) 선형 회귀 모델을 그룹 단백질 수정 및 하위 비트의 농축에 적용합니다. 그들은 19 그룹 단백질 손질을 사용했는데, 이는 세 개의 프로모터 부위의 손질만으로 유전자 표현 [1] 을 시뮬레이션하기에 충분하다는 것을 보여준다. (2) 다 변수 적응 회귀선 (MARS) 및 무작위 숲과 같은 비선형 모델을 사용하여 7 가지 인간 세포주 중 1 1 개 그룹 단백질 수정 및 DNase I 과민 반응도 [2] 를 그렸습니다. 이러한 모델은 하위 비트를 강화하는 정보는 고려하지 않고 하위 사이트의 표관 유전 패턴만 고려합니다. 대신 DeepExpression[3] 은 하이칩 데이터 [4] 를 사용하여 단백질의 중앙 염색체 고리를 캡처하여 증강 인자와 프로모터와의 상호 작용을 고려합니다. 컨볼 루션 신경망 (CNN) 을 사용하여 유전자 표현 [5] 또는 차이 유전자 조절 패턴 [6] 을 예측하는 도구도 있습니다.

많은 연구에 따르면 증강자의 단일 염기 다형성은 유전병과 암 [7] 을 유발할 수 있으므로 다른 세포주에서 증강자의 상태를 정의하는 방법이 필요하다. 염색질 구상 포획 (3C) 실험은 하이C [8], 하이칩 [4], 치아-PET [9] 등 몇 가지 신기술을 확장해 증폭자와 과녁 유전자 사이의 공간 구조를 포착할 수 있다. Hariprakash 와 Ferrari 는 유전자가 보강자와 상호 작용하는 방법을 네 가지 범주로 나눕니다. (1) 상관 관계를 기준으로 모든 보강자-시동자 쌍의 상호 작용 강도를 추정합니다. (2) 회귀 방법에 따라 여러 증강자가 단일 유전자에 기여한다고 가정합니다. (3) 감독 학습 및 채점 방법에 따라 여러 ChIP-seq 데이터 세트 및 기타 정보 유형을 통합할 수 있습니다. 이러한 도구는 향상된 하위-시작 하위 상호 작용에 중점을 두지만, 향상된 하위 링 및 분리로 인한 약한 염색질 수집 [10] 과 같은 여러 가지 다른 유형의 염색질 상호 작용이 있습니다. CITD[ 1 1] 와 용 [12] 은 각각 소파 변환과 포텐셜 에너지 함수를 이용하여 표성 유전 데이터에서 3 차원 게놈 조직을 종합적으로 분석한다.

ChIP-seq 데이터의 편차 및 배치 효과는 분석에 큰 영향을 미칩니다. 기계 학습 방법은 교육 데이터의 소음에 민감하기 때문에 일부 ChIP-seq 샘플은 중간 품질로 인식되거나 저품질 데이터로 거부됩니다 (데이터 손실 발생). 생물 샘플이 비교적 소중하다면 (예: 원대 세포와 임상 샘플) 샘플을 대량으로 채취하기가 어렵다면' 데이터 보간' 방법이 적용될 수 있다. 이러한 방법은 다른 밀접한 관련 세포 유형의 표관 유전 데이터를 사용하여 데이터 노이즈 제거 또는 재구성을 수행합니다. 데이터 노이즈 제거는 데이터의 노이즈를 식별하고 제거하여 기존 ChIP-seq 샘플의 품질을 향상시키도록 설계되었습니다. 소프트웨어 Coda[ 13] 는 소음을 생성하는 프로세스를 인코딩하고 컨볼 루션 신경망을 사용하여 ChIP-seq 데이터의 신호를 복구합니다. 데이터 재구성의 목적은 컴퓨터의 큰 데이터 세트에서 누락된 칩 시퀀스 데이터를 생성하는 것입니다. Chromimpulse [14] 는 회귀 트리를 사용하여 가장 관련성이 높은 10 가지 세포 유형을 사용하는 각 삭제 실험의 신호를 추론할 수 있는 새로운 도구입니다. 소프트웨어 PREDICTD[ 15] 와 Avocado[ 16] 는 텐서 분해를 사용하여 여러 ChIP-seq 데이터를 동시에 삽입합니다. 이러한 데이터 보간 방법은 실제 ChIP-seq 실험의 잠재적 계산 대안이며 생물학적으로 불가능한 모든 세포 유형과 환경 조건을 수집하는 표관 게놈 데이터를위한 길을 열어 줄 수 있습니다. 이 방법은 계산에 어려움이 있지만, 다양한 세포 유형의 사람들은 고품질의 데이터를 사용하여 이러한 목표를 달성하도록 권장할 수 있습니다.

최근 연구에 따르면 많은 세포 유형 (정상적인 면역세포 포함) 이 복잡한 조직과 종양에서 중요한 보조 기능을 하고 있는 것으로 나타났다. 이러한 세포 이질성과 세포가 발육하는 과정의 운명을 밝히기 위해 다양한 단세포 측정 방법이 개발되었다. 그 중에서도 scChIP-seq 는 낮은 입력 샘플에서 단세포 해상도로 그룹 단백질 손질과 기타 염색질 결합단백질의 전체 게놈을 분석할 수 있다. 최근 단세포 표식 및 칩 시퀀스 라이브러리 준비에 사용되는 많은 방법이 단세포 표식 및 칩 시퀀스 라이브러리 준비에 사용되었습니다. 이러한 방법은 마이크로유체 시스템, Tn5 회전 효소 표시 및 칩 없는 전략을 사용합니다.

첫 번째 scChIP-seq 방법, scDrop-ChIP [17] 은 마이크로흐름 제어 시스템을 사용하여 표준 칩 방법과 결합하여 세포당 약 800 개의 반복되지 않는 읽기 세그먼트를 생성합니다. 최근 개발된 마이크로흐름 제어 방법 [18] 은 세포당 약 10000 개의 반복되지 않는 읽기 조각을 생성하는 더 높은 해상도를 제공합니다. 이러한 방법의 한계는 대부분의 실험실에서 일반적으로 특수 미세 유체 장치를 사용할 수 없다는 것입니다.

Tn5 회전 효소를 사용하는 레이블 기반 라이브러리 준비는 ChIP-seq 를 포함한 다양한 NGS 분석에 널리 사용되고 있습니다. Sc-itChIP-seq [19] 클래식 칩 실험 전에 표기 기술을 이용하여 단세포 표기를 하고 문고를 준비한다. 이 방법은 단위당 9,000 개의 반복되지 않는 읽기 조각을 생성합니다. 실험 과정은 표준 ChIP-seq 방법과 유사하기 때문에 scDrop-ChIP 보다 사용하기 쉽습니다.

ScChIP-seq 는 단세포 염색질 면역분해서열분석 (scChIC-seq)[20] 과 단세포 ULICUT & RUN [21] 등 여러 가지 무칩 방법을 개발했다. +0]; 이들은 CUT&RUN 방법 [22], MNase 및 단백질 A 의 융합 단백질을 기반으로 특이항체 절단 과녁 지점을 감지하는 데 사용됩니다. 이러한 방법들은 세포당 약 4 100 개의 반복되지 않는 독서 조각을 생성한 다음 문고를 준비하는 엄격한 실험 단계가 필요하다. 단점은 읽기 비율이 상대적으로 낮다는 것입니다 (~ 6%). 또한 Tn5 회전효소와 단백질 A 를 융합단백질로 사용하는 CUT&Tag [23]]], ACT-seq [24], CoBATCH [25] 의 세 가지 유사한 방법이 개발되었습니다. 문고제비 과정에서 목적단백질과 염색체가 결합되면 융합단백질이 일항한 다음 Tn5 회전효소 표기단백질 결합부위를 활성화시킨다. 이러한 방법의 장점은 단백질 결합 부위 검사와 문고 제비를 동시에 진행할 수 있어 실험 단계와 시간을 크게 줄일 수 있다는 것이다. 또한 이러한 방법은 면역 침전 단계로 인한 오류의 영향을 덜 받습니다. 또한 이러한 방법은 각 세포가 약 12000 개의 반복되지 않는 읽기 조각을 생성하는 약 97% 의 비교율을 보여 줍니다. 따라서 이 무칩 방법은 고통과 고품질 scChIP-seq 분석의 잠재력을 가지고 있습니다. 마지막으로 염색질 통합 표시 및 시퀀싱 (ChIL-seq)[26] 은 칩이 아닌 면역 염색을 기반으로 하는 또 다른 칩 없는 방법입니다. 이 방법은 T7 RNA 중합 효소 프로모터, NGS 커넥터 시퀀스 및 Tn5 결합 시퀀스가 포함된 dsDNA 와 결합된 두 번째 항체 프로브를 사용합니다. 첫 번째 항체 캡처 후, 프로브 DNA 서열은 Tn5 회전 효소를 통해 표적 결합 부위에 통합됩니다. 그런 다음 전사를 통해 통합 영역을 확대하고 RNA 순수화와 문고제비를 진행한다. 이 방법은 단세포 분석에 사용할 수 있지만 높은 패스 측정 순서를 달성하기 위해 여러 번 최적화해야 할 수 있습니다. 다른 scChIP-seq 방법은 여러 그룹 단백질 수정 및 기타 염색질 결합 단백질을 동시에 감지하는 것과 같은 향후 개발될 예정입니다. 이 연구들은 각 세포 염색체의 유전자 조절 인자를 포착하고 그것들 사이의 상호 작용을 알 수 있을 것이다.

[1]R. Karlic, H.R. Chung, J. Lasserre, K. Vlahovicek, M. Vingron, 그룹 단백질 보정 수준은

[2]X. Dong, M.C. Greven, A. Kundaje, S. Djebali, J.B. Brown, C. Cheng, T. 입니다

[3]W. Zeng, Y. Wang, R. Jiang, 밀집된 컨볼 루션 신경망을 통해 원격 및 근거리 정보 예측 유전자 표현 통합, 생물 정보학 36(2) (2020) 496-503.

[4]M.R. Mumbach, A.J. Rubin, R.A. Flynn, C. Dai, P.A. Khavari, w.j. 입니다

[5]R. Singh, J. Lanchantin, G. Robins, Y. Qi, DeepChrome: 히스톤 수정에서 유전자 발현을 예측하는 심층 학습, 생물 정보학 32 (/kloc-)

[6]A. Sekhon, R. Singh, Y. Qi, DeepDiff: 히스톤 수정에서 차이 유전자 발현을 예측하는 심층 학습, 생물 정보학 34 (17) (20/

[7]H. Chen, C. Li, X. Peng, Z. Zhou, J.N. Weinstein, n. 암 게놈지도 연구, H. Liang, 근접

[8]E. Lieberman-Aiden, N.L. van Berkum, L. "인간 게놈 접기 원리를 보여주는 장거리 상호 작용 종합지도", "과학" 326 (5950) (2000

[9]M.J. Fullwood, M.H. Liu, Y.F. E.T. Liu, C.L. Wei, E. Cheung, Y.

[10] b.r. 사바리, a. 달 아네세, a. 보이자, i.a. 클라인, e.l. 코피, K. 시

[1 1] 진, 왕, 선, 진, 장, 표관 유전지도의 소파 변환을 통해 3 차원 염색질 상호 작용과 토폴로지 도메인, 핵산 연구 44 (1/KLLL

[12] 장, 염색질 상태로 3 차원 게놈 구조 예측, Plos Computo Biol15 (6) (2019)

[13]P.W. Koh, E. Pierson, A. Kundaje, 노이즈 제거 전체 게놈 단백질 칩-시퀀스 및 변환 신경망, 생물 정보학 33 (/kloc-;

[14]J. Ernst, M. Kellis, "다양한 인체 조직 시스템 주석을 위한 표관 게놈 데이터 세트의 대규모 보간", "자연생명기술" 33 (4) (20/kloc-

[15]T.J. Durham, M.W. Libbrecht, J.J. Howbert, J. Bilmes, w.s.

[16]J. Schreiber, T. Durham, J. Bilmes, W.S. Noble

[17]A. Rotem, O. Ram, N. Shoresh, R.A. Sperling, A. Goren, D.A. 입니다

[18]K. Grosselin, A. Durand, J. Marsolier, A. Poitou, E. Marangoni, f.. A. Woolfe, C.Brenan, A.D. Griffiths, C. Vallot, A. Gerard, 고 처리량 단세포 칩 -seq 유방암 염색질 상태의 이질성 확인, NAT generard

[19]S. Ai, H. Xiong, C.C. Li, Y. Luo, Q. Shi, Y. Liu, x.yu.

[20] w.l., K. Nakamura, W. Gao, K. Cui, G. Hu, Q. Tang, B. Ni, K. Zhao

[2 1]S.J. Hainer, A. Boskovic, K.N. McCannell, O.J. Rando, t.g.

[22]P.J. Skene, S. Henikoff, DNA 결합 부위의 고해상도 매핑을 위한 효율적인 타깃 핵산 효소 전략, Elife 6 (20 17).

H.s.caya-오쿠, s.j.wu, c.a. 코도모, e.s. 플레클, t.d. 브라이슨, j.g. 헤니코프, K.

[24] B. 카터, w.l., J.Y. Kang, G. Hu, J. Perrie, Q. Tang, K. Zhao, 맵

[25] 왕, 곰, 경기, 유, 유, 장, 호, 고 수율 단세포 표관 게놈 분석, 분자 세포 76 (1) (2019) 200

[26] A. Harada, K. Maehara, T. Handa, Y. Arimura, J. Nogami, Y. Hayashi-Takanaka,,