유전자 서열 중 단 네 글자, 즉 A, C, G, T 는 각각 DNA 를 구성하는 네 개의 뉴클레오티드를 나타낸다. 아데닌, 시토신, 구아린, 흉선 피리 미딘, 길이가 4 보다 큰 뉴클레오티드 문자열을 시퀀스라고 하며, 각 문자는 하나의 염기를 나타내고, 두 개의 염기는 하나의 염기쌍을 형성하고, 염기쌍의 페어링 법칙은 고정되어 있다.
실제 또는 가상의 DNA 분자의 1 차 구조로, 일부 DNA 서열이나 유전자 서열 속 일련의 글자로 표현된 유전 정보를 가지고 있다.