2019-09-26

히스티딘 델타 엡실론 질소 뜻(Histidine delta and epsilon nitrogen nomenclature)

0. 이게 다 일반화학을 꼼꼼하게 공부하지 않아서 생기는 문제다.



(HIS의 자태. 출처 : 링크)

1. PDB(Protein Data Bank) files 내의 histidine은 실제로 아래 세 가지 모양 중 하나로 표현된다.

HID : 히스티딘의 수소가 delta nitrogen에 붙은 것
HIE : 히스티딘의 수소가 epsilon nitrogen에 붙은 것
HIP : 히스티딘의 수소가 두 nitrogen에 모두 붙어 positive charge를 띠는 것.

pH에 따라 히스티딘의 잔기는 protonated 될 수도, neutralized 될 수도,

혹은 negative charge를 띠게 될 수도 있다.

위의 사진에서도 알 수 있듯이 histidine의 functional group의 pK_R은 6.0이다.

일반적으로 생리식염수가 pH 7.4 정도 된다는 점을 감안하면

HIP는 존재하기 힘들고, 주로 HID나 HIE 중 한 가지 형태로 나타나게 된다.

(Amber와 CHARMM에서 atom type의 이름이 다를 수 있다. 참고하자.
출처 : 링크)



2. 이거 말고도 Amber에선 아래 표와 같이 여러 상황에 따라

residue의 이름을 다르게 명명하고 있다.

Aspartic acid, cysteine, glutamic acid, histidine같은 잔기들은 pH에 따라 다르다보니

MD에서 명시해줄 필요가 있는 것이다.

(출처 : 링크)


3. 이걸 찾게 된 경위는 사실 Amber package에서 뱉어낸 오류 때문이었다.

<
Created a new atom named: HD1 within residue: .R

...

FATAL:  Atom .R.A does not have a type.
Failed to generate parameters
Parameter file was not saved.
>

PDB 파일을 가져와 pdb4amber에서 cleaning을 하던 중 제멋대로 110번 HIS를 HIE로 인식하고

에러를 뱉어낸 모습이다.

원래 알아서 다 해준다는데.. 어쩔 수 없이 수동으로 위치를 조정해주어야 했다.



4. HIE를 시뮬레이션에서 나타내면 이런 모양을 띤다.

(powered by Maestro)

오른쪽 빨간색 동그라미가 산소, carboxylic acid 방향, 즉 C-terminal 방향이고

그 왼쪽의 파란색 동그라미가 질소, 그래서 N-terminal이다.

그 사이에 수소(흰색 동그라미)를 달고 있는 탄소가 alpha carbon,

거기서부터 세어나갈 때 beta(carbon), gamma(carbon), 

우측 delta(nitrogen), 좌측 epsilon(nitrogen)까지 확인할 수 있어서

이 residue는 HID가 아니라 HIE라는걸 볼 수 있다.

+a : 참고로 이 histidine에는 chirality가 없다. 쉽게 생각해도 된다.

(powered by Maestro)

한편 요 히스티딘은 delta nitrogen에 붙어있어 HID인 것을 알 수 있다.



5. 그럼 그 두 개가 다르긴 다른건가? 왜 구분했지?

이는 hydrogen이 어디에 붙었느냐에 따라 파라미터가 달라지기 때문이다.

실제로 저 HID의 파일 구조를 보면 다음과 같다.

<
...
ATOM   1736  OE2 GLU   109     -22.741 -12.827  22.328  1.00  0.00           O  
ATOM   1737  C   GLU   109     -19.755  -9.187  25.344  1.00  0.00           C  
ATOM   1738  O   GLU   109     -20.752  -8.600  24.940  1.00  0.00           O  
ATOM   1739  N   HID   110     -19.151  -8.916  26.506  1.00  0.00           N  
ATOM   1740  H   HID   110     -18.466  -9.533  26.943  1.00  0.00           H  
ATOM   1741  CA  HID   110     -19.425  -7.677  27.276  1.00  0.00           C  
ATOM   1742  HA  HID   110     -19.596  -6.920  26.511  1.00  0.00           H  
ATOM   1743  CB  HID   110     -20.667  -7.821  28.151  1.00  0.00           C  
ATOM   1744  HB2 HID   110     -20.572  -8.725  28.753  1.00  0.00           H  
ATOM   1745  HB3 HID   110     -20.711  -6.980  28.843  1.00  0.00           H  
ATOM   1746  CG  HID   110     -21.960  -7.884  27.376  1.00  0.00           C  
ATOM   1747  ND1 HID   110     -22.596  -9.046  27.117  1.00  0.00           N  
ATOM   1748  HD1 HID   110     -22.279  -9.969  27.414  1.00  0.00           H  
ATOM   1749  CE1 HID   110     -23.714  -8.799  26.406  1.00  0.00           C  
ATOM   1750  HE1 HID   110     -24.422  -9.537  26.060  1.00  0.00           H  
ATOM   1751  NE2 HID   110     -23.792  -7.477  26.204  1.00  0.00           N  
ATOM   1752  CD2 HID   110     -22.719  -6.881  26.781  1.00  0.00           C  
ATOM   1753  HD2 HID   110     -22.495  -5.824  26.779  1.00  0.00           H  
ATOM   1754  C   HID   110     -18.266  -7.182  28.115  1.00  0.00           C  
ATOM   1755  O   HID   110     -18.467  -6.341  29.001  1.00  0.00           O  
ATOM   1756  N   LYS   111     -17.049  -7.657  27.819  1.00  0.00           N  
ATOM   1757  H   LYS   111     -16.871  -8.306  27.052  1.00  0.00           H 
...
>

4번째 열(column)이 HID인 점을 주목하라.

해당 단백질은 HIE도 가지고 있다. 아래처럼 140번째 아미노산이 또한 히스티딘이다.

<
...
ATOM   2236  C   VAL   139     -22.341 -32.938  42.156  1.00  0.00           C  
ATOM   2237  O   VAL   139     -22.630 -33.834  41.395  1.00  0.00           O  
ATOM   2238  N   HIE   140     -22.141 -31.690  41.750  1.00  0.00           N  
ATOM   2239  H   HIE   140     -21.767 -30.955  42.350  1.00  0.00           H  
ATOM   2240  CA  HIE   140     -22.445 -31.249  40.381  1.00  0.00           C  
ATOM   2241  HA  HIE   140     -23.490 -31.511  40.214  1.00  0.00           H  
ATOM   2242  CB  HIE   140     -22.240 -29.752  40.241  1.00  0.00           C  
ATOM   2243  HB2 HIE   140     -22.710 -29.249  41.086  1.00  0.00           H  
ATOM   2244  HB3 HIE   140     -21.173 -29.533  40.294  1.00  0.00           H  
ATOM   2245  CG  HIE   140     -22.795 -29.183  38.960  1.00  0.00           C  
ATOM   2246  ND1 HIE   140     -22.181 -29.339  37.760  1.00  0.00           N  
ATOM   2247  CE1 HIE   140     -22.908 -28.734  36.802  1.00  0.00           C  
ATOM   2248  HE1 HIE   140     -22.668 -28.697  35.750  1.00  0.00           H  
ATOM   2249  NE2 HIE   140     -23.985 -28.185  37.387  1.00  0.00           N  
ATOM   2250  HE2 HIE   140     -24.716 -27.659  36.908  1.00  0.00           H  
ATOM   2251  CD2 HIE   140     -23.944 -28.443  38.718  1.00  0.00           C  
ATOM   2252  HD2 HIE   140     -24.671 -28.131  39.453  1.00  0.00           H  
ATOM   2253  C   HIE   140     -21.630 -31.937  39.346  1.00  0.00           C  
ATOM   2254  O   HIE   140     -22.174 -32.421  38.362  1.00  0.00           O  
ATOM   2255  N   ARG   141     -20.314 -31.938  39.554  1.00  0.00           N  
ATOM   2256  H   ARG   141     -19.895 -31.485  40.366  1.00  0.00           H 
...
>

눈치가 좀 있다면 알아챌 수 있다.

3번째 열의 atom type에 H가 여러 종류로 표현되고 있다는 점을.

자세히 살펴보면 HA, HB, HD 등이 있다. 이는 alpha carbon에 달린 H, beta carbon에 달린 H,

마지막으로 delta carbon에 달린 H 등을 나타내고 있다.

또한 뒤에 붙은 숫자는 (위의 HID 사진을 기준으로 설명하자면)

delta 위치에 붙은 hydrogen은 총 두 개, 하나는 C에, 하나는 N에 붙어있다보니

그 둘을 분리하기 위해 숫자를 붙인 것에 불과하다.



그래서 HID에선 N에 붙을 HE2가 존재할 수 없고

마찬가지로 HIE에선 delta 위치에 붙을 HD1이 존재할 수 없는 것이다.

그래서 까탈스럽고 짜증나는 영리한 Amber가 에러를 뱉었던 것.



이걸로 에러를 해결했다.

댓글 없음:

댓글 쓰기