(HIS의 자태. 출처 : 링크)
1. PDB(Protein Data Bank) files 내의 histidine은 실제로 아래 세 가지 모양 중 하나로 표현된다.
HID : 히스티딘의 수소가 delta nitrogen에 붙은 것
HIE : 히스티딘의 수소가 epsilon nitrogen에 붙은 것
HIP : 히스티딘의 수소가 두 nitrogen에 모두 붙어 positive charge를 띠는 것.
pH에 따라 히스티딘의 잔기는 protonated 될 수도, neutralized 될 수도,
혹은 negative charge를 띠게 될 수도 있다.
위의 사진에서도 알 수 있듯이 histidine의 functional group의 pK_R은 6.0이다.
일반적으로 생리식염수가 pH 7.4 정도 된다는 점을 감안하면
HIP는 존재하기 힘들고, 주로 HID나 HIE 중 한 가지 형태로 나타나게 된다.
(Amber와 CHARMM에서 atom type의 이름이 다를 수 있다. 참고하자.
출처 : 링크)
2. 이거 말고도 Amber에선 아래 표와 같이 여러 상황에 따라
residue의 이름을 다르게 명명하고 있다.
Aspartic acid, cysteine, glutamic acid, histidine같은 잔기들은 pH에 따라 다르다보니
MD에서 명시해줄 필요가 있는 것이다.
(출처 : 링크)
3. 이걸 찾게 된 경위는 사실 Amber package에서 뱉어낸 오류 때문이었다.
<
Created a new atom named: HD1 within residue: .R
...
FATAL: Atom .R
Failed to generate parameters
Parameter file was not saved.
>
PDB 파일을 가져와 pdb4amber에서 cleaning을 하던 중 제멋대로 110번 HIS를 HIE로 인식하고
에러를 뱉어낸 모습이다.
원래 알아서 다 해준다는데.. 어쩔 수 없이 수동으로 위치를 조정해주어야 했다.
4. HIE를 시뮬레이션에서 나타내면 이런 모양을 띤다.
(powered by Maestro)
오른쪽 빨간색 동그라미가 산소, carboxylic acid 방향, 즉 C-terminal 방향이고
그 왼쪽의 파란색 동그라미가 질소, 그래서 N-terminal이다.
그 사이에 수소(흰색 동그라미)를 달고 있는 탄소가 alpha carbon,
거기서부터 세어나갈 때 beta(carbon), gamma(carbon),
우측 delta(nitrogen), 좌측 epsilon(nitrogen)까지 확인할 수 있어서
이 residue는 HID가 아니라 HIE라는걸 볼 수 있다.
+a : 참고로 이 histidine에는 chirality가 없다. 쉽게 생각해도 된다.
(powered by Maestro)
한편 요 히스티딘은 delta nitrogen에 붙어있어 HID인 것을 알 수 있다.
5. 그럼 그 두 개가 다르긴 다른건가? 왜 구분했지?
이는 hydrogen이 어디에 붙었느냐에 따라 파라미터가 달라지기 때문이다.
실제로 저 HID의 파일 구조를 보면 다음과 같다.
<
...
ATOM 1736 OE2 GLU 109 -22.741 -12.827 22.328 1.00 0.00 O
ATOM 1737 C GLU 109 -19.755 -9.187 25.344 1.00 0.00 C
ATOM 1738 O GLU 109 -20.752 -8.600 24.940 1.00 0.00 O
ATOM 1739 N HID 110 -19.151 -8.916 26.506 1.00 0.00 N
ATOM 1740 H HID 110 -18.466 -9.533 26.943 1.00 0.00 H
ATOM 1741 CA HID 110 -19.425 -7.677 27.276 1.00 0.00 C
ATOM 1742 HA HID 110 -19.596 -6.920 26.511 1.00 0.00 H
ATOM 1743 CB HID 110 -20.667 -7.821 28.151 1.00 0.00 C
ATOM 1744 HB2 HID 110 -20.572 -8.725 28.753 1.00 0.00 H
ATOM 1745 HB3 HID 110 -20.711 -6.980 28.843 1.00 0.00 H
ATOM 1746 CG HID 110 -21.960 -7.884 27.376 1.00 0.00 C
ATOM 1747 ND1 HID 110 -22.596 -9.046 27.117 1.00 0.00 N
ATOM 1748 HD1 HID 110 -22.279 -9.969 27.414 1.00 0.00 H
ATOM 1749 CE1 HID 110 -23.714 -8.799 26.406 1.00 0.00 C
ATOM 1750 HE1 HID 110 -24.422 -9.537 26.060 1.00 0.00 H
ATOM 1751 NE2 HID 110 -23.792 -7.477 26.204 1.00 0.00 N
ATOM 1752 CD2 HID 110 -22.719 -6.881 26.781 1.00 0.00 C
ATOM 1753 HD2 HID 110 -22.495 -5.824 26.779 1.00 0.00 H
ATOM 1754 C HID 110 -18.266 -7.182 28.115 1.00 0.00 C
ATOM 1755 O HID 110 -18.467 -6.341 29.001 1.00 0.00 O
ATOM 1756 N LYS 111 -17.049 -7.657 27.819 1.00 0.00 N
ATOM 1757 H LYS 111 -16.871 -8.306 27.052 1.00 0.00 H
...
>
4번째 열(column)이 HID인 점을 주목하라.
해당 단백질은 HIE도 가지고 있다. 아래처럼 140번째 아미노산이 또한 히스티딘이다.
<
...
ATOM 2236 C VAL 139 -22.341 -32.938 42.156 1.00 0.00 C
ATOM 2237 O VAL 139 -22.630 -33.834 41.395 1.00 0.00 O
ATOM 2238 N HIE 140 -22.141 -31.690 41.750 1.00 0.00 N
ATOM 2239 H HIE 140 -21.767 -30.955 42.350 1.00 0.00 H
ATOM 2240 CA HIE 140 -22.445 -31.249 40.381 1.00 0.00 C
ATOM 2241 HA HIE 140 -23.490 -31.511 40.214 1.00 0.00 H
ATOM 2242 CB HIE 140 -22.240 -29.752 40.241 1.00 0.00 C
ATOM 2243 HB2 HIE 140 -22.710 -29.249 41.086 1.00 0.00 H
ATOM 2244 HB3 HIE 140 -21.173 -29.533 40.294 1.00 0.00 H
ATOM 2245 CG HIE 140 -22.795 -29.183 38.960 1.00 0.00 C
ATOM 2246 ND1 HIE 140 -22.181 -29.339 37.760 1.00 0.00 N
ATOM 2247 CE1 HIE 140 -22.908 -28.734 36.802 1.00 0.00 C
ATOM 2248 HE1 HIE 140 -22.668 -28.697 35.750 1.00 0.00 H
ATOM 2249 NE2 HIE 140 -23.985 -28.185 37.387 1.00 0.00 N
ATOM 2250 HE2 HIE 140 -24.716 -27.659 36.908 1.00 0.00 H
ATOM 2251 CD2 HIE 140 -23.944 -28.443 38.718 1.00 0.00 C
ATOM 2252 HD2 HIE 140 -24.671 -28.131 39.453 1.00 0.00 H
ATOM 2253 C HIE 140 -21.630 -31.937 39.346 1.00 0.00 C
ATOM 2254 O HIE 140 -22.174 -32.421 38.362 1.00 0.00 O
ATOM 2255 N ARG 141 -20.314 -31.938 39.554 1.00 0.00 N
ATOM 2256 H ARG 141 -19.895 -31.485 40.366 1.00 0.00 H
>
눈치가 좀 있다면 알아챌 수 있다.
3번째 열의 atom type에 H가 여러 종류로 표현되고 있다는 점을.
자세히 살펴보면 HA, HB, HD 등이 있다. 이는 alpha carbon에 달린 H, beta carbon에 달린 H,
마지막으로 delta carbon에 달린 H 등을 나타내고 있다.
또한 뒤에 붙은 숫자는 (위의 HID 사진을 기준으로 설명하자면)
delta 위치에 붙은 hydrogen은 총 두 개, 하나는 C에, 하나는 N에 붙어있다보니
그 둘을 분리하기 위해 숫자를 붙인 것에 불과하다.
그래서 HID에선 N에 붙을 HE2가 존재할 수 없고
마찬가지로 HIE에선 delta 위치에 붙을 HD1이 존재할 수 없는 것이다.
그래서
이걸로 에러를 해결했다.