0.
아미노산의 pKa
Amino acid는 단량체로 존재할 때 alpha carboxy group과 alpha amino group, 그리고
side chain을 가지고 있다. Tyrosine을 예로
들어보면, pH가 7일 때에 amino group이 protonated state가 되어 양전하를
띤다. 하지만 carboxy group은 음전하를 띠고 있어서
전체 전하는 0이 된다.
여기에서 주변 pH가 2.2보다
낮아지게 되면 주변의 수소 이온이 많아져서 carboxy group이 수소화(protonated)되며, pH가 9.1보다
높아지면 amino group의 수소가 떨어(deprotonated)진다. 여기에서 tyrosine같은 경우엔 side chain에 hydroxyl group이 있어서 한 번 더
수소를 내놓을 수 있게 되는데, 이로 인해서 net charge가
-2까지 가능하다.
1.
아미노산별 pKa
(출처 – leah4sci.com)
아미노산 중에서 side chain이 pKa 값을 가지고 있는 것은 총 6 종류이다.
Cysteine, tyrosine, aspartic acid, glutamic
acid, lysine, arginine, histidine.
이들을 구조별로 다시 보면 아래의 사진과 같다.
2.
AMBER molecular dynamics (MD)에서
residue의 표현
Tautomeric이나 protonation
states는 PDB 파일에 렌더링되지 않는다. 잔기에
대해 엄밀히 정의된 상태가 요구되는 경우엔 PDB 파일 내에서 해당 residue의
이름에 반영되어 있어야 한다. 만약 수동으로 PDB 파일
내의 residue name을 바꾸고자 한다면 모든 원자에 대해 변경을 실행해야 한다.
AMBER의 LEaP으로
생성된 PDB 파일의 경우에는 특별한 residue name을
사용하는 경우가 있다. 대표적으로 HIE, HIP, CYX 등이
있는데, 이 명칭들은 AMBER에서 사용하는 res name일 뿐, 다른 소프트웨어에서는 에러를 초래할 수 있으므로
주의해야 한다. AMBER에서 사용하던 res name을
타 소프트웨어에서도 사용할 수 있도록 만들고 싶다면 ambpdb 프로그램에서 “-bres” 옵션을 줘서 사용하면 된다.
Residue name에는 몇몇 독특한 규칙을 가진 녀석들이 있다. 이는 해당 잔기들이 가지고 있는 side chain 때문이다. 아래에서는 해당 아미노산들이 어떤 특징을 가지고 있고, 특징별로
어떻게 명명되는지를 살펴본다.
l Histidine
히스티딘은 델타(δ), 입실론(ε), protonated의 세 가지 폼(form)으로 존재할 수
있다. 이는 이전 포스팅으로 설명을 대체한다. 최신 버전의 LEaP에서는 ε-히스티딘
형태가 기본값으로 설정되어 있다. 따라서 PDB 파일에 “HIS”라고 적힌 residue는 자동으로 LEaP에서 “HIE”(ε-히스티딘)이라는
이름으로 변경된다. PDB 파일에서 “HID”라는 이름으로
명시가 되어있을 경우에는 LEaP에서 똑같이 “HID”를
사용하고, 만약 PDB 파일이 이미 protonated form을 갖고 있다면 “HIP”가 된다.
정리하자면 다음과 같다:
HIE: 기본값, ε-히스티딘
HID: δ-히스티딘
HIP: Protonated
form
l Cysteine
시스테인은 free form, disulfide bridge의 일부분으로서
시스테인과 free form으로서, 이렇게 두 상태로만 존재할
수 있다. 단백질에서 시스테인의 역할은 매우 중요한데, 이는
시스테인의 잔기가 -SH여서 또다른 시스테인과 -S-S- (이황화) 결합을 할 수 있다는 특징 때문이다.
PDB에서 “CYS”로
이름 지어진 residues들은 자동으로 free form의
시스테인으로 변환된다. 여기에서 중요한 점이 있는데, 만약
이 시스테인이 S-S bridge를 이루고 있는 시스테인이라면,
PDB 파일에서 반드시 “CYX”라고 명명해주어야 한다. 이 과정은 AMBER에서 자동적으로 이루어지지 않기 때문에 사용자가
“CYX”라고 적어주어야 해당 residue에 수소가 첨가되는
불상사를 막을 수 있다.
l Asp, Glu, Lys
간혹 전하를 띤 상태로 존재하는 “ASP” (aspartate), “GLU”
(glutamate), “LYS” (lysine)가 그것들의 uncharged form으로
사용되는 경우들이 발생하는데, 이는 “ASH”, “GLH”,
“LYN”으로 바꿔서 사용하면 된다. 위의 사진은 ASP와
GLU가 ASH 및 GLH로
바뀌는 이유를 보여준다. 둘 다 protonated 되어야
uncharged되는 반면에, LYS는 deprotonated 되어야만 전하가 사라진다. 그래서 LYS만 LYH가 아니라 LYN
(no? nothing? none?)이 된다. 아르기닌(arginine)은
AMBER에서 딱히 다루지 않는데, 이는 arginine의 pKa가 12에
육박하기 때문에 거의 항상 protonated 되어있을 것으로 예측되기 때문이다.
l ACE, NHE, NME
Amino acid는 아니지만, N-말단과
C-말단에서 뚜껑 역할을 하는 residue가 neutralized 형태로 사용되는 것은 적절하지 않기에 특별히 이 부분에서 사용하는 res name이 명명되어 있다. ACE는 N-말단에서, NHE와 NME는
C-말단에서 사용된다. 자세한 내용은 Amber manuals를 참조하면
된다.