5. 结构生物学实验技术

1. 准备蛋白样品，浓度为0.3~0.5 mg/mL，蛋白所在缓冲液为磷酸盐缓冲液；

2. 圆二色谱仪开机后需要充氮气约30 min，再打开疝气灯。设置扫描波长范围：180 nm~260 nm，重复2次。

3. 先检测仪器稳定性，直接扫描空气，得到一个范围在0.1附近的直线为正常，在检测蛋白圆二色谱曲线前分别检测对应的缓冲液曲线（应该是一条直线）；

4. 检测样品二级结构折叠情况：吸取200 μL蛋白样品至规格为1 mm厚度的比色皿中，透光观察避免气泡，温度为20 °C，扫描后可得到曲线；

5. 检测蛋白质热变性：需要开启冷循环控制器。吸取200 μL蛋白样品至规格为1 mm厚度的比色皿中，透光观察避免气泡，将温度探测针插入样品中，温度范围是20 °C~95 °C，每隔5 °C检测一次，每次检测重复2次。根据蛋白初始二级结构光谱曲线取220 nm或者222 nm处的数据用GraphPad Prism 5.0做图，拟合并计算Tm。

附：数据处理与结果

验证Mobiluncus curtisii CAMP-NTD的二级结构及其热稳定性。

1. NTD的圆二色谱：经如上实验步骤获得实验数据，导入Prism中作曲线图，得如下结果，为规则的α-螺旋：

2. NTD的热变性曲线：选取EXCEL数据表中222 nm处的数值（为不同温度在222 nm扫描得到的数值）导入Prism中作曲线图，得到如下结果：

3. Tm值的计算：

4. Fit后的结果，如下图：

1. 样品必须保持一定的纯度不含光吸收的杂质，溶剂必须在测定波长没有吸收干扰；样品能完全溶解在溶剂中, 形成均一透明的溶液；

样品要求：

2. 氮气流量的控制，实验中途要时刻关注氮气是否充足，如不充足需及时更换氮气瓶；

3. 缓冲液、溶剂要求与池子选择：缓冲液和溶剂在配制溶液前要做单独的检查，看是否在测定波长范围内有吸收干扰，看是否形成沉淀和胶状；在蛋白质测量中，经常选择透明性极好的磷酸盐作为缓冲体系；

4. 样品浓度一般在0.05~0.5 mg/mL，浓度太高噪音太大会影响结果；

5. 样品不同，测定的圆二色光谱范围不同，对池子大小（光径）的选择和浓度的要求也不一样；蛋白质CD光谱测量一般在相对较稀的溶液中进行；

6. 保持石英杯干净透亮，通常完成蛋白热变性检测后石英杯内部会有蛋白质粘物，需要用清洗剂浸泡30分钟，再用清水冲洗干净；

7. 用去垢剂洗完石英杯后，需要用70% 酒精进一步清洗。

5.2 小角散射

X光散射技术是常用的非破坏性分析技术，可用于揭示物质的结构、化学组成以及物理性质。这些技术是以观测X射线穿过样品后的散射强度为基础，根据散射角度、极化度和入射X光波长对实验结果进行分析。

散射包括弹性散射和非弹性散射，弹性散射包括小角X射线散射（SAXS）、广角X射线散射（WAXS）；非弹性散射包括康普顿散射、共振非弹性X射线散射及X射线拉曼散射。SAXS主要测量散射角2θ接近0° 时的经过样品后的X射线散射强度，而WAXS是测量散射角2θ大于5°。

在原理上散射振幅等于电子密度的傅立叶变换乘以一个角度相关的因子。假设样品有很多一样的颗粒组成，每个颗粒里面的电子密度以ρ(r)表示，最大的维度为Dmax，那么总的散射强度可以写成球坐标形式：，其中γ(r)是密度的自相关函数的球形平均值（同一个长度，不同方向的平均）。I(s)的极限即为Guinier公式，也就是ln[I(s)] vs s2，这个极限公式在s<的范围内适用，Rg为回旋半径。

SAXS的优点：对样品的要求很低，溶液样品即可，对分子量和浓度没有要求。由于SAXS在溶液中进行，因此更好地反应生物大分子的真实状态，对原位研究动态过程提供了可能性。

SAXS的缺点：得到的信息量很少，要得到三维结构的信息很困难，只能得到一些比较粗略且低分辨率的信息，如生物大分子的大小、形状、某些关键的片段、各个组分之间的空间关系等。对于SAXS来说，分子越大实验越容易，这一点和晶体学正好相反。

SAXS数据分析先用RAW软件:

（可以从http://www.macchess.cornell.edu/MacCHESS/RAW_install.html免费下载软件并根据说明进行安装）来进行data reduction之后，一般用ATSAS软件包，里面包括很多小软件，根据不同的需要选择合适的软件。求解大体形状时可以用gnom、damin、gasbor等软件；如果是重建柔性区域可以用credo、corel、crysol等软件；如果是复合物结构重建则需要用massha、sasref、crysol等软件。

每一种软件都可以在 https://www.embl-hamburg.de/biosaxs/software.html 上活得对应的 manual 。

材料（MATERIALS）

试剂（REAGENTS）

60 μL 高纯度蛋白样品（浓度在 1~10 mg/mL 范围内、根据分子量、分子量越小浓度需要高一些、分子量越大浓度需要低一些），如果是胞内蛋白可以加 2~10 mM DTT 作为 radiation damage 保护剂。

10 mL严格对应的buffer

器械（EQUIPMENT）

同步辐射加速器19U2线站

实验步骤（PROCEDURE）

Data reduction

1. 将蛋白在1~10 mg/mL之间用对应的buffer稀释三种梯度，并放在线站内的样品托盘上。

2. 在线站的软件上设置样品的名称，收集顺序以及保存路径。

关键步骤：这里需要注意的是，该软件是在linux环境下工作的，因此在样品名称中不得出现空格和/等符号，如果一定要用分割则用“_”下划线符号。还有，如果是在新的文件夹中开始收集，在Next tube No.上填写“1”，如果是在原来的路径中继续收集的话千万不要更改，不然同一个序号的数据后者会覆盖前者，这就意味着之前收集的数据需要重新收。

3. 打开光源，并点击“run”，开始收集数据，在线站的ALBRA软件上检查detector收集的散射光图片是否正常，如果是圆形的光斑那就是正常的，如果边缘上有刺头那说明光路有问题，需要找线站的工作人员重新调整光路。

4. 收集好的数据传到线站中的另一台Windows电脑上，此电脑上已经安装好了RAW、ATSAS等分析软件。每一次收数据之前，线站的工作人员会帮我们调整好光路和设置，并保存一个cfg文件，打开RAW，先将路径调整至cfg文件所在的位置，并双击该文件，这样才可以导入当天的参数。

5. 然后将文件过滤成tif文件，每一个样品我们一般收集20张数据，选择某一个样品的20个数据，点击“plot”，此时旁边的窗口会显示20个曲线并且正常情况下会几乎重叠在一起，如果没有，将不重叠的那些数据删除，剩余的数据选择后点击“average”。平均出来的数据我们需要自行保存。

6. 一般每一个样品前后都会测对应的buffer，因此可以选择前面或者后面紧挨着的数据作为该样品的背景并扣除。将样品和buffer都进行平均后，在buffer数据旁边点亮“★”，并选择样品，点击“substract”。此时得到的数据是将背景扣除后的样品纯粹的信息。同样，substract后的数据也需要保存，一般文章中提供的原始数据都是从substract开始展示，并且后面的一系列分析也都是基于这个原始数据来进行的。因此这一步要做好，不然后面的分析都不可信。

7. substract后的数据可以用记事本打开，里面的数据可以用prism去重新绘图。

Data analysis

1. 打开ATSAS软件中的“SAS Data Analysis”，将通过data reduction得到的substract数据拖到界面中。

2. 一般比较三种浓度梯度的信号强度，保证s小的地方信号没有过度的条件下s大的地方信号尽可能少的波动。如果数据从头到尾都是信号很强的状态，那么这种数据偏artifitial。如果三种浓度梯度信号没有一个能满足这个条件，可以将高浓度的尾部和低浓度的头部进行merge，方法是通过软件中的“processing”中的“scale”将高低浓度的数据进行拟合，使两个数据在某一点有重叠，再点击“merge”，这时软件会自动生成一个新的数据，而这数据可以用来后面的进一步分析。

3. 初步分析，一般需要看样品的回旋半径是否是浓度依赖的？Dmax是不是浓度依赖的？

1. 因为回旋半径就跟蛋白的等电点一样是样品的固有属性，原则上它不可能随着样品的浓度的变化而变化。Dmax是样品的最大直径，如果溶液中的样品是一个均匀的介质，那么这个也不会是浓度依赖的。如果Dmax随着浓度高而变大，那么极有可能是样品有很强的聚集能力，这种情况下我们只能用低浓度的数据。这里放一张回旋半径和对样的分子量的表格，回旋半径和分子量是呈正比的，分子量越大回旋半径也越大。回旋半径可以通过软件中的“radius of gyration”即回旋半径，来进行计算，这里用到的是guinier公式，因此需要满足，并且需要让实际的样品曲线尽量和拟合后的线性曲线重叠。同时也要保证绿色的曲线的上下分布是均匀的，避免多数在上面或者下面。

2. 下面是Dmax的计算，点击“distance distribution”，会出现如下图。我们需要关注的是p(r) vs r曲线的尾部需要平缓地往下走，如果是很陡的那种需要人为地在range中改变包括的点的数目来变化。上面的quality是表征这套数据的质量的标准，当然，这个数值越高越好，但我们更多还是要看圆圈中的图形。点的数目不需要太多，如果好的数据可以留很多点，但如果s很大的地方噪音很高的话，可以只留400~500个点，即到s在0.2左右的数据也是可以的。点击“finish”后会提醒保存数据，保存后可以用记事本打开，将里面的数据用prism重新画图。

Modeling

1. 做完初级分析后，后面完全是根据实验目的来选择特定的软件，在SAS Data Analysis中已经整合了dammif、crysol、oligomer、Bodies等常用的软件。其他的软件全部都可以在ATSAS软件包中能找到，不同的软件在Embl-hamburg网站上都能找到manual，因此这里用dammif来介绍如何建模。

2. 点击“dammif”，选择“manual”，在计算Rg中选择合适的点，在Dmax上参考第11步，也可以在前面把数据记下来，直接在这里输入，点击“next”，直到最后界面上。如果直到该样品的对称性可以选择，如果不知道默认是P1对称性。在anisometry上可以选择是球形还是长棍形，以及在angular scale上可以选择是nanometer还是angstrom级别的，默认都是unknown。在mode上可以选择fast或者slow，区别是计算时间上fast更快，并且模型中球的数量更少，但轮廓更明显。如果是slow模式的话，计算时间很长，模型中球的数量更多，轮廓不明显。在repetition上可以选择计算的轮数，可以自定义计算几轮，每一轮的计算产生一个模型，最后通过damaver和dammin进行refine后可以通过RMS比较来选择最优的值。

针对性建议（TROUBLESHOOTING）

1. 首先要明确实验目的，小角散射不像晶体衍射能解释到原子层次上，不同的目的需要用到的软件也是不一样的，如果只是为了凑数据，那么我还是建议大家把更多的心思放在长晶体上，不要觉得小角散射是个投机取巧的捷径。大部分情况下，小分子（小于80 kD）且单体蛋白不适合做小角散射，前面也提到了蛋白越大越好，当然也不能是aggregate。如果是有规则的多聚体，那么可以用WAXS。

2. 其次，小角散射一般是辅助型实验，比较适合与晶体结构或者NMR联用，如果只是单纯SAXS数据因为其分辨率很低的因素，无法得到具体的结果，但有一点需要强调的是，它是检测蛋白在溶液中的构象的很方便的手段。因为同是溶液样品，NMR只能用在很小的样品，而SAXS在这一点没有什么限制。

3. 如果只要确定蛋白的形状，可以只去前面的数据，不需要取那么多数据。

5.3 负染

负染就是用重金属盐（如磷钨酸、醋酸双氧铀）对铺展在载网上的样品进行染色；吸去染料，样品干燥后，样品凹陷处铺了一薄层重金属盐，而凸的出地方则没有染料沉积，从而出现负染效果。可以显示生物大分子、细菌、病毒、分离的细胞器以及蛋白质晶体等样品的形状、结构、大小以及表面结构的特征。

器械（EQUIPMENT） Gaten plasma systern、铜网、精细镊子、格式化的U盘、Tecnai G2120kv电镜

试剂（REAGENTS）

2%或者3%醋酸铀

一、 Tecnai G2120kv电镜基本操作步骤

1. 准备步骤

向冷阱中加液氮，如右图所示：电镜在在使用之前需要提前冷却，冷阱冷却镜桶大概需要1小时以上。

（1）进入电镜控制系统（操作者需要进入自己的User账户），检查电脑屏幕右下角托盘中如右图图标是否为绿色（），按顺序启动，按顺序启动TUI（Tecnai User Interface）和TIA（TEM Image and Analysis）系统。

（2）升高压，点High Tesion，将高压升至120 kv。

（3）开灯丝，点Filament（注：当长时间离开时，需关闭灯丝）。

2. 准备样品

常规常温样品准备

（1）制备带有样品的铜网。

用Gatan plasma system等离子清洗机处理铜网，氢气氧气处理10秒。

将自锁镊子夹住铜网，正面朝上，加5 μL样品，静置1 min吸附。用滤纸边缘吸去多余样品，加5 μL醋酸铀，静置1 min染色。用滤纸边缘吸去多余染液，灯下烤干15 min以上。

注：样品多且对温度不敏感时，可在封口膜上多个样品同时操作。样品可保存一周。

（2）按下图将样品铜网固定在样品杆上。

（3）取出下图红色箭头处的工具。

（4）使用该工具将样品杆末端的弹簧夹掀起，用镊子把样品铜网放入样品。

注：铜网插入电镜前，必须完全干燥。

3. 插入样品杆

常温常规样品杆

（1）设置抽真空时间：Vacuum>setting>pumping time>120 s

（2）检查镜筒阀是否关闭，黄色（Col.Valves Closed）表示关闭。Setup>Col.Valves Closed

（3）将样品末端的细小针尖（下图中红色箭头所示位置）对准样品台上的细缝（五点钟位置），插入样品杆。预抽循环将会自动开始，请等待直至样品台上红色指示灯熄灭。下图箭头所示红灯熄灭后，将样品杆逆时针旋转至少十二点钟位置，然后小心缓缓将样品放入。

（4）检查设置页中镜筒真空读数,即Column值是否为20以下，若在20以下，即可打开镜筒阀，点击“Col.Valves Closed”按钮，此时V4和V7阀会被打开，即可开始观察样品。

4. 电镜基础调节

（1）Eucentric Focus

做alignment前，必须按下Eucentric Focus，如下图所示：用Intensity改变光斑大小的时候，最好顺时照明（即顺时扩大光斑）

（2）调节Z-high，使样品位于Eucentric height

寻找样品中一特定物体作为参照物，激活Alpha Wobbler，样品台正负15°摆动，调节Z轴按钮使荧光屏上的目标物近似不动，如下图所示：

（3）Gun tilt

激活Direct alignment中的gun tilt 功能后，用Multifunction X/Y旋钮将荧光屏上的电流值（screen current）调到最大，肉眼观察是调至光斑最亮时。

（4）C2聚光镜光栏对中及象散矫正

A. 聚光镜光栏居中，插入聚光镜光栏（一般生物样品用3号光栏），

Intensity逆时针聚拢电子束，Beam Shift移光到中心，顺时散开电子束，若光斑与荧光屏不是同心相切，则调节C2光栏上的X/Y（如下图所示）旋钮使光斑同心相切。

重复以上步骤，保证光束于最小和最大状态下都位于荧光屏中心。

B. C2聚光镜象散矫正

若光斑呈椭圆形，则说明C2聚光镜有象散，需要矫正选择Stigmator功能（如下图），点Condenser。

如下图，使用面板中的多功能按钮，调节X和Y方向上的象散校正线圈的强度，使光束变圆并且能够同心散开。

C. 点击调节页中的None按钮，结束象散调节。

（5）Direct alignment

如下图所示，转到用户界面中的调节页，选择直接调节项目。

A. Beam tilt pivot point

依次选择下图中红框内的每一项，使用控制面板上的多功能调节旋钮，使荧光屏中的两束光重合，且颤动最小。

B. Beam shift

选择Beam shift项目，使用多功能调节旋钮，将光束移动至荧光屏中央。

（6）物镜光栏居中及物镜象散矫正

A. 物镜光栏居中

在diffraction模式下插入物镜光栏（一般生物样品用三号光栏），调节物镜光栏上的X/Y旋钮将物镜光栏居中。

B. 物镜象散矫正

在有碳膜区域，稍欠焦状态下，CCD观察，如上图，激活Live FFT,Stigma→objective→MF X/Y将傅立叶环调成圆形。

（7）Gain reference（选做，做ET必须要做的一步）

A. 去除暗电流：

（a）找一个空白区域，光散开。

（b）关掉column。

（c）CCD/TV Camera→Bias gain reference→All Bias。

B. Gain reference

（a）开column。

（b）在空白区域，光散开至整个荧屏。

（c）点击All gain。

C. 检测gain reference的效果

（a）Acquire一张图。

（b）点击TIA软件右边的Auto-Correlation(做的好的状态是只有中间有一个亮点)。

注：做冷冻电镜时，上述的电镜基础调节步骤需要在Exposure模式下做

5. 样品观察

low dose

（1）选定Search、Focus和Exposure所需要的放大倍数及Spot size及所需要的光斑大小。

（2）Search模式与Exposure模式位置对准，找一个明显的样品参照物，在Exposure模式下用样品扭杆将参照物移到视眼中央，在切换到Search模式下，点击low dose→option→search shift,调节MF X/Y，将参照物移到视眼中央。

（3）在Search模式下寻找样品，Focus模式下调节焦距，Exposure模式下拍照。

5.4 冷冻电镜样品制备

在低温下使用透射电子显微镜观察样品的显微技术，就叫做冷冻电子显微镜技术，简称冷冻电镜(cryo-electron microscopy，cryo-EM)。

冷冻电子显微学解析生物大分子及细胞结构的核心是透射电子显微镜成像，其基本过程包括样品制备、透射电子显微镜成像、图像处理及结构解析等几个基本步骤（图1）。在透射电子显微镜成像中，电子枪产生的电子在高压电场中被加速至亚光速并在高真空的显微镜内部运动。根据高速运动的电子在磁场中发生偏转的原理，透射电子显微镜中的一系列电磁透镜对电子进行汇聚，并对穿透样品过程中与样品发生相互作用的电子进行聚焦成像以及放大,最后在记录介质上形成样品放大几千倍至几十万倍的图像，利用计算机对这些放大的图像进行处理分析即可获得样品的精细结构。

样品需求量少：一个冷冻样品只需要3~5 μL 0.1~1 μmol 的蛋白质溶液；更接近生理状态：冷冻电子显微学通过将样品快速冷却至玻璃态冰达到固定生物含水样品的目的，其观察的结构信息基本上反映样品冷却前的瞬时状态；适用研究对象广泛：从细胞、细胞器到分子量在200 kD以上（最近的一些工作报道了分子量在200 kD以下的蛋白质分子的冷冻电镜结构）的大分子复合体。

Vitrobot

1. 加水：用针筒从下面软管注入纯水，大约20~30 mL。

2. 装滤纸：打开机器，装上滤纸，点击Resetblotpaper。Blot污点。

3. 设置参数

（1）Console下设置：温度（一般设置为22 °C），湿度（设为100%）

（2）Options下设置：

A. Miscellaneous：

选上“Use Footpedal”、“ Humidifier Off during Process”、“ Skip Grid Transfer”

B. Process paprameter下设置以下参数：

Blot time（S）：滤纸吸附铜网液体时间

Blot force：滤纸夹铜网的力度

Wait time（S）：吸附前的等待时间

Blot total：滤纸吸附次数

Drain time（S）：Blot后的等待时间

Skip application：跳过加样

4. Ethane Container准备工作

从中间的孔加液氮，充满整个 Ethane Container ，让其冷却。等中间孔中液氮挥发完后再向孔中加少许液氮再次冷却，同时将孔外面液氮加满。等孔中的液氮完全挥发后开始通乙烷，乙烷加八分满。待乙烷固液共存状态时移走导热杆。

注：等孔中液氮完全挥发后开始通乙烷。液氮干净新鲜，液氮罐干燥。

5. 制样

（1）装镊子

镊子夹好铜网后（铜网需事先做glow discharge），装在vitrobot上，让铜网正面朝右，镊子有字一面朝向操作者。踩一下脚踏板，将镊子升上去。

注：铜网要夹紧

（2）将Ethane Container放在操作台上，踩一下脚踏板，将Ethane Container升上去。

（3）打开Humidity，将湿度升到100%后关掉。

（4）踩一下脚踏板，镊子掉下一点，加样品。

（5）踩一下脚踏板，滤纸吸附多余样品→镊子快速掉进乙烷中→Ethane Container降下来

（6）补充液氮，取下镊子。注意不能碰撞铜网，也不能将铜网离开乙烷。

（7）将Ethane Container转移至桌面，松开镊子上的固定圈，将铜网迅速转移到液氮中然后转移至样品盒内。

6. 收尾工作

取出滤纸，镊子用电吹风吹干，将Container中的液氮和乙烷倒掉后放入通风橱风干，退出程序关机，关闭Vitrobot的电源。抽出剩余的纯水。将所有物品归位，登记使用记录。

5.5 蛋白结晶实验

5.5.1 结晶筛选

简介（INSTRUCTION）

蛋白结晶是一个有序化过程：即蛋白质由在溶液中随机状态转变成有规则排列的状态。当蛋白质溶液达到过饱和状态时，能够形成一定大小的晶核，溶液中分子失去自由运动的能量，不断结合到形成的晶核上而长成适合 X 射线衍射的晶体。结晶过程分为两步：首先形成晶核，而后形成晶体。其中形成晶核是一个关键的步骤。以蛋白结晶的相变过程简要介绍结晶的一般方法以及涉及到的关键因素。有4种主要的蛋白结晶方法：（Ⅰ）批量结晶法（Microbatch）；（Ⅱ）气相扩散法（Vapor Diffusion）；（Ⅲ）透析法（Dialysis）；（Ⅳ）自由界面扩散法（Free Interface Diffusion）。尤以气相扩散法最为常用，又细分为悬滴法（Hanging Drop）和坐滴法（图Sitting Drop）。蛋白浓度、沉淀剂浓度、添加剂浓度、pH、温度等都是影响蛋白结晶的关键因素。这里以气相扩散法来说明蛋白结晶的相变过程（图Phase Diagram），假定浓缩的蛋白溶液与母液以一定比例混合后形成的液滴刚开始是澄清的，也就是说蛋白质分子尚处于非饱和状态，由于混合的液滴与下槽的母液都处于封闭环境中，并且母液的浓度要高于液滴的浓度，因此随着时间的延长，借助水蒸气的扩散，液滴的水分会逐渐减少，意味着其中的蛋白质浓度与沉淀剂浓度都会逐渐升高，直到条件变化至Nucleation zone中，晶核形成，随后溶液中的蛋白分子不断自发地结合到形成的晶核上从而长成适合X射线衍射的晶体，即相变至Metastable zone Nucleation zone至Metastable zone 的过程中可以看到液滴中的蛋白浓度是直线下降的。

目的蛋白、结晶板、凡士林、硅化盖玻片等耗材

试剂（REAGENTS）

浓度范围： 5~25 mg/mL ；MBP 融合蛋白尽量浓缩至 30 mg/mL ，甚至50 mg/mL以上。一般水溶性好的蛋白，初始浓度要求高一些。分子量小的蛋白，浓度要求高一些。分子量大的的蛋白，浓度要求低一些。在纯化到目的蛋白之后，点晶体之前，需要对目的蛋白做尽量多的状态评估，以提高实验效率。通常蛋白状态评估常见问题。

（1）蛋白纯度。纯度是结晶性能最重要的前提条件。纯蛋白意味着翻译后修饰不存在异质性，也意味着杂质占总蛋白质的含量较低，如1%。可通过运行一块过载的凝胶电泳来检测蛋白纯度。如果要结晶蛋白-蛋白复合物，在建立结晶前需要进一步纯化，使形成复合物的蛋白从未形成复合物的蛋白中分离。

（2）蛋白折叠。可检测蛋白活性，也可检测蛋白的圆二色谱（CD）来反应蛋白是否正确折叠。

（3）新鲜制备蛋白。蛋白会随着时间降解使混合物变得不均匀。最好在蛋白纯化完成的当天进行结晶实验。

（4）单一的蛋白聚合状态。如仅存在单体或二聚体的任意一种。可将分子筛纯化方法作为蛋白纯化的最后步骤。可使用动态光散射器确定蛋白的聚合状态。

（5）蛋白浓度。

（6）蛋白在室温下是否稳定。是否需要添加一些东西（如盐）。蛋白降解是否迅速。

（7）类似的蛋白是否结晶过？检查PDB并查看头部记录以获得结晶化细节。

2. 选择适当的晶体筛选试剂盒。

市售多种蛋白结晶筛选试剂盒，大多是基于随机法或者不完全因素法（Sparse matrix screen)设计的。最早由McPherson报道，收集了最常见的蛋白结晶条件，把这些因素作随即组合而成。最经典的就是Hampton Research 的Crystal Screen Kit。后来新开发的试剂盒，参考了更多蛋白样本。还有一些有一定针对性的试剂盒，比如针对蛋白复合物的试剂盒，Protein Complex Screen, 由NIAID Peter Sun组设计。Hampton Research公司的Natrix Screen针对核酸蛋白复合物的结晶。TJ-Lab有常见的10多种结晶试剂盒，可以根据需要和样品特性选择。

3. 蛋白样品需要选择适当的缓冲液。

需要对蛋白缓冲液的喜好有一定的了解。比如，缓冲液pH远离蛋白等电点1~2个单位，尽量减少盐或者其他组分（比如甘油）。避开磷酸缓冲液，因为磷酸根容易与钙／镁离子互作，形成盐晶。根据需要是不是需要加还原剂如DTT等。

4. 悬滴法结晶实验的建立，预计消耗时间：2 hr／kit

（1）挑选需要用到的 Crystallization Kits（见附录），按照 Kits条件的顺序，在结晶板（一般 24孔）的盖子上做好编号，每完成一块结晶板的编号，切记将结晶板的盖子与底座做上唯一标记，以防在后续步骤中不同结晶板的盖子与底座混淆。

（2）完成对结晶板的编号与标记后，一一对应地将 Kits 中各条件溶液加入到各孔中，即加入下槽液，下槽液的体积一般为 250~300 μL （如果是优化条件，为方便计算，体积为 500 μL 。

（3）根据目的蛋白的个数或浓度，预先设计好在一块盖玻片上点几个悬滴，确定数目（如 4~6 个），进一步确定悬滴间的位置，在结晶板的盖子上最好画一个盖玻片的示意图，将悬滴间的位置关系在示意图上标记清楚，留意盖玻片正反面视角观察导致的悬滴间位置关系的差异，同时在结晶板的盖子上标记清楚姓名、实验日期、蛋白名称、蛋白浓度等相关信息。

（4）按照设定的顺序，将目的蛋白点在盖玻片上，吸取对应的下槽液与之混合（目的蛋白的滴加量根据浓缩后的体积而定，确保目的蛋白的量是足以点完所有条件的，一般目的蛋白的滴加量为0.2 μL；下槽液的滴加量取决于其与目的蛋白的比例，一般为1：1）。

5. 悬滴混合完成后，将盖玻片盖在对应的孔上，压片时用力适中，确保密封（如果结晶板没有自带封胶，那么需要在加入下槽液之前，在每个孔边缘人工均匀地涂上凡士林等封胶）；

关键步骤：每点完一块板就随即将其移入18 °C恒温箱中，直至点完所有条件。

6. 不同蛋白结晶速度快慢不一，因此观察晶体形成情况的时间也没有规律，一般是在第二天进行第一次观察，将结晶板从恒温箱中取出，在显微镜下逐孔观察，注意观察时尽量迅速，避免光线、温度等外界条件的变化对晶体造成影响。

7. 根据经验，对每孔中结晶情况进行判断，如遇疑似目的蛋白的晶体，将对应的悬滴标记出来，留待进一步确定或冻存（大多数情况下，初步筛选一无所获是很正常的，少数幸运情况下，会观察到晶体或一些疑似晶体的物质，可能存在各种形态，或太密集，或太小，或极不规则等等，此时就需要对结晶条件进行优化）。

8. 观察结束后，将出现疑似晶体的孔的编号记录下来，随即将结晶板放回恒温箱中，对照Kits的说明书及母液管壁上的注释，将记录下来的编号对应的条件挑选出来，并另记于实验本。

9. 根据目的蛋白初筛时出晶的大概时间，对优化的条件进行显微镜观察，如果能够观察到单个晶体，应该尽快将晶体冻存起来，留待衍射。

影响出晶的试剂成分参考

1. 聚合物分子量大小：

不同分子量的聚合物比如PEG，和水作用方式不同，沉淀蛋白能力也不同。一般来说，分子量大的PEG，沉淀效果更强，更容易产生晶核。相反，分子量小的PEG，更不容易让蛋白沉淀和结晶。因此有的蛋白在较低浓度高分子量PEG（比如PEG8000）下能长晶体，但是不能在高浓度低分子量PEG条件下出晶体。另外，低分子量PEG，包括EG，PEG400等，都是很好的防冻剂。在高分子量PEG条件下长的晶体，可以添加20%左右的EG或者PEG400来防冻。根据PEGs的相似性和不同性质，优化晶体的时候，可以尝试不同分子量的PEG，以获得高质量单晶。

2. 盐的种类和选择：

盐的种类很多，对蛋白质结晶的影响也各有不同。总的来说，基本符合Hofmeister定律。电解质溶液的表面张力表现出“特殊离子效应”，表面张力会随着盐溶液浓度的增加而增大，而在浓度增量相同时不同的电解质溶液的表面能增量不相同，这个现象被认为是Franz Hofmeiste效应。从大量实验看，Hofmeister序列离子对溶液的影响在盐浓度高的溶液中较明显，且阴离子的影响要大于阳离子的影响。模拟研究表明，溶剂化能在离子和周围水分子之间的变化是Hofmeiste效应形成机制的基础。Hofmeister序列如下：SCN-<I-<ClO4-<NO3-<Br-<ClO3-<Cl-<BrO3-<F-<SO42-<K+<Na+<<Li+～Ca2+。序列中头几种离子增加溶剂表面张力，降低非极性盐析分子的溶解度（盐析），加强了疏水作用。而最后几种离子增加非极性盐溶分子的溶解度（盐溶），增加水的有序性，降低了疏水作用。盐析效应通常用于蛋白质纯化，利用硫酸铵沉淀。然而，这些盐也直接与蛋白质相互作用（蛋白质带电且具有强偶极矩），甚至可以特异结合（例如磷酸盐和硫酸盐与RNaseA结合）。具有强烈“盐溶”效应的离子，如i-和SCN-是强变性剂，因为它们在肽基团中盐化，因此与未折叠的蛋白质相互作用比与天然蛋白质相互作用更强，它们将去折叠反应的化学平衡转移到未折叠蛋白上。在一个含有多种类型离子的水溶液中，蛋白变性更加复杂。

实验前确保蛋白样品比较均一。高速离心去除蛋白沉淀，提高蛋白均一性。

5.5.2 结晶条件优化

简介（INSTRUCTION）

利用晶体学方法获取蛋白结构往往需要付出极大的辛苦，因为很多情况下，获得高质量的晶体是很困难的，大多数时候没有晶体或者只有低质量的晶体，例如出现孪晶、晶体太小、晶体

衍射等等。以下是一些常见关于晶体优化等相关内容。

如果只能得到微晶，那么可以通过改变结晶条件：沉淀剂浓度、pH（有时，0.1 pH单位的改变足以影响出晶）、蛋白浓度（提高液滴中蛋白质的比例可以提高蛋白终浓度）、温度（如果需要4度结晶，可在结晶前预冷所有的溶液并冰上操作）、方法（更大的液滴可以形成更大的晶体，因为液滴中含有更多的蛋白质，平衡的速度更慢。也可以尝试坐滴或三明治滴）、蛋白自身。

一、如果无法提高，可以尝试改变蛋白

1. 配体-蛋白复合物。如果你的蛋白质结合配体可制备配体-蛋白复合物，因为配体的结合可能会连接两个子结构域而降低灵活性，将改变蛋白质的表面特性，可能会导致蛋白构象改变。

2. 均质性。非均质的第三四级结构阻碍结晶。你的蛋白质分解成一个稳定的蛋白水解片段（或者是“自发的”，或者在一个附加的蛋白酶的帮助下）吗？你的蛋白质与同一家族其他蛋白质的同源性是否降低到n-和c-末端？

3. 结构域。你的蛋白质有结构域结构吗？可通过检查Pfam数据库，检查ProDom数据库，Psiblast搜索获悉。

4. 低复杂性区域。有时，点突变可阻止/启动蛋白质结晶。研究不同的物种是获得不影响功能的点突变集合的最简单方法。

5. 脱糖基作用。对于糖基化修饰的蛋白质，松软和不均匀的碳水化合物可能会干扰结晶。可尝试酶促脱糖。

6. 添加剂及洗涤剂。最受欢迎的添加剂有：甘油，（通常用量1%~25%的甘油），可以阻止成核，并可能给你更少，更大的晶体，并具有双重作为冷冻保护剂的优势。乙醇或二氧六环，这些物质会毒化晶体并使晶体停止生长避免成核过多。二价阳离子，如镁。洗涤剂，如β-辛基葡萄糖苷。Hampton有三个添加剂筛选和三个洗涤剂筛选试剂盒。找到合适的添加剂可能与找到蛋白质单一聚合态的条件有关。尝试使用不同的添加剂得到单一聚合态蛋白。

2. 秩序：散射取决于每个单元的相同程度。同一性越强，散射越强。盐比蛋白质衍射更好，因为它更有序。

3. 对称性：对于同样大小的晶体，盐的衍射效果比蛋白质的好，因为单位晶胞要小得多。（盐晶衍射的光斑相距较远，在一个小的振荡角范围内，光斑可能会消失。在高分辨率下会有一些强烈的斑点，不会看到低分辨率的斑点。）

4. 晶体的衍射质量可以随以下任何组合而变化：

衍射强度	衍射质量
无衍射	多镶嵌晶体 Multiple mosaic crystal
弱衍射10埃	镶嵌晶体
衍射3.5-6埃	多晶体
衍射>2.8埃	单晶体

试剂（REAGENTS）：目的蛋白、结晶板、凡士林、硅化盖玻片等耗材

器械（EQUIPMENT）：恒温培养箱、体视显微镜

1. 确定晶体生长条件。本实验室自己配制的晶体母液，因缺少某些试剂，该试剂可能由其他试剂替代。建议在确定晶体生长条件时以母液管壁上标注的说明为准。

2. 拟定优化方案。一般情况下将沉淀剂浓度拉梯度（当然也有其他方法，下文中会有所涉及），具体的做法是先设定梯度的两端值（即沉淀剂的最小浓度和最大浓度），随即配制好相应的两份母液，然后吸取两份母液按不同比例混合以完成梯度设置（例如，出晶的条件中沉淀剂是2.0 M的硫酸铵，那么可以将梯度设置在 1.5 M 至 2.5 M之间，配制两份结晶母液其含有沉淀剂浓度分别为Solution A（1.5 M）和Solution B（2.5 M），注意这两份结晶母液中只改变了沉淀的浓度而其他成分的浓度和原始结晶条件一致。如果准备点6个孔的话，可以按如下比例分别吸取两份母液混合于相应孔中，如下表：

	1	2	3	4	5	6
Solution A (μL)	500	400	300	200	100	0
Solution B (μL)	0	100	200	300	400	500

3. 当然也可以按照每50 μL为基础变量进行递减/递增，这样会产生11个条件。

4. 如果要以pH为优化变量，或者设置条件组合，方法同上述类似。

5. 根据目的蛋白初筛时出晶的大概时间，对优化的条件进行显微镜观察，如果能够观察到单个晶体，应该尽快将晶体冻存起来，留待衍射。

拍摄新鲜的晶体。晶体在生长后的几天内就会变质。

1. 如何将多块镶嵌晶体制成单块晶体？

一些多晶体可以使用玻璃纤维轻轻分开。

镶嵌晶体需要仔细的数据收集。如果镶嵌性不会导致斑点彼此重叠，则可以进行数据收集。

2. 如何使弱衍射晶体进一步衍射？

注意辐射损伤。有些冻存的晶体在X射线照射下会衰减。晶体死亡表现在第一幅衍射图像上有微弱的衍射，第二幅图像上的衍射更少。

拍摄新鲜的晶体。轻轻地处理晶体，使用大环来冷冻。

脱水。将晶体置于较高的沉淀剂条件下使细胞收缩。这可以在分辨率上产生惊人的提高。

退火。把晶体冷冻在低温流中（不要射击），把它们放回室温，把它们放回结晶溶液中几分钟，然后重新冷冻。

5.5.3 晶体冻存

当获得了目的蛋白的晶体后，我们如何让它能够忍受得了X-Ray一定时间内的持续照射，并获得较好的衍射数据呢？

因为晶体直接被暴露在X-Ray的照射下，在极短的时间内，晶体内部的排列顺序就会受到破坏而无法获得足够的衍射数据，因此就需要一定手段来保护晶体。研究发现当晶体处于超低温的环境中，可以延长晶体暴露于X-Ray的时间，维持内部分子的排列顺序。因此，现普遍采用低温冷却的方式来保护晶体以获得更多的衍射数据。然而，直接低温冷却晶体会致使晶体内部产生冰晶，以至于破坏了蛋白晶体内部的有序结构，因此保护晶体的各种防冻剂被科学家们逐渐通过测试而挖掘出来，成为晶体学实验不可或缺的重要一环。防冻剂的选择是需要实验人员根据经验和实际情况多次摸索，也可以凭经验自由组合一些防冻成分已达到实验目的。

常用晶体防冻液

Cryoprotectant	Concentration
Glycerol	>25%
Ethylene glycol	>25%
PEG-400	>25%
2R,3R-(-)-Butane-2,3-diol	>25%
Paraffin	>25%
2-propanol	>25%
2-Methyl-2,4-pentandiol (MPD)	>25%
Glucose	>25%
Xylose	>25%
Sucrose	>25%
Li2SO4	>2 M

试剂（REAGENTS）：防冻剂、结晶母液、Puck、Cryopin、枪头等耗材

器械（EQUIPMENT）：液氮（罐）、绝热盒、显微镜、钳子、移液枪

1. 防冻剂的选择非常关键。虽然上表多种化合物都有防冻效果，但是用法有些不同。首先尽量采用相似原则，也就是说选取与结晶条件相同或者接近的组分。比如如果晶体是在含有PEG条件长的，通过增加PEG的浓度或者添加高浓度小分子量的PEG，达到防冻效果。如果晶体是在高盐条件长的，可以首选具有防冻作用盐，比如锂盐，其次是小分子糖类葡萄糖、木糖、蔗糖等。甘油具有降低电导的作用，往往对在高盐条件下的晶体不利。其次，通过混合多种组分防冻剂，最大限度减少对晶体造成损伤。比如10%甘油，10% PEG，10%蔗糖等。防冻剂的选择还要考虑的防冻剂在结晶条件下的溶解度。比如硫酸锂溶解度较低，很难达到防冻效果。

2. 配制防冻液时，需要保持原条件沉淀剂浓度相同或者适当增加。不能简单在原条件里加防冻剂，这样会造成沉淀剂浓度降低。防冻液的成分是所有成分的最终浓度，配制时需要考虑体积的改变，以最终体积为准。

3. 配制好防冻液，用移液枪稍微吸取一些防冻液于枪头顶部，置于盛有液氮的绝热盒中数秒，移出液面，观察防冻液是否结冰，如结冰（在液氮中变白），需调试防冻液成分或比例，直至防冻液不结冰，在 EP管上标记清楚防冻液成分和实验日期。

4. 准备好具有不同大小fibre loop（0.2 mm, 0.3 mm, 0.4 mm等）的Cryopin，在没有揭开盖玻片之前，在显微镜下参照晶体大小比较并选择出适合的loop。

5. 将Puck打开（注意Puck的序列号），用钳子将其放入盛有液氮的绝热盒中（保证液氮的量是足够的，整个实验过程中维持绝热盒中液氮的液面高出Puck 1~2 cm），使其充分冷却。

6. 准备好后，揭开相应的盖玻片，反过来放在结晶板的盖子上，置于显微镜下。

7. 用移液枪吸取少量防冻液（1~2 μL）于悬滴上（期间注意此时晶体的状态，是否融化或者沉淀），再吸取少量防冻液于盖玻片空白处（留用于涮loop）。

8. 用合适的Cryopin小心并迅速地挑取晶体，在空白处的防冻液中涮一下，使得晶体周边比较干净（注意观察晶体的状态）。

9. 晶体状态很好的话，迅速将Cryopin放入绝热盒中Puck的相应位置（注意 Puck中孔的编号和顺序），记录该晶体的各种相关信息（蛋白浓度、结晶条件等），Puck序列号以及Puck中孔的编号，切记loop一旦进入液氮液面以下，务必保持其始终处于液面以下。

10. 按上述操作装满一个Puck后，将Puck的盖子用钳子放入液氮中，使其充分冷却，然后将Puck盖好（注意卡槽）；。

11. 将Puck移入Puck架上，小心放入液氮罐中，整个过程始终正置Puck，勿将其倒过来以致loop暴露于空气中；

12. 绝热盒中多余的液氮回收到液氮罐中，液氮罐置于实验室阴凉处。

检查Pin金属杆是否弯曲（不是挑晶体的尼龙环），有明显弯曲的一定不要用。

1. 晶体冻存的关键环节就是配制合适的防冻液和挑取晶体的操作，此步骤一定要谨慎小心，千万不要让好不容易长出的晶体因为准备不充分和操作失误而毁于一旦。

2. 为了更好的重复，对各项信息要详细记录，包括蛋白的批次，纯化的步骤条件，蛋白的浓度、纯度、储存条件等。这一部分工作一定要仔细完成。Puck有空位置的一定做好记录。否则后果很严重。

5.6 晶体衍射及数据收集

蛋白质三维晶体结构是通过对一系列晶体衍射数据分析处理的结果。作为结构生物学实验室，晶体数据的收集是我们实验室的一项重要工作。

本文将主要讲述两部分，第一部分介绍如何有效规范的记录、整理晶体的相关信息及冻存晶体的操作。第二部分介绍如何使用HKL2000软件初步处理收集的晶体数据。

（1）课题申请：进入上海光源收集数据需提前课题申请，填写相关用户信息、实验安全审核等信息方能取得使用资格。每年1月至7月，每月有一次晶体衍射机时。

1. 准备工作

（2）人员分配：我们实验室每月会派遣人员去上海光源负责晶体衍射实验，目前该任务主要由李越龙同学负责。同时，如果同时有几位同学都准备了冻存的晶体样品，和金老师商量后，有样品的同学可以跟随李越龙一起去上海收集数据。

（3）光源用户注册：根据上海光源用户使用规则，每个进入上海光源进行实验的人员必须提前在上海光源管理系统网站申请个人账号，获得上海光源个人ID号。申请光源个人账号的步骤如下：

（4）登陆上海光源用户课题管理系统http：//ssrf.sinap.ac.cn/proposals/default.aspx 进行用户注册在填写个人基本资料、接受安全培训并通过考试测试后取得用户编码（附录有测试答案）。个人需牢记自己的用户名和密码并告知李越龙自己的ID号，方便其记录并安排住宿，否则将无法入住光源宾馆，也无法进入光源收数据。

（5）办理出行证明：提前到生科院找潘主任加盖学院公章，以便携带液氮罐上火车。

2. 冻存、收集晶体

3. 出行指南

（1）科大→合肥南站→上海虹桥火车站：108路（6：00~21：30/22：30）：稻香村→合肥南站，出租车约20元。订购动车或高铁火车票，约200元，时长3小时。

（2）虹桥火车站→地铁2号线（05：30~22：45）：地铁入口就在火车站内，乘坐方向为浦东国际机场方向，约18站到张江高科站下车，时长约一小时，单程票价6元。

（3）地铁站5号出口→应用物理所（张衡路）：地铁站出口跨过马路左边方向有公交站和小吃摊，张南专线/188路或其他的：张江地铁站→3站路到张衡路科苑路下车（离光源近）或2站下车到马路对面吃饭，票价1或2元。也可打车，约12元。返回的路线可以到科伦路做公交，因为张衡路上只有一趟班车。

（4）到光源后，从门卫那儿根据自己的用户编号领取剂量计和用户卡。

（5）宾馆房费200元/天可刷卡，但押金必须交现金，房间12点前要退房。

（6）光源供餐时间：早餐供应时间：周一到周五7：30~9：00；周六到周日8：00~9：00。午餐：11：00~1：00，晚餐：5：00~7：00。注意供餐时间，以便选择时间适时就餐。

关键步骤：做好准备工作：身份证、来回火车票、整钱和零钱、硬盘和数据线、手机和充电器、水杯食品等。可以办理上海市的交通卡，不用每次都备零钱（市内交通，吃饭费用一律不给报销）。

4. 数据收集

（1）开门：先按关闸，再按开门。

（2）放PUCK：将液氮池上的陀螺拿开放在专门的位置，打开盖子（注意电线），旋紧PUCK，放进液氮池，PUCK的凹槽对准定位杆（有两根）。将盖子盖上大概在中间位置，不要盖上陀螺。记录好每个位置对应的PUCK。

（3）关门：按搜索1→按搜索2→人走出来→按关门→按住开闸3秒→开闸灯亮可以走了。

（4）操作演示器：如果是接着别人的机时使用，点击初始化（点击之后会变成另一个名字，再次点击即可）。鼠标点样品→点Mount→点Center（对焦）多旋转几个角度，确保所要收集数据的旋转角度内晶体都处于Focus上→点Collect→命名存储数据路径的文件夹、样品编号、设置参数、收集（0＃为单张image用于测试，1＃为多张image换样品后要点reset）。

A. Energy不要动，distance表示detector与样品的距离，越近收的数据越多但也可能有过多噪音，因此根据测试分辨率的大小判断用多少距离。Angle表示每拍一次样品旋转的角度，一般为0.5~1°，在shutterless detector比如18U／19U一般是晶体mosaicity 的一半。Expose 表示每次拍照曝光的时间，可根据测试时点数判断，点数过多减少曝光时间，曝光时间太长样品更易损坏。如果光很强可以使用衰减。Image 表示拍多少张，可以根据空间点群判断，但在样品未损坏的前提下可以尽可能多的拍，一般至少360。

B. 衍射图点分散会比较好，如果连成线一般表示栾晶，可以选择边沿的位置曝光通过Beam stop看光的强弱，正在收集的数据如果想停止收集可以通过pause和abort 停止。

关键步骤：一般不要使用衰减，收至少360°，可以一次性把晶体打坏。

（5）记录每个晶体x-ray的参数（距离、能量、角度、命名、曝光存储路径等）。

（6）换样：点下一个样品→Mount→同步骤4）。

（7）最后一个样品收集完成后点dismount→关闸→开门→取出PUCK。但不要关闭可视化软件。

关键步骤：

遇到空loop死机后，点击两次reset→点击initiate两次。

样品收集完毕后不要关闭软件，如果关闭，点击terminal窗口→↑键找回BlueIce命令→Enter→点击Active（Collect页面的下面）。

（8）Copy 数据至自带的U盘。

关键步骤：

线站经常会掉光，听到广播掉光后，到上游的控制箱→旋转钥匙到允许→关闸→下游关闸→旋转钥匙到禁止，重新注入光后，允许→上游开闸→下游开闸。

附:

常见空间群对应的最少收集角度。最优策略下，需要用HKL2000初步处理，根据Strategy 计算出来的起始收集角度。总的收集角度一般是下表最少角度的两倍。

空间群	最少收集角度
P1	360
P2	180
P3	120
P4	90
P6	60

5.7 单晶衍射数据收集要点

数据收集这一步非常重要。下面是一些需要注意的地方，确保对每一颗晶体，收集到最高质量的数据。

1. 晶体聚焦：非常重要，需要在0度，90度，180度和360度多角度旋转，确定是否在中间。有的时候晶体环太大，收集过程中的抖动，会移位。收集过程需要监控数据。看看衍射降低，是不是由于晶体移动了。这点非常重要！

3. 光斑大小：光斑不是越大越好，也不是越小越好。一般和晶体差不多大的光斑最好，一般采用50~200微米光斑。光斑大于晶体，容易增加背景。光斑太小，没有把整个晶体利用上，衍射没有到极限。如果晶体太大，比如大于0.5毫米，光斑可以稍小。如果大晶体，且内部不均一，有可能存在晶体的畸形，大光斑收集的衍射点模糊，不能用。这种情况可以用较小光斑，比如5~10微米。

4. 衍射时间和衰减attenuation：需要根据晶体衍射能力和抗辐射能力确定。一般来说，衍射时间越长，衍射越强。X射线能量越强，衍射越强。但是长时间曝光，会增加探测器的背景和晶体衰减。由于晶体的decay是自由基介导的，需要一定时间。因此经验上，用高剂量短时间，比低剂量长时间收到的数据质量更高。因此，首先需要用不是最好的晶体做测试。晶体在收集一整套数据后，观察衍射能力是否明显降低。再选定特定类型晶体能承受的X－射线能量，比如100%或者50%能量。然后确定曝光时间，一般0.2 s~2 s范围。目前17U线站最强，一般不用衰减的话，采用0.2 s至0.5 s。19U能量稍弱，采用0.2 s至1 s。

5. 数据需要收集的角度：也需要根据晶体抗辐射能力和空间群确定。初步处理以后，确定晶体空间群。如果P1，至少收720度；P2至少360度；P3是240度。实际情况是，如果晶体能够承受，时间允许，尽量加倍收。以后处理的时候可以不采用后面的数据。但是万一数据不完整，后悔来不及了。

6. 每张图的角度：有研究发现fine-slicing有好处。结论是mosaicity的一半最优。因此如果时间允许，用较小角度，而不是所有都用1度。19U建议默认0.5度，而17U新检测器非常快，建议用0.1-0.5度。

7. 数据初步处理：建议收集现场处理数据，这样子可以确定所收集的数据质量。万一发现问题，晶体还在，可以重收。并且现场就把每套数据处理完的分辨率、完整性等数据整理纪录，避免时间长后弄错。空间群和收数据的策略有关。因此初步确定空间群后，可以开始解结构。结构解出来，以能修下去为准，且对后面优化收集参数也有指导作用。

8. 数据纪录备份：所有晶体和数据都需要有详细纪录，回实验室后及时做备份。数据需要全部重新理优化，及时解析结构。根据数据质量和结构解析的情况，确定下一步优化晶体的情况。

9. 多少晶体，收多少次数据才够？一颗晶体足够解析结构。原则上，一种晶体（或在同一条件长的）每次不多于8个。事先需要优化，得到最好的晶体。长得单晶，三维最大，没有明显瑕疵。只带最好的晶体去收数据。每种晶体在每次收数据后都要得出一个结论，比如这个条件是否可以，是否需要改进。我们不建议同一个晶体重复收集很多次数据（比如三次）。

10. 数据处理cutoff：你的数据切到哪？需要综合考虑，比较主观。保守的标准是I/σ=2。激进的标准可以是I/σ=1。同时需要参考其他标准，比如completenesss 85%以上，冗余度redundency>5（至少>3），CC（1/2）>66， Rmerge 和Rmeas，不是很重要，可以参考Rpim。

11. 空间群的决定：根据数据建模，systemic absence初步确定，能够解出结构并且把结构修好是金标准。

5.8 XDS预处理衍射数据

XDS是一个用来处理X-ray晶体衍射图的软件包。包括XDS，它能处理一套数据；XSCALE，用于scaling多套数据；XDSCONV，用于把XDS输出的数据转换成其他格式。同时还有cellparm, 2cbf and merge2cbf. XDS-viewer，后者是一个独立的软件，用于显示衍射图的。更多信息，请参考xdswiki： http://strucbio.biologie.uni-konstanz.de/xdswiki/index.php/Main_Page

目前该软件主要还是在linux／unix系统下以命令的形式运行。

实验步骤（PROCEDURE）

一、使用前安装（以MAC OSX为例）：

1. 把下载的安装包解压，把XDS-OSX_64文件夹移到Applications中。

2. 打开terminal，输入：echo $SHELL，查看自己电脑的shell，一般都是bash shell。

然后继续输入： open –a TextEdit ~/.bash_profile ，这时会弹出新的窗口，上面显示的都是隐藏命令。在这个新窗口中另起一行，输入： export PATH=full_path_name_to/XDS-OSX_64:$PATH

export KMP_STACKSIZE=8m

3. 在terminal中进入 XDS-OSX_64 文件夹，输入：pwd，会显示该文件夹的路径。将此路径复制粘贴到第四步中的 full_path_name_to/XDS-OSX_64 ，代替它。回车。

4. 到终端中输入：xds，看是否可以运行。

XDS使用一段时间会提醒过期，这时可以到官网 http://xds.mpimf-heidelberg.mpg.de/html_doc/XDS.html 重新下载安装包，按照以上步骤重新安装即可。

二、数据处理时：

1. 修改XDS.INP的参数：

！后面一行表示软件跳过去，也就是不执行的命令。请使用适当的文本编辑器，比如linux 下nedit或者Mac下TextEdit。

2. 在存有数据的文件夹里，新建一个xds的目录，然后进入改目录：mkdir xds/cd xds

3. 把以前的xds文件夹，包括所有输入文件INP文件拷贝过来：Cp *.INP xds/

4. 使用适当的文本编辑器，比如linux下的nedit或者Mac下的TextEdit：Nedit XDS.INP / open –a TextEdit XDS.INP

5. 你将会看到如下内容。红色的地方是需要注意或者修改的地方，其他地方一般不用变。

6. DETECTOR=PILATUS 这是 18U／19U 的 shutterless 的 detector 。它有很多块组成。和 17U 的不同。如果是在 17U 收集的数据，请另外打开一个针对 17U 的 XDS.INP 文件。

下面这些无论在哪里收集，都是一样的。

!====================== JOB CONTROL PARAMETERS

!JOB= XYCORR INIT COLSPOT IDXREF DEFPIX XPLAN INTEGRATE CORRECT

!JOB=ALL

JOB= DEFPIX INTEGRATE CORRECT

这一部分是选择任务。第一次选 JOB=ALL 。确定空间群后，选择下面的 JOB=DEFPIX INTEGRATE CORRECT

!====================== GEOMETRICAL PARAMETERS

!ORGX and ORGY are often close to the image center, i.e. ORGX=NX/2, ORGY=NY/2

ORGX=1224.0 ORGY=1253.5 !Detector origin (pixels). ORGX=NX/2; ORGY=NY/2

DETECTOR_DISTANCE= 400.0 !(mm)

ROTATION_AXIS= -1.0 0.0 0.0

! Optimal choice is 0.5*mosaicity (REFLECTING_RANGE_E.S.D.= mosaicity)

OSCILLATION_RANGE=1 !degrees (>0) 转角

X-RAY_WAVELENGTH=0.9785 !Angstroem 波长

INCIDENT_BEAM_DIRECTION=0.0 0.0 1.0

FRACTION_OF_POLARIZATION=0.99 !default=0.5 for unpolarized beam

POLARIZATION_PLANE_NORMAL= 0.0 1.0 0.0

!======================= CRYSTAL PARAMETERS ==============

!SPACE_GROUP_NUMBER=196 !0 for unknown crystals; cell constants are ignored. 如果不知道，就跳过去或者输入0，前面一次输出的可以作为下一次的输入。

! UNIT_CELL_CONSTANTS= 180.7 180.7 180.7 90 90.0 90.0

SPACE_GROUP_NUMBER= 168

UNIT_CELL_CONSTANTS= 123.81 123.81 120.15 90.000 90.000 120.000

FRIEDEL'S_LAW=TRUE ! Default is TRUE.

!REFERENCE_DATA_SET= CK.HKL !Name of a reference data set (optional)

!==================== SELECTION OF DATA IMAGES ==============

!Generic file name and format (optional) of data images

NAME_TEMPLATE_OF_DATA_FRAMES=../TJ21-7_1_00???.cbf !CBF 数据文件路径

DATA_RANGE=1 180 !Numbers of first and last data image collected 使用的数据

BACKGROUND_RANGE=1 6 !Numbers of first and last data image for background

SPOT_RANGE=1 90 !First and last data image number for finding spots，用来初始选点的数据，一般是使用数据的一半。

!==================== DATA COLLECTION STRATEGY (XPLAN) =============

! !!! Warning !!!

! If you processed your data for a crystal with unknown cell constants and

! space group symmetry, XPLAN will report the results for space group P1.

!STARTING_ANGLE= 0.0 STARTING_FRAME=1

!used to define the angular origin about the rotation axis.

!Default: STARTING_ANGLE= 0 at STARTING_FRAME=first data image

!RESOLUTION_SHELLS=10 6 5 4 3 2 1.5 1.3 1.2

!STARTING_ANGLES_OF_SPINDLE_ROTATION= 0 180 10

!TOTAL_SPINDLE_ROTATION_RANGES=30.0 120 15

!====================== INDEXING PARAMETERS ===============

!Never forget to check this, since the default 0 0 0 is almost always correct!

!INDEX_ORIGIN= 0 0 0 ! used by "IDXREF" to add an index offset

!Additional parameters for fine tuning that rarely need to be changed

!INDEX_ERROR=0.05 INDEX_MAGNITUDE=8 INDEX_QUALITY=0.8

SEPMIN=4.0 ! default is 6 for other detectors

CLUSTER_RADIUS=2 ! default is 3 for other detectors

!MAXIMUM_ERROR_OF_SPOT_POSITION=3.0

!MAXIMUM_ERROR_OF_SPINDLE_POSITION=2.0

!MINIMUM_FRACTION_OF_INDEXED_SPOTS=0.5

!======= DECISION CONSTANTS FOR FINDING CRYSTAL SYMMETRY =========

!Decision constants for detection of lattice symmetry (IDXREF, CORRECT)

MAX_CELL_AXIS_ERROR=0.03 ! Maximum relative error in cell axes tolerated

MAX_CELL_ANGLE_ERROR=2.0 ! Maximum cell angle error tolerated

!Decision constants for detection of space group symmetry (CORRECT).

!Resolution range for accepting reflections for space group determination in

!the CORRECT step. It should cover a sufficient number of strong reflections.

TEST_RESOLUTION_RANGE=8.0 4.5

MIN_RFL_Rmeas= 50 ! Minimum #reflections needed for calculation of Rmeas

MAX_FAC_Rmeas=2.0 ! Sets an upper limit for acceptable Rmeas

!================= PARAMETERS CONTROLLING REFINEMENTS =========

!REFINE(IDXREF)=BEAM AXIS ORIENTATION CELL !DISTANCE

!REFINE(INTEGRATE)=!DISTANCE BEAM ORIENTATION CELL !AXIS

!REFINE(CORRECT)=DISTANCE BEAM ORIENTATION CELL AXIS

!================== CRITERIA FOR ACCEPTING REFLECTIONS =============

VALUE_RANGE_FOR_TRUSTED_DETECTOR_PIXELS= 6000 30000 !Used by DEFPIX

!for excluding shaded parts of the detector.

INCLUDE_RESOLUTION_RANGE=50.0 2.05 !Angstroem; used by DEFPIX,INTEGRATE,CORRECT 最后数据的最高分辨率。

!MINIMUM_ZETA=0.05 !Defines width of 'blind region' (XPLAN,INTEGRATE,CORRECT)

WFAC1=0.85 !This controls the number of rejected MISFITS in CORRECT; !a larger value leads to fewer rejections.

这一数值控制 rejection 比率。1代表不采用 rejection ，一半在 0.8-1.0 之间。第一轮不采用 rejection 。最多不超过 10% 的 rejection ，在输出的 CORRECT.LP 中的最后一个表格中可以算出 rejection 的比率。

!REJECT_ALIEN=20.0 ! Automatic rejection of very strong reflections

!============== INTEGRATION AND PEAK PROFILE PARAMETERS =========

!Specification of the peak profile parameters below overrides the automatic

!determination from the images

!Suggested values are listed near the end of INTEGRATE.LP这一数值INTEGRATE.LP中后面的表格能找到。上一轮的输出作为下一轮的输入。

BEAM_DIVERGENCE= 0.33031 BEAM_DIVERGENCE_E.S.D.= 0.03303

REFLECTING_RANGE= 1.02947 REFLECTING_RANGE_E.S.D.= 0.14707

对 XDS.INP 进行修改后，保存。然后执行多任务。在 terminal 输入小写的命令

>xds_par

如果顺利，会完成。如果有错，会输出错误信息。需要重新对XDS.INP进行修改。

打开三个文件： INTEGRATE.LP，CORRECT.LP，XDS.INP

根据前两者的输出，再放到后者作为下一轮的输入，然后循环，直到REFLECTING_RANGE不变了，差不多10- 20个循环。

（1）在XDS.INP中输入正确的空间群和晶胞参数。

（2）将job更改为JOB = DEFPIX INTEGRATE CORRECT

（3）根据CORRECT.LP末尾的表格确定分辨率截断值。

（4）查看CORRECT.LP中的“alien”点列表，将它们放入其中以删除异常值

（5）REMOVE.HKL： awk'/ alien / {if（strtonm（$ 5）> 20）print $ 0}'CORRECT.LP >> REMOVE.HKL

（6）将INTEGRATE.LP中的2行复制到XDS.INP的输入参数的建议值

*****为输入参数建议的值*****

BEAM_DIVERGENCE = 0.293 BEAM_DIVERGENCE_E.S.D.= 0.029

REFLECTING_RANGE = 1.473 REFLECTING_RANGE_E.S.D.= 0.210

（a）将GXPARM.XDS复制到XPARM.XDS并重新运行DEFPIX INTEGRATE和CORRECT

（b）作为最后的方法，将WFAC1从默认值1.0降低到0.75，但要注意降低的完整性和增加的R free！

（c）运行“xscale XSCALE.INP”进行扩展作业，并检查日志文件“XSCALE.LP”

（d）注意三个标准：最高分辨率壳层的完整性，I/sigma和CC1/2。

（e）可以忽略“R-meas和R-merge”（它们在高分辨率壳层中可能大于100％）。

（f）编辑“ XDSCONV.INP ”，将数据格式转换为 CCP4，CNS，SHELX 。并运行“ xdsconv XDSCONV.INP ”。现在 phenix 可以直接把XDS输出的XSCALE.HKL文件转换成mtz文件。

（g）注意“REFLECTING_RANGE”是HKL2000的“Mosaicity”概念。

针对性建议（TROUBLESHOOTING）

1. 有的时候自动处理失败，主要还是需要修改的参数，比如距离，角度，detector类型等没有设好。

2. 偶尔是由于前面的衍射图不好，可以选后面的。

3. 如果redundancy足够，可以尝试扔掉后面部分衍射较差的数据，提高分辨率。还可以适当降低WFAC1。

4. 如果第一轮自动处理，确定空间群，但没有进一步integrate。如果对空间群有信心，不如已经在HKL2000处理了。可以强制进入integrate。

5. XDS选点更多，因此数据质量比HKL2000更好，特别是高分辨率，强度较低的点，能够被采纳。因此可以用HKL2000初步处理，最后用XDS处理。

5.9 XDS-J Version Theta

XDS-J是程金博2017年为XDS写的一个图形化界面（GUI）。本说明针对版本测试版Theta. 问题意见及建议请反馈至[email protected]。

XDS-J是XDS的图形用户界面。它使得X射线衍射数据的处理更加容易和方便。XDS-J可以使大多数过程自动化，提供统计数据并缩短处理数据所花费的时间。简而言之，XDS-J对于XDS的新老用户来说都是一个很有用的工具。

XDS-J由中国科学技术大学结构免疫学实验室的程金博开发。联系方式：[email protected]

系统要求（SOFTWARE REQUIREMENT）

Linux System (tested: CentOS 6.9, Ubuntu 16.04)

XDS (download from http://xds.mpimf-heidelberg.mpg.de/html_doc/downloading.html)

xds-viewer

Python (tested: 2.7, 3.4) with module Tkinter and matplotli

XDS-J (version: open theta, last updated: 2017/07/04)

软件安装（INSTALLATION INSTRUCTIONS）

安装XDS:

下载，解压缩并设置PATH环境变量

安装xds-viewer：

移动到PATH变量中的目录，例如XDS的安装路径

$ wget ftp://turn5.biologie.uni-konstanz.de/pub/xds-viewer-0.6.64bit -O xds-viewer

$ chmod a+x xds-viewer

安装Python：

在Ubuntu下为python2安装模块Tkinter和matplotlib:

$ sudo apt-get install python-tk python-matplotlib

在Ubuntu下为python3安装模块Tkinter和matplotlib：

$ sudo apt-get install python3-tk python3-matplotlib

安装XDS：

解压缩并将执行文件XDS-J复制到PATH变量中的目录

基本使用步骤（PROCEDURE）

1. 打开终端，转到工作路径后，键入命令XDS-J。

2. 通过image右侧的browse选取一张图片（可以不是第一张）（图片命名方式必须像如下几种这样：ab0001 ab_1_0001 ab_1.0001，可以带格式后缀，可以是压缩文件）（点击view可以观察图片）。

3. 选择探测器类型和参数，若参数不在列表中可以选other然后输入。某些探测器可以自动读取。

4. 输入程序运行所需其它参数或修改自动读取的参数（ FRIEDEL'S_LAW 在有重原子的时候应为FALSE）。

5. 点击run xds for ? rounds（可以在下面输入打算连续运行的轮数）。若程序正常运行，结束后会显示红字Finished，结果会显示在框中，自动确定的晶体类型和参数自动填入SPACE_GROUP_NUMBER和UNIT_CELL_CONSTANTS的框中。

6. 一般Job前两次运行时选“ALL”，之后修改Job为'DEFPIX INTEGRATE CORRECT'，根据结果修改最高分辨率（如果在I/SIGMA cutoff前面打勾，运行一次后脚本将根据输入的截断值自动确定下次使用的最高分辨率），也可修改其他参数（如DATA_RANGE，由于辐射损伤有时候要舍弃后面的数据，可参考第二页的图表，或者设置WFAC1 0.85~0.95，EXCLUDE_DATA_RANGE），点击xds再次运行。

7. 多次重复运行XDS以优化结果。

8. 一般最终使最高分辨率对应的I/SIGMA接近2，CC（1/2）大于60，同时总的COMPLETENESS大于90%，NUMBER OF REFLECTIONS中的OBSERVED是UNIQUE的五倍以上，NUMBER OF REJECTED MISFITS小于NUMBER OF REFLECTIONS IN SELECTED SUBSET OF IMAGES的5%（以上数字仅供参考，并不绝对）

9. 点击xscale&xdsconv，在弹出窗口中点击xscale（如果有多套数据，可在此步把它们合并）。再点击xdsconv，最终生成CCP4，CNS，SHELX可用的mtz文件。

其它功能（OTHER FUNCTIONS）

1. 在界面右上角可以选择一个日志文件，然后点击view log file按钮打开查看。

2. 点击Generate XDS.INP only按钮将只生成XDS.INP文件而不运行xds。

3. 点击View XDS.INP按钮可查看XDS.INP文件，更改内容后点击save可以保存。

4. 如果想利用已有的XDS.INP文件运行则点击Run with existing XDS.INP按钮。

5. SPACE_GROUP_NUMBER为0时运行完xds点击Show all possible space group按钮可显示CORRECT.LP文件中判断的所有可能的空间群及参数。

注意

（1）XDS在积分时效果优于其他软件，但有时自动确定的空间群不准确。这时可以先用其他软件（例如HKL-2000,iMOSFLM）确定空间群，再用得到的参数运行XDS。

（2）运行XDS时整个界面将暂时处于锁定状态，不要对其进行任何操作，以免造成未知后果。

（3）程序运行时将产生很多文件，最好在一个单独目录下运行。

（4）显示结果的最大分辨率与输入的最大分辨率不一致可能是因为改分辨率下没有点。

（5）如果结果显示各个分辨率范围的信噪比都很低且差别较小，有可能是晶体位置（ORGX，ORGY）偏离较大或空间群选择错误。

（6）运行失败可能的原因包括：数据本身质量不好（可通过view按钮查看图片），旋转轴的正负错误，最高分辨率过低（例如0），空间群选择错误（改变DATA_RANGE有可能导致自动确定的空间群不同）。

6. 提高信噪比方法：WAC1调低（如0.8，0.9），改变DATA_RANGE，多运行几轮XDS。

7. 探测器类型和参数未知的可以尝试通过读取图片的文件头中的信息再加上用xds-viewer打开确定像素，再参考XDS网站得到。有关参数可在XDS网站（http://xds.mpimf-heidelberg.mpg.de/html_doc/detectors.html）上找。

参数的意义

（详细介绍参见 http://xds.mpimf-heidelberg.mpg.de/html_doc/xds_parameters.html ）

1. Job为All时将运行XYCORR，INIT，COLSPOT，IDXREF，DEFPIX，XPLAN，INTEGRATE，CORRECT

2. MAXIMUM_NUMBER_OF_PROCESSORS为要使用的处理器数，最大32。

3. DETECTOR，NX，NY，QX，QY，OVERLOAD为探测器的参数。

4. ORGX，ORGY为晶体所在位置，默认为NX，NY的一半，特殊情况晶体偏离中心可通过观察图片后输入。

5. RESOLUTION填最大分辨率（单位A）。

6. NAME_TEMPLATE_OF_DATA_FRAMES为图片所在路径，注意不能有空格，例如/test/TJ_1_???.img以表示TJ_1_001.img，TJ_1_002.img，TJ_1_003.img等。

7. DATA_RANGE为要使用的图片范围，填两个整数，以空格隔开。

8. ROTATION_AXIS一般为1 0 0（但18u，19u是-1 0 0）。

10. SPACE_GROUP_NUMBER第一次运行不知道的话填0，此时UNIT_CELL_CONSTANTS可以空着,XDS可以自动确定空间群，不过有可能不正确。

11. TRUSTED_REGION如果是0到1相当于探测器的内接圆，0到1.414相当于探测器的外切圆。

12. WFAC1值越小，拒绝的点越多，一般在0.8~1.0之间。

13. FRIEDEL'S_LAW在有重离子的时候应为FALSE。

14. EXCLUDE_DATA_RANGE是要排除的数据范围，两个整数用空格隔开，如要排除单张则两个相同数字，该参数可以有多行。

脚本运行原理

1. 通过image右侧的browse选取一张图片会显示图片的头几行，脚本自动确定NAME_TEMPLATE_OF_DATA_FRAMES，DATA_RANGE为所有数据，并从中读取DETECTOR_DISTANCE，OSCILLATION_RANGE，X-RAY_WAVELENGTH等参数（目前只支持ADSC，PILATUS，CCDCHESS三种探测器）。

2. 点击view将调用xds-viewer打开选取的图片。

3. 点击run xds for ? rounds，脚本将自动生成XDS.INP并运行xds_par。若程序正常运行，结束后会显示红字Finished，CORRECT.LP中的结果会显示在右侧的框，获得的晶体类型和参数自动填入SPACE_GROUP_NUMBER和UNIT_CELL_CONSTANTS的框中。

4. 如果在I/SIGMA cutoff前面打勾，下次运行后脚本将根据输入的截断值通过线性插值法估计下次使用的最高分辨率。

5. 点击run xds for ? rounds再次运行时脚本会自动读取INTEGRATE.LP中REFLECTING_RANGE，REFLECTING_RANGE_E.S.D.，BEAM_DIVERGENCE，BEAM_DIVERGENCE_E.S.D.的值加入XDS.INP文件中，并用GXPARM.XDS替换XPARM.XDS。

6. 点击xscale时，脚本自动生成XSCALE.INP并运行xscale。点击xdsconv时，脚本自动生成XDSCONV.INP并运行xdsconv，f2mtz。

5.10 分子置换法解相位

简介（INTRODUCTION）

分子置换（MR）是最常用的解决相位问题的方法。一般要求目标蛋白A有同源蛋白结构B，同源性30%以上。

（1）先用CCP4中的matthews判断一下一个晶胞中有多少个分子。在CCP4 MR 模块下，打开cell content analysis。这个是晶体中蛋白聚集体数的分析，通过分析晶体含水量得到一个晶胞内的蛋白分子数。需要输入mtz文件，单体蛋白的分子量或者氨基酸数目。由于大多数生物大分子晶体含水量在40%~60%之间，同时最小对称单元中，蛋白数值对应n是整数。可以初步确定n值。这个聚集体数n会在mr中使用，用来更加准备估计含水量作为背景。一般分辨率在2埃的晶体其含水量在50%左右。也可以根据分辨率，指导n值的确定。

（2）步骤：输入mtz文件，再在下拉菜单中选择一种确定分子量的方法。可直接输入（默认）或用残基数，序列文件，pdb文件估计等。点击Run Now。运行完成后得到不同分子数（Nmol/asym）对应的可能性（P(tot)）。一般会有一个数字对应的可能性非常大，即一个晶胞中的分子数。

（3）model 选取：进行分子置换的model为已知的同源蛋白结构或硒代得到的pdb，对model的要求是越接近球形越好。一般用单体。从pdb库中下载了pdb后可以用vim编辑，选取自己想要的那一段做model。

（4）Phaser MR做分子置换。该程序在CCP4和Phenix中都有。

（5）使用CCP4步骤：

所有必须项都用深黄色标示出来了。在Define Data栏中选取mtz文件，如果不确定空间群可以把Run Phaser with后的下拉菜单选成all alternative space groups。在Define ensembles栏中选取pdb文件。在Define composition of the asymmetric unit栏中选取序列文件（可用输入分子量或输入残基数代替），Number in asymmetric unit后面输入之前得到的晶胞中分子数。点击Run Now。

（6）使用Phenix步骤：

在Input and general options页中选取mtz文件。在Ensembles页中点击Add file选取pdb文件。在ASU contents页中选取序列文件（可用输入分子量或输入残基数代替）。在Search procedure页中点击Component 1后的按钮Add ensemble中选之前添加的那个pdb文件，Copies to search for填之前得到的晶胞中分子数，如果不确定空间群可以把Also try alternative space group选成All possible in same pointgroup。点击Run。

（7）成功运行会输出一个mtz文件和一个pdb文件。

关键步骤：

如何判断得到的解是否正确。TFZ大于8表示几乎可以确定是正确的解，7~8表示很有可能，6~7表示有可能，5~6表示不大可能，小于5表示不可能。PAK理想情况为0。

如果成功找到解，接下来就可以进行结构修正。

可使用CCP4中的refmac5或Phenix中的phinex.refine。把之前得到的mtz文件和pdb文件作为输入，运行成功会输出一个mtz文件和一个pdb文件。运行前后Rfree，R-factor的值应该有所减少。接下来用COOT同时载入刚才输出的两个文件，手工进行结构修正。然后再用程序进行修正，不断重复这一步。见后面Coot指南。

如果提示mtz文件没有Rfree标签，打开CCP4中的truncate。选取该mtz文件，选中Ensure unique data & add FreeR…。点击Run Now。输出文件就有了。

5.11 结构优化检查清单

结构修正永远不会完成，但是当人们再也无法改进时，就不用再修正了。以下是我的检查清单，您无需按照订单操作。

1. 确保模型的序列是蛋白质的实际序列。使用Phenix或其他工具提取最终模型的序列，并与您的实际蛋白质序列进行序列比对（根据您的测序结果）。

2. 在coot中检查map和模型。

（1）手动检查2Fo-Fc图谱中5 sigma以上的峰值。

（2）没有未建模的斑点。

（3）没有ramachandran plot outliers。尽力改善它。

（4）检查并修复大多数侧链outliers。

（5）仔细检查结构中的任何配体。

（6）检查水。去除那些密度很弱，即小于11 sigma峰值的那些，以及那些与其他原子距离太近（小于2.2 Å）或太远（大于3.5 Å）的水。

3. 在Phenix.refine中，使用TLS修正。几乎在任何分辨率下都很好。

4. 在phenix.refine中，在修正中使用氢可以改善冲突。只有在非常高的分辨率下（即高于1.5Å）使用氢，否则使用riding模型。

5. 手动或自动优化X射线/立体化学，ADP重量。

6. 你的修正收敛，与相似分辨率范围内的结构相比，R因子变化不大且合理。Rfree和Rwork之间的差距小于5％。

7. 检查phenix.refine中MolProbity的输出，并修复任何问题。

8. 提交验证服务器或存储服务器。

5.12 如何修正低分辨率的结构(5-6 Å)

不同分辨率，结构的修正难度差别很大。分辨率低预示着来自数据的信息少，数据比参数的比值低，结构不确定性大。而最基本的，无论怎么修正，结构的所有键长键角等数值不能违背理论值。

教程（TUTORIAL）

人们经常使用Phenix.refine来修正低分辨率结构，因为phenix.refine实际上是一个很好的程序，可以针对低分辨率结构进行细化。如何进行取决于您希望完成细化的内容。如果结构已经近似正确，没有重大的构象变化，这里有一些基本的指导原则：

1. 使用紧束缚。权重自动优化在此分辨率范围内不能很好地工作，因此可以同时将wxc_scale和wxu_scale设置为非常低的值（它控制X射线项相对于几何和B因子约束的权重）是一个很好的起点。建议尝试wxc_scale = 0.025和wxu_scale = 0.05的值。

2. 如果ASU中有多个分子，请使用NCS限制（torsion限制通常是足够的，并且更容易使用，但也可能值得尝试cartesian限制）。

3. 如果你有一个好的高分辨率结构，可以使用参考模型（这可能只是结构的一部分）。

4. 真实空间的修正可能不会起作用。

5. 首先尝试使用非常保守的修正策略，例如刚体和B族因子簇修正。后者可能效果更好，因为增加了对邻近基团的限制。您还可以尝试优化结构域TLS。我自己的经验是，individual coordinate和 B-factor refinement的改进效果最好。后者有点争议，但是在严格限制的情况下，它最终与修正整体B因子没有太大区别。在修正开始时将所有B因子重置为20有助于消除起始模型的偏差。

6. 在此分辨率下应该对于2mFo-DFc电子云图非常谨慎，它看起来几乎就像你的模型。因此需要制作大量的Omit电子云图，如果你有任何重的散射体（金属等），这些将非常有助于确认你结构的正确性。如果你真的需要进行大量的重建，那就更难了，DEN或Rosetta修正可能会有所帮助。

7. 定义二级结构并在结构修正中使用它。如果不使用二级结构限制，那么在起始模型中即便是理想的二级结构在如此低分辨率的修正之后也会恶化。最重要的是，确保您定义的二级结构限制实际上用于修正。您可以使用phenix.secondary_structure_restraints让Phenix自动识别二级结构。至关重要的是，您需要手动查看它，并在必要时进行编辑（最有可能的情况），以获得最准确的注释！

8. 旋转NCS在大多数情况下是比较好的选择，然后在非常低的分辨率下，笛卡尔NCS可能是更好的选择。因此，正如纳特指出的那样，尝试两者并看看哪一种效果最好。

9. 如果真实空间修正表现不佳，请报告错误，因为它将消除旋转异常值rotamer outliers。

10. 如果有Ramachandran outlier拉氏图异常值：手动固定它们，然后使用Ramachandran plot restraints来防止它们再次发生（重要：不要使用拉氏图限制来修复异常值！）。

11. 如果数据集严重不完整，请查看两个2mFo-DFc地图：常规和缺失Fobs“已填充”（phenix.refine输出两个地图）。

5.13 结构解析软件的使用

5.13.1 HKL2000 基本操作

这部分简要介绍如何使用HKL2000软件处理蛋白晶体衍射数据。由于篇幅的限制，这里很少涉及每个参数的具体意义。