You are on page 1of 38

Cryo-EM data processing strategy (overview)

Based on “Cryo-EM 17 lecture 07” by MRC Laboratory

小森雄太 ( 医学科 4 年 )
吉川研究室
Overview
Motion correction
K2 summit : 400 fps の底力
→ これを利用し , 「 0.2 秒ごとに 1 枚画像を撮影し , 計 5 秒間 (25 スタック ) の動画を作れ」のように命じて撮影
(Dose fractionation mode)
“ データには beam-induced motion が存在する”

Li, X., Mooney, P., Zheng, S., Booth, C. R., Braunfeld, M. B., Gubbens, S., ... & Cheng, Y. (2013).
Electron counting and beam-induced motion correction enable near-atomic-resolution single-particle
cryo-EM. Nature methods, 10(6), 584.
Motion correction
MotionCor2
・ Gain correction : detector 由来の noise 補正。各フレームに対して Gain-reference を割り算する。
   CCD or CMOS の画素毎に僅かに感度が異なることに由来する模様
   :光を当てない状態で生じる artifact

・ Hot pixel( 入射電子に対して線形に反応しない画素 ) を推定し , 除去

・ Global alignment :各フレームを雑に align

・ Patch based alignment : global alignment を適用した上で , さらに各フレームを 5x5 程度の patch に分けて align
Motion correction
MotionCor2
・として , 各 patch のフレームごとのを X, Y, Z の
  3 次関数として表現し , なめらかな shift 回帰曲線を計算

Zheng, S. Q., Palovcak, E., Armache, J. P., Verba, K. A., Cheng, Y., & Agard, D. A. (2017). MotionCor2: anisotropic
correction of beam-induced motion for improved cryo-electron microscopy. Nature methods, 14(4), 331.
Motion correction
MotionCor2
Dose weighting
→ electron dose の蓄積によってフレームの SNR が徐々に減衰していく現象を考慮して , できるだけ最初の方のフ
レームの情報を生かしながら weight をかけて motion correction すること。特に高解像度成分の減衰が激しい。

Grant, T., & Grigorieff, N. (2015). Measuring the optimal exposure for single particle cryo-EM using a 2.6 Å reconstruction of rotavirus VP6. Elife, 4, e06980.
Overview
CTF estimation
① 生物試料は電子線により容易にダメージを受ける
→ 生物試料を撮影するためには電子線量を少なくしなければならない
→ でも、電子線量を小さくすると amplitude contrast がほぼ得られない ...
→ 代わりに defocus(f) をかけて phase contrast を得よう!

② さらに , レンズには収差がある ( ザイデルの 5 収差 )


→ 物体が光軸上にあっても生じる唯一の収差:「球面収差」 ( 球面収差係数: )  
CTF estimation
弱位相物体近似 ( サンプルの厚さが非常に小さい ) のもとで ,
+ defocus
~~ + Cs ①
𝐼 ( 𝒓 ) ∝ 𝐹 [ 𝐹 {𝑉 ( 𝒓 ) }∙ 𝐶𝑇𝐹 ( 𝑞 ) ]

𝐶𝑇𝐹 ( 𝑞 )=sin ⁡{2 π ( 1 3


4
1
)
λ 𝐶 𝑠 𝑞4 − λ Δ 𝑓 𝑞 2 }
2

q :散乱ベクトルの大きさ
f : defocus(underfocus が正 )
λ :電子線の波長
:対物レンズの球面収差 ①, ② :フラウンホーファー回折
     ( 数学的にはフーリエ変換 )
~~
※ 𝐹 [ 𝐹 { 𝑉 ( 𝑥 ) } ]= 2 π 𝑉 (− 𝑥)
CTF estimation
~~
𝐼 ( 𝒓 ) ∝ 𝐹 [ 𝐹 {𝑉 ( 𝒓 ) }∙ 𝐶𝑇𝐹 ( 𝑞 ) ]
Fourier transform
~ ~
𝐹 {𝐼 (𝒓 ) }∝ 𝐹 {𝑉 ( 𝒓 ) }∙ 𝐶𝑇𝐹 (𝑞 )

(
1 3
4
4 1
2 )
2
𝐶𝑇𝐹 ( 𝑞 )=sin ⁡{2 π λ 𝐶 𝑠 𝑞 − λ Δ 𝑓 𝑞 }

Envelope
function
CTF estimation
𝐶𝑇𝐹 ( 𝑞 )=sin ⁡{2 π ( 1 3
4
1
)
λ 𝐶 𝑠 𝑞4 − λ Δ 𝑓 𝑞 2 }
2

Input: λ, → estimate comparing CTF(q) with FFT → Output: , ,


( この 3 つのパラメータで CTF が再現可能 )

① の推定: mirror image を rotation させて original image との CC が最


大になる rotational angle の半分として初期値を決定
② , の推定: BF 法 (Brute Force; 総当たり法 ) で初期値を決定

→ CG 法 (Conjugate Gradient; 共役勾配法 ) で refine

Rohou, A., & Grigorieff, N. (2015). CTFFIND4: Fast and accurate defocus estimation
※ 実際の FFT 像は非点収差の影響で楕円形 from electron micrographs. Journal of structural biology, 192(2), 216-221.
CTF estimation
必ず確認を忘れずに!

後になってから「 CTF estimation が変じゃん ... 」なんてことも


Overview
Particle picking & extraction
Particle picking :画像上の particle を検出し , その座標 (coordinates) を output すること。

Particle extraction :指定された座標 (coordinates) を中心として , 適当な大きさの box( 正方形 ) で particle を切り
抜くこと。 Output は box の stack ファイル。 RELION の場合は particle normalization もこの段階で行う。

Particle coordinates Particle stack file


Particle picking & extraction
繊維状蛋白質に対する particle picking は少し特殊

Filament の中心軸を trace し ,

その軸線を等間隔で segment して切り出す

Filament に対する particle picking : filament の trace を行うことと同義


Particle picking & extraction
機械学習ブームの今 , 大量の particle picking software がある ...   
Overview
2D classification
2D classification :得られた particle を数十~百程度の class に分類すること。各 class 像は particle の average( 足し
合わせ ) となっているため , class average とも言う。

Raw particles() Class averages(10 ~ 100)


2D classification
目的
・ Autopick 時に出たゴミを捨てる ( 良い class に入った particle だけを使用する )
・データの質の評価 ( この段階で二次構造まで見えると結構期待できる )
・構造のおおよその見当をつける (3D を待ちきれない )
・ 3D initial model 作成に用いることも ( 後述 )
2D classification
アルゴリズム (RELION の場合 )
① particle をランダムに K 個にクラス分けして , initial class averages を作成
  alignment parameters もランダム化しておく

② すべての particle に対して , “ その particle が class k に分類され , alignment parameter Φ を持つ確率”を計算する 


“probability of k and Φ, given the observed image and the current estimates for the model parameters”

iter (Expectation step)


: i-th particle
: iter=n の class average の model parameter
③ 新たな class average を作成する   (e.g. the distribution of the particles over the classes)

1
𝐴(𝑛+1)
𝑘 = ∑ ∫ 𝑃 ( Φ , 𝑘| 𝑋 𝑖 , Θ(𝑛)) 𝑅−1
Φ 𝑋 𝑖 𝑑Φ (Maximization step)
𝑁 𝑖 Φ
EM 法 (Expectation-Maximization 法 ) と Bayesian MLE 法 (Maximum-Likelihood Estimation) を組み合わせたもの
Scheres, S. H., Valle, M., Nuñez, R., Sorzano, C. O., Marabini, R., Herman, G. T., & Carazo, J. M. (2005). Maximum-
likelihood multi-reference refinement for electron microscopy images. Journal of molecular biology, 348(1), 139-149.
2D classification
CTF correction
  particle をそのまま用いるのではなく , CTF の影響を補正した particle を用いて class average を作成する 
 いくつかの流儀が存在する

考え方: CTF(q)=0 となっている空間周波数情報の再生はできない。それ以外の部分をなるべく 1 に近づけたい。

~ ~
𝐹 {𝐼 (𝒓 ) }∝ 𝐹 {𝑉 ( 𝒓 ) }∙ 𝐶𝑇𝐹 (𝑞 )
2D classification
CTF correction

① phase flipping
2D classification
CTF correction

② multiply by CTF
2D classification
CTF correction

③ Wiener filter
未知の元信号 X(ω) にフィルタ H(ω) が掛かり , さらにノイズ N(ω) が加わったもの Y(ω) が得られたとき ,

G(ω) ・ Y(ω) として , 観測信号 Y(ω) にフィルター G(ω) を掛けることで元信号 X(ω) を復元したい
 → X(ω) と G(ω) ・ Y(ω) の二乗誤差を最小化するような G(ω) を見つけたい
2D classification
CTF correction

③ Wiener filter
Overview
3D initial model
これから先の処理には reference volume (initial model) が必要。

① pdb を適当に low-pass filter したものを用いる


② 種々の initial model generating algorithm によって生成したものを用いる
CL 法 (Common Lines), RCT 法 (Random Conical Tilt), SGD 法 (Stochastic Gradient Descent)

Probability の計算 ( ベイズ推定 ) のた


めの事前情報として , 2D classification
の alignment の結果を用いる

Punjani, A., Rubinstein, J. L., Fleet, D. J., & Brubaker, M. A.


(2017). cryoSPARC: algorithms for rapid unsupervised cryo-EM
structure determination. Nature methods, 14(3), 290.
Overview
3D classification
2D classification の 3 次元バージョンと考えて OK 。初めの classification もランダム。
(Reconstruction 用の reference は与える )

☆ Structural heterogeneity を classification するのが主目的。

2D classification では maximization step で class average を計算したが ,


3D classification では 3D reconstruction を計算する。

3D reconstruction は back-projection 法が基本。

RELION では , reconstruction 時に確率的重み付けや CTF correction を行う。

Back-projection
3D classification
三次元物体の二次元投影像は , 三次元物体のフーリエ変換像
の central section( 原点を通るような切断面 ) を逆フーリエ変換
したものと同じである。
Overview
3D refinement
1 つの 3D class に対して構造の精密化を行う。 Alignment parameter を特に細かく精密化する。

Expectation step, Maximization step でやることは 3D classification とほぼ変わらない。とにかく精密化する。

解像度計算には gold-standard FSC を用いる。


 ランダムに 2 分割した particle 群に対して独立に 3D refine し , それらの間の FSC を計算する方法。
 解像度の over-estimation や , overfitting を避けられる。
Overview
Movie refinement & Particle polishing
Movie refinement
  3D refinement の process を , “movie particles”( フレームごとの particle) に対して行う方法。

 → これまでの処理はすべて averaged particles に対して行っていたが ,


   フレームごとの差異を考慮することで , より high resolution を目指せる。

Particle polishing
 初めの方のフレーム
 → beam-induced movement の影響で質が悪い
 最後の方のフレーム
 → radiation damage の影響で高解像度成分に乏しい

じゃあ真ん中の方の動画フレームをたくさん生かしてあげればいいのでは ?
Movie refinement & Particle polishing
Particle polishing
 初めの方のフレーム
 → beam-induced movement の影響で質が悪い
 最後の方のフレーム
 → radiation damage の影響で高解像度成分に乏しい

B-factor :空間周波数に従った Fourier shell amplitude の減衰速度を表す


   

Relative B-factor()
 →全フレームを均等に考慮した reconstruction から計算された B-factor() と ,
  フレーム i のみを用いた reconstruction から計算された B-factor() について ,
→ 小さいほど減衰が激しい

各空間周波数のフレームごとの重みづけ因子 Scheres, S. H. (2014). Beam-induced motion correction


for sub-megadalton cryo-EM particles. Elife, 3, e03665.
Overview
Post-processing
3D refinement の際に生成された 2 つの half-maps に対して user-provided mask をかけて FSC 計算
→ final resolution の計算

B-factor sharpening
  B-factor :空間周波数に従って fourier shell amplitude が減衰する
 この減衰を補正すること
Overview

You might also like