t_kahi’s blog

KNIMEやCellProfiler、創薬に関する記事と,日々のメモです

【CellProfiler】薬理活性化合物を処理した細胞染色画像から特徴量を抽出する①

こんにちは,@PKです.

mishima.syk13で,CellProfilerで画像解析をしたデータをKNIMEを使って可視化する,という取り組みについて発表する機会をいただけました.
拙い内容でしたが皆さんから意見や感想をいただくことができて本当に勉強になった一日を過ごすことができました.是非また参加させてください(次はより良いものをお見せしたい…)

さて,以前のブログで画像データとメタデータの取り扱いについて紹介をしました.

t-kahi.hatenablog.com

今回から、ここで取り上げた画像データセットを用いて,CellProfilerを使って細胞から様々な特徴量を抽出する取り組みを紹介していきます. (ちょっと分量が多いので2回に分けました)

はじめに

CellProfilerのパイプラインの説明をする前に,mishima.sykで発表した画像処理から可視化までの全体像を紹介します.

f:id:t_kahi:20190220233904p:plain

まず,オープンソースのデータベースからU2OS細胞に薬理活性化合物を処理し,5重染色して撮影した画像とメタデータセットを用意します.
続いて, CellProfilerで薬剤処理をした細胞の染色画像から特徴量を抽出します.一方で,薬理活性化合物の作用メカニズム情報をChEMBLから取得しておきます.
最後にKNIME上で取得した特徴量(~400)とメカニズムのデータを統合し,データの可視化を行います.

これまでのブログでいくつかの処理について紹介してきました.
【CellProfiler】Metadataモジュールを使って,画像とアッセイ情報を紐付ける - t_kahi’s blog
【KNIME】化合物情報を基にChEMBLから作用メカニズム情報を取得する - t_kahi’s blog

今回はこの一連の処理の中でもCellProfilerを用いた特徴量を抽出について紹介していきます.
f:id:t_kahi:20190220235000p:plain

使用する画像データやメタデータに関する説明はこれまでのブログでお話しているので,興味がある方はぜひ見ていただけると嬉しいです.
(更にご意見もいただけるとなおうれしいです)

この画像解析に関しては以下の論文の画像データセットを使わせていただいております.

Multiplex Cytological Profiling Assay to Measure Diverse Cellular States

BBBC022: Human U2OS cells – compound-profiling Cell Painting experiment

画像解析パイプラインの概要

それでは,CellProfilerのパイプラインの概要を紹介していきます. 以下の図で,画像解析のパイプラインと簡単な説明を示しています. f:id:t_kahi:20190221000359p:plain

このパイプラインでは大きく分けて4つの処理を行っています.

  1. 画像とメタデータを読み込む
  2. 核・核小体・ミトコンドリア・小胞体・ゴルジ体・細胞質のオブジェクトを認識する
  3. 核オブジェクトのシグナル強度値やサイズ・形状・テクスチャーを測定する
  4. 測定した結果を出力する

1.に関しては既に紹介しておりますので,今回は割愛します.2-4の処理の流れを簡単に説明していきます.

ちなみに染色画像の一例として,mockの細胞における各染色画像を以下に示しています. 細胞質のマーカーであるアクチンとゴルジ体は同じチャンネルで撮影されていたので,5チャンネルで計6つの細胞小器官や細胞質をラベルしています.

f:id:t_kahi:20190221003107p:plain

オブジェクトの紹介

ここでは核・核小体・細胞質のオブジェクト認識の部分まで紹介します.

核オブジェクトの認識

それでは核オブジェクト領域の設定について紹介します.

IdentifyPrimaryObjectの設定は以下の通りです.
f:id:t_kahi:20190221005252p:plain

この領域設定のパラメーターは完全な正解はなく,解析者が解析したいオブジェクトを認識できているかどうかが重要となるので,少しずつ値を変えていきながら一番良いパラメーターを設定していきます.
自分もまだまだな点が多いので,いろんな論文を参考にしながら経験を積んでいこうと思っています.

実際に,プレ解析を行い,核の領域が認識できているか確認すると,以下のように核オブジェクト領域を認識できていることがわかります. f:id:t_kahi:20190221005309p:plain

核小体オブジェクトの認識について

核小体のオブジェクトは,以下のブログで紹介した細胞内の粒子を解析するパイプラインを参考にして,「EnhanceOrSuppressFeatures」「MaskImage」を組み合わせてオブジェクト認識をしました.

t-kahi.hatenablog.com

実際に解析すると,以下のように核小体のドット状のオブジェクトを認識できていることがわかります. f:id:t_kahi:20190221072450p:plain

この後,核と核小体を「RelateObjects」で紐付けて,どの核にどの核小体がいるのかをの情報を取得します.

細胞と細胞質オブジェクトの認識について

この処理では,「IdentifySeondaryObjects」でアクチン染色画像から,細胞のオブジェクトを認識し,その後,「IdentifyTertiaryObjects」で核の部分を除いた細胞質のオブジェクトを定義します.

【CellProfiler】Example pipelineで画像解析の基礎を学ぶ④ - t_kahi’s blog

各オブジェクト認識のパラメータ設定は以下の通りです.
以下にオブジェクト認識のパラメータ設定と,細胞・細胞質の領域の解析結果を示しています.
f:id:t_kahi:20190221080257p:plain f:id:t_kahi:20190221074451p:plain 一応,細胞質を認識できていそうなので安心ですね…

最後に

中途半端になってしまいましたが,細胞内の小器官であれば、目で見ている範囲と同じ領域を抽出できているように感じました. もう少し凝ったオブジェクトですと,オブジェクトの定義の部分で時間がかかりそうですが,,まだCellProfilerで取り組んだことはないですね…

ミトコンドリアのオブジェクト認識以降の処理は次のブログで紹介します.