t_kahi’s blog

KNIMEやCellProfiler、創薬に関する記事と,日々のメモです

2019-07-01から1ヶ月間の記事一覧

Europe PMCを利用してbioRxivのkeyword-based RSS Feedを作成する

こんにちは,@PKです. bioRxivなどpreprint serverの文献は,生命科学分野でも増加しています. このようなpreprintはPubMed検索では引っかからないので,どのように情報を収集するかを考えていました. 今回はEurope PMCを利用してkeyword-based RSS Feedを…

「ウェブ進化論 本当の大変化はこれから始まる 」を読みました

こんばんは,@PKです. 解析待ちながらTwitterを見ていたら,@kzfmさんのブログが上がっていました. blog.kzfmix.com 梅田望夫さんの「ウェブ進化論」という名著かつ古典があります。既に13年以上も前に出版された本ですが未読であれば読んでおくことをおす…

【KNIME】〈後編〉KNIMEでRandom Forest:Rのcaretパッケージを使ってRandom Forest

こんばんは,@PKです. これまでRandom ForestをKNIMEで行うためのノード紹介やパラメーターの最適化などを紹介してきました. www.t-kahi.com www.t-kahi.com 今回は〈後編〉ということで,これまで〈前編〉〈中編〉でKNIMEの専用ノードで行った処理を,Rのc…

【KNIME】〈中編〉KNIMEでRandom Forest:「Parameter Optimization」と「Cross Validation」の実行

こんばんは,@PKです. 前回の記事では〈前編〉KNIMEでRandom Forestということで,「Random Forest Learner/Predictor」を使って学習モデルの作成やテストデータの予測などを紹介しました. www.t-kahi.com しかし,実際にRandom Forestを行う際は,学習デー…

【KNIME】〈前編〉KNIMEでRandom Forest:「Random Forest」ノードを使ったWorkflowの紹介

こんばんは,@PKです. 以前,ブログで「Bootstrap」と「Decision Tree」についてそれぞれ紹介しました. www.t-kahi.com www.t-kahi.com このBootstrap SamplingとDecision Treeを組み合わせた機械学習の手法が「Random Forest」です. 今日は機械学習の手法…

【KNIME】データ解析の妥当性を検証する交差検証(Cross Validation)のKNIME Workflow

こんばんは,@PKです. 前回,決定木(Decision Tree)をKNIME Workflowで行う手法についてご紹介しました. www.t-kahi.com 今回は,前回ご紹介した決定木のWorkflowを使って,モデルの検証手法である,交差検証(Cross Validation)ノードの紹介をしたいと…

【KNIME】決定木 (decision tree) をKNIME Workflowで行う

こんばんは,@PKです. 前回の記事では線形判別分析(LDA)のKNIME Workflowをご紹介しました. www.t-kahi.com LDAは複数のクラスのデータを最も良く判別できるように線を引く,というイメージでした. 異なる判別分析の手法として決定木(decision tree)によ…

【KNIME, CellProfiler...】t_kahi's blog 記事まとめ

記事が増えてきて自身で探すのが難しくなってきたのでKNIMEとCellProfilerを中心に記事まとめを作成しました. 今後はこちらにもアップデートしていきます. KNIME KNIMEのインストール方法について KNIMEとデータ分析 KNIMEとデータ処理 KNIMEとデータベー…

【KNIME】線形判別分析 (Linear Discriminant Analysis) をKNIME Workflowで行う

こんにちは,@PKです. 今日は判別分析の一種である線形判別分析(Linear Discriminant Analysis)のKNIME Workflowについて紹介したいと思います. 線形判別分析(Linear Discriminant Analysis) とは KNIME Workflowの概要 「Linear Discrimination Analysis」…

【KNIME】KNIMEでBootstrap:母集団の統計量(中央値)のばらつきを考える

こんばんは,@PKです. 先日KNIMEで使用できるサンプリングノードに関する紹介をしました. www.t-kahi.com 今日はこの中でも,「Bootstrap sampling」を利用したBootstrap法を使って,母集団の統計量(今回は中央値)のばらつきを出すKNIME Worklowを紹介し…

【KNIME】KNIME Workflowのサンプリングノードについて

こんばんは,@PKです. KNIME Workflowでデータのサンプリングをする方法をいくつか調べていたのですが,主に3つのサンプリング手法のノードが提供されているようです. それぞれのノードを使った詳細なWorkflowは別の機会で紹介したいので,今回はそれぞれの…

【KNIME】複数のデータからそれぞれ最小・最大値を含む行を除くKNIME Workflow

こんばんは,@PKです. 同僚から相談があり,複数のデータからそれぞれ最小・最大値を含む行を除きたい,と相談があって調べていました. イメージとしては以下の通りで,それぞれの条件のデータから"Cell Count"が最小値・最大値のデータを除いて出力する,…