低分子がん治療薬を開発する中堅のバイオテクノロジー企業が、自社の実験データに関する課題の解決法を求めてエンソートに来社されました。課題の詳細、データ管理だけでなくその先を考えることの重要性、研究者が潜在的な研究対象をスピーディに解析できるようになったAIおよび機械学習を活用した技術的ソリューション、分析パイプラインの加速化により5億ドル超の投資確保が可能になった理由。

ハイスループットスクリーニングのデータを、モデリングと可視化により実用的な洞察に変革する
低分子がん治療薬を開発する中堅のバイオテクノロジー企業が、特注のハイスループットスクリーニング(HTS)プラットフォームを用いて、これまでは介入不可能であった腫瘍を対象に取り組みを行いました。 その中心を担うのは、非常に意欲的で、業界最高のがん治療を熱心に追求する研究者グループです。 彼らは、研究者が潜在的な研究対象をスピーディに解析できるようにするために、ハイスループットスクリーニングの結果を加速・共有する方法を求めて、エンソートにご相談くださいました。 分析パイプラインの加速化は、新たな投資の獲得とも関連していました。投資獲得は、競争の激しい製薬業界において一般的に重要な課題です。
発見を遅らせる共通課題
お客様独自のHTSプラットフォームのハードウェアとデータキャプチャは先だって運用が開始されていましたが、膨大な量のデータを解析するには、何千ものファイルから情報を集約する必要がありました。 あるファイルがどのフォルダに格納されているかが分かるだけでは、規定の実験結果を解析するのに十分なデータにはとうていなりえません。 お客様はこれらのファイルから情報を引き出す分析ルーチンを開発していましたが、その分析の正確性を評価し、複雑な分析結果を共有することは依然として大きな課題となっていました。 この分析ルーチンを開発した専門の研究者は、各研究者が実験結果を自分たちで評価できるようにするのではなく、その解釈を研究者全員に共有する責任も負うようになっていました。 さらに、実験データと分析結果において、データの意味や文脈が組織全体に一貫して伝わるような形でモデル化されていないため、分析結果についてチームが新たな問いをたてることができずにいました。
データ管理プラットフォームの限界
お客様はデータ管理のソリューションを求めてエンソートにご相談くださいましたが、エンソートは、データ管理は必須である一方で、それだけではお客様の最終的な研究・ビジネス目標を達成するのに不十分であると気づきました。 最終的には、上級研究者だけでなく組織内のすべての研究者が活用できる方法で、実験データと分析結果を迅速に集約し、可視化する必要がありました。 エンソートの科学に対する深い理解と革新的な発想力により、お客様はデータ管理について考えるだけでなく、研究者の実験データへのアクセス方法を変革するための計画を共同で開発することができました。
前臨床創薬研究の反復的性質を活用するための創造的なアプローチ
データサイエンティストや多くのプラットフォームプロバイダが、データをファイルやフォルダと捉えるのに対して、Enthoughtはデータモデルという観点から考えます。 科学的な実験や結果を記すファイルには何が書かれているのか? ワークフローのどのようなバリエーションが開発され、新しく追求される科学的課題は何か? この結果が、新たな実験の設計にどのような影響を与えるのか?
私たちは、科学者と協力して、彼らの実験と結果のためのデータモデルを開発することから始めました。 科学者が実験結果を真に理解するために可視化する必要のあるものについて、急ピッチで繰り返し共同作業を進めました。 私たちのアプローチは、ファイルやフォルダではなく、実験と結果を中心としたものでした。 また、今日的な疑問に答えるためにデータを可視化するだけでは、競争力を高めるのに不十分であることも分かっていました。 ラボは将来の疑問にも答えられなければなりません。 そこでこそ、真のイノベーションが起こるのです。 これに対して、科学研究開発に特化したクラウドネイティブのワークベンチ、Enthought Edgeが完璧な環境を提供しました。 私たちは、科学者の喫緊の疑問に答えるための専用のデータダッシュボードを構築することで、現行のワークフローの分析を最適化し、加速させました。 研究者データAPIを構築することで、研究者が分析用のデータモデルに自分たちのデータを読み込ませ、AIと機械学習を活用したプログラムによる探索、および新たな問いかけを可能にすることで、イノベーションを実現したのです。

分析を加速化し、コラボレーションを簡素化する目的別ツール
科学研究から洞察を得るには、単にファイルからデータを読み込むだけでは不十分です。 実験の内容や状況に依らず、多くの異なるソースからのデータを組み合わせる必要があります。 Enthought Edgeは、研究者がHTS実験データの結果をフィルタリングし、可視化できるようにするだけでなく、以下のものも可視化しました。
- オリジナルの生データ
- 化学構造と化学的性質
- 品質管理指標
- 化合物ライブラリ全体に対する化学記述子の分布
さらに研究者は、その分析を同僚と共有したり、フィルタリングしたサブセットを将来の分析のために保存したり、 研究者の選択したツール(Excel、Tableau、Python、Rなど)でのさらなる分析のために結果をエクスポートしたりすることが簡単にできるようになりました。
探索のためにこれらの大規模なデータセットを読み込むプロセスは、メモリ負荷も非常に高くなります。 Enthought Edgeでは、ユーザーがデータダッシュボードやJupyterの分析環境を拡張することができるため、次のような研究者のニーズにも対応します。
- メモリの増設により、複数の実験データを読み込み、集約・分析する
- CPUに負荷のかかる、クラスタリングアルゴリズムを活用する
- GPUアクセラレーションにより、機械学習モデルを訓練して実験する
研究者が用意したリソースを追加することも、科学者フレンドリーなデータAPIを用いて、データダッシュボードで以前に可視化されたデータに容易にアクセスすることも可能です。
さらに、IT主導型のデータ管理への転換期であることもお客様の課題でした。 新たに大規模なデータレイクを導入する長期計画もありましたが、 研究者は早急な解決を求めていました。 新たなデータレイクは長期的な目標を達成するために重要でしたが、実現するには時間がかかります。 そこで、すでにデータが存在する場所でそのデータを使えるよう、インポートツールを構築し、データソースへの接続できるようにしました。 Enthought EdgeのNative Application Frameworkを活用すると、基礎となるデータソースに少ない階層でつながったインターフェースによって、オンライン化された新たなデータレイクにも容易に対応できるため、科学者の研究を遅らせることがありません。

検索した分子記述子の分布を化合物ライブラリ全体と照らし合わせて比較する。
分析パイプラインの加速化により、5億ドルの投資を確保
多くのバイオテクノロジー企業と同様に、本件のお客様も節目ごとの厳しい資金繰りに直面していました。 私たちのソリューションにより、分析パイプラインの加速化・運用化が実現し、上級研究者が、研究開発チームの他のメンバーの結果を維持・共有するだけではなく、イノベーションを起こせるようになったため、5億ドル以上の潜在的投資の確保につながりました。
シェアする
材料研究開発ラボのニーズについて話しましょう。
研究開発ラボの課題解決にむけて、先進テクノロジーの活用をお考えの場合は、info@enthought.comまでご連絡ください。当社のライフサイエンスの専門家がご相談に応じます。