ソリューション概要
近年のライフサイエンス分野では、多種多様な実験機器による研究が進む一方、出力されるデータは機器ごとに接続方式や拡張子、フォーマットが異なります。そのため、研究者は実験データの取得、整形、統合を手作業で行わざるを得ない現状があります。
「Tetra Data Platform」は、これらのデータを高度解析の実現に向け強力に支援するAWSネイティブのデータプラットフォームです。 「Tetra Data Platform」は、実験機器ごとに出力される実験データを自動集約、汎用的なデータフォーマットに変換・統合することが可能。研究現場での課題を解決します。
- 解析の民主化
- 高度解析の実現
研究現場での課題とその解決方法
研究過程で生産されるデータソースはさまざまで、拡張子やフォーマットも多種多様です。研究者がこれらのデータを活用し高度解析を実現するためには、自らマニュアルで各種データソースを取得・加工・標準化作業を行い、解析ツールや電子実験ノートなどにデータを渡す必要があります。これには膨大な時間が必要で、また人為ミスが発生するため、信頼性の観点からも問題です。さらに、リアルタイム性に欠けます。
このような理由から、実際には研究データを活用した高度解析が行われていないのが実情です。
データ活用における課題
実験データはサイロ化状態で活用したいデータにアクセスすることが容易ではない
各機器メーカ毎にフォーマットが異なっており、データの取得が困難
一部の機器メーカは独自のデータ管理ソフトウェアを提供しているが、データの取得が困難
機器から出力されるデータは多種多様、例えばXML .CSV .PNG .RAW .TIF .BAM .PDF .SAMなど
機器毎にフォーマットが異なるので、データを比較検討できない
高度解析のためのデータ取得・加工・フォーマット変換をマニュアルで行わなければならない
実験が行われてから解析ができるまでタイムラグが生じる
進化する機器への継続的な対応が研究者では不可能
課題解決
すべてのデータをData Lakeに格納し、研究者が自由に引き出せる状態にする(カタログ化)
異なる機器から自動でデータを取得するためにコネクターを活用する
メーカ独自のソフトウェアから全てのデータを自動で入手するエージェント+コネクターを活用する
全データをJSON形式に自動変換する
JSON化されたデータを機器の種別毎のデータスキーマに格納することでデータのハーモナイズを行う
データ処理のパイプラインにより、取得・加工・フォーマット変換を自動化する
データパイプラインにより、実験データが生産されると取得・加工・変換などの処理をリアルタイムで行う
機器の進化に対応すべくコネクターがバージョンアップしていく仕組みにする
「Tetra Data Platform」の特長
実験から高度解析まで
リアルタイムに実施
Tetra Data Platform(TDP)は、機器メーカーごとに異なるフォーマットやDMSに対応するため、さまざまな機器に対応するコネクターが用意されています。
- 実験が行われデータが生成されると、コネクターが自動でデータを取得します。
- 取得されたデータはJSON形式に変換され中間データスキーマに格納されることで、データのハーモナイズを実現します。
- さらに、各種処理のデータパイプラインを用意することが可能で、データの品質チェック、加工、フォーマット変換、データ統合など、さまざまなシーンでデータを活用することを強力に支援します。
- Tetra Data Platform(TDP)全体像
①~④の詳細は以下をご覧ください
1プリセットデモ
DataHub Host Machineが、データの収集のためのコネクターや各File-Log Agentを使ってデータを自動収集します。大別して以下の3つの方法でデータを取得します。なお、対応する実験機器・DMSは、200種類以上におよび、適時追加されるとともに、お客さまのご要望により開発することも可能です。
大別して、以下の3つの方法でデータを取得します。
1機器メーカが提供しているDMSからのデータ取得
Empower、Unicorn、LabXなど各ソフトウェアにネイティブなSoftware Agentが、実験データを自動収集します。

2ファイルシステムからのデータ取得機器メーカが提供しているDMSからのデータ取得
File Agentが、指定されたフォルダーからアップロードされたファイルを自動取得します。
ファイルを出力する機器やCRO/CDMOとのデータのやり取りで用いられます。

3ネットワーク非接続の機器
IoT Agent(Wifi搭載のデバイス)が機器からデータを取得します。

対応機器・DMS一覧(随時更新)
- A&D Balances
- AB-SciEx P800+
- Advanced Instrument Osmometer
- Agilent ChemStation, OpenLab CDS
- Agilent 400-DS; 4200 TapeStation, 6490 Triple Quad MS; SEC-MALLS 2; TRS100 Raman
- Spectrometer; UV-VIS Spectrophotometer
- AGU Sm@rtline Data Cockpit (SDC)
- Alfa Vet Excel
- Applied Photophysics Chirascan Plus CD
- Azure Gel Imager
- Beckman Coulter Vi-CELL Cell Counter
- BD Symphony, FACSDiva, FACSCanto, AriaFusion
- Benchling ELN export
- BioTek ELX808, Gen5, Synergy2 Plate Reader
- BMG Labtech STAR (Clario, Fluo, Nephelo, Spectro)
- BOX File Share
- Bruker Sierra SPR32
- Charles River Endoscan V EndoSafe Nexus
- Cubian CA-90 Analyzer
- Cytiva Biacore 4000 SPR
- Cytiva UNICORN (AKTA Micro, Avant, Express, Pure)
- Dotmatics Nucleus, Studies, Register
- Egnyte File Share
- ForteBio Octet HTX
- Fluid Imaging Technologies FlowCam
- Hamilton Vantage handler; Microlab series
- Hanna pH Meter
- HighRes BioSolutions Cellario
- Hitachi SU5000 Scanning EM
- IDBS EWB 10.4+ (pull, push)
- Infors Shaking Incubator
- Inheco On-Deck Thermocycler
- Intavis MultiPep2 synthesizer
- Intellicyte iQUE3 Cytometer
- Leica microscopy files
- LiCONiC CO2 Incubator
- Lighthouse FMS moisture analyzer
- Luminex xPONENT; MagPix, FlexMap 3D
- Malvern MasterSizer 2000, 3000; PANalytical Empyrean XRPD
- Matrix Scientific Mascot Proteomics
- MesoScale Discovery QuikPlex SQ120
- Mettler-Toledo Balances and LabX
- MetroOhm KF-Coulometer
- Molecular Devices SpectraMax
- MTS Insight
- Nanotemper Prometheus DSF; Monolith
- PerkinElmer Envision plate reader; LabChip GxII Touch, Microbeta 2, Operetta CLS; Quantalus scin * counters; TopCount NXT
- PharmatronAG Disitest 50
- Pion Dissolution Apparatus
- ProteinSimple iCE; Maurice
- Radiometer ABL90
- Renishaw WiRE; Invivia Raman Microscope
- Roche Cedex Bio, HiRes, and BioHT
- Roche Diagnostics Cobas B221
- Sartorius Balance, Sartorius IntelliCyt iQUE3; IncuCyte S3;
- Siemens RapidLab BGA
- Sony Sorter SH800 FACS
- Solace connector
- Sotax 8M, AT70, DT50, ST50, TPW3 tablet dissolution
- Sysmex Hematology Analyzer XN-V; XT-2000i
- TA Instruments DSC; VTI-SA vapor sorption; TGA Q500; TRIOS DSC
- Tecan Sunrise Plate Reader; FreedomEVO, Evoware
- TeledyneHanson Vision Elite8 Dissolution
- ThermoScientific Attune NXT Flow Cytometer; Chromeleon, Easy nLC UPLC; Fluoroskan, HeraCell; OHAUS, Orbitrap, Q-Exactive; QuantStudio, Varioskan; , Velos Pro, Viia7 qPCR, Xcalibur
- Unchained Lab Lunatic
- Waters Empower; Acquity UPLC and MS; MassLynx / TargetLynx; Synapt & Xevo MS; UNIFI
- Windows File Share
- Wyatt DynaPro Dynamic Light Scattering; SEC-MALLS
- YSI Biochemical Analyzer
2データハーモナイズ
全データをJSON形式に自動変換し、JSON化されたデータを機器の種別毎の中間データスキーマに格納することで、データのハーモナイズを実現します。

ハーモナイゼーションのための中間データスキーマ(IDS)を提供
データソースとターゲットを切り離す!
3データ処理(Data Pipeline)
Data Pipelineとは、AWS S3上で管理されているデータに対し、さまざまな処理を自動化するETL機能です。
S3にデータが転送されるとAWSのSNSによってTriggerが働き、指定されたPipelineが自動的に処理を実行します。 このData Pipelineはさまざまな用途で用いられます。
- データの品質チェック(欠損やプロトコール逸脱など)
- 解析に必要な異なった機器からのデータの収集やマージ
- 高度解析のためのデータ変換(解析ツール、ML、ELNなどでの活用)
- DWHなど外部システムへのデータ受け渡し
- サンプル管理システムからのデータを受け取り、Data Lake内の情報の強化
- ロボティクス・コントロール
- 定型レポートの自動作成

4データカタログ
取得したすべてのデータを、Web I/Fから直接検索することが可能です。viewのカスタマイズも容易で、さまざまなフィルターを組み合わせることで、情報を的確に確認することができます。
また、画面よりPipelineのモニタリングもでき、データ処理の進捗をタイムリーに把握することも可能です。

5AWSネイティブ
Tetra Data Platform(TDL)は、約30種類のAWSのコンポーネントから構築されており、非常にセキュアなデータの取り扱いを実現しています。

Tetra Data Platformの導入ならCTC
CTCは、ライフサイエンス分野で医薬品の開発を長年支援してきた経験とノウハウを活かして、実験機器との接続やデータ処理のワークフロー設計、実験データを活用するための解析ツールや電子実験ノートなどのアプリケーションとの連携を支援します。
今後、機械学習や自然言語処理などのAIを含めたサービス拡充や、化学品及び素材開発での活用も視野に入れ、Tetra Data Platformを利用したDXに貢献していきます。
先ずは、下記のお問合せフォームからお気軽にご連絡ください。
Tetra Science社について

TetraScience, Inc.(Chairman & CEO:Patrick Grady、本社:アメリカ合衆国マサチューセッツ州) は、ライフサイエンス分野における研究開発業務の変革、創薬の促進、QOLの改善と長寿命化をミッションとした開発関連のデータクラウド提供企業です。
CTCは、同社の実験データ統合基盤「Tetra Data Platform」について、国内で初めて販売代理店契約を締結し、提供を開始しました。実験機器ごとに異なる拡張子やフォーマットで出力されるデータを、汎用的なデータフォーマットに変換して統合。ライフサイエンス関連の企業や研究機関を中心に展開し、創薬におけるデータ活用を支援します。