Top > 研究内容 > 健康増進技術研究チーム > 体形・健康データの統合検索システム開発

research

体形・健康データの統合検索システム開発

はじめに

近年、健康に関心の高い個人や企業を対象とした健康関連産業市場が拡大しています。 健康に関する情報は、家庭内のヘルスメータや血圧計などによって病院や健康診断以外の場面でも取得することができ、健康に関する情報は社会の至る所で計測され、分散して蓄積・管理される時代になってきました。 本研究は、今後社会で分散して蓄積されるPHR(*1)、すでに存在している情報やデータを当事者だけでなく第三者も再利用可能なようにデータベース化することを目的としています。

(*1) Personal Health Record。個人の健康情報のことで、個人がネットワークや情報技術を活用して、生涯にわたる医療・健康情報を管理することができる仕組み。

分散データ収集プラットフォーム

私たちが想定する健康関連サービスのイメージを図1に示します。 現在、健康関連サービスとして実施されているもの、これから実施が見込まれるものは多岐にわたっています。 その中でも体重の増加などに伴う体形の変化、加齢などによる運動器機能の低下、ストレスなどによる精神的な疲労の防止を取り上げて、図に示すような健康関連サービスを想定しました。 また、これらの健康関連サービスにはどのようなデータがあるのかを図2に示します。 医療の現場に近いところにあるデータとしては診療情報や投薬情報などがあり、社会で日常的に得られる情報としては体形、食事や運動などの生活・活動履歴があります。 これらの情報を有機的に連結することで、一人ひとりに適したサービスを提供することができるようになると考えています。

図1: 健康関連情報サービスのイメージ
図1: 健康関連情報サービスのイメージ
図2: 健康に関連する代表的な情報
図2: 健康に関連する代表的な情報

Top ∆

統合検索システム

開発した統合検索システムの概要を図3に示します。 統合検索システム(Data Warehouse, DWH) の構成と機能は以下の通りです。 (1)リレーショナルデータベース管理システム(RDBMS)で管理されるデータベースを仮想的にXMLDB(*2)として運用・管理するために必要な機能を有するミドルウェア(XML Facilitator)。 (2)実際にデータを蓄積・管理するRDBMS(今回はMicrosoft SQL Serverを使用しました)。 XML Facilitatorは、すでに社会で分散して存在しているデータベースからデータを収集するために、(3)それぞれのデータベースの仕様に合わせたLoaderと呼ぶソフトウエアを介して、必要なデータのみを抽出するように設定することができます。

(*2) XML文書をデータとして扱うデータベースのことで、必ずしも厳密なスキーマ定義を行わなくてよい。 リレーショナルデータベースに比べて拡張性が高いが、性能面で劣るとされている。

図3: 統合検索システムの概要
図3: 統合検索システムの概要

Top ∆

システムの検証結果

開発したシステムの機能・性能検証については、検証用クライアントPCからDWHに対してXQuery(*3)で全データを検索し、検索結果を検証用クライアントPC上に表形式で表示する外部アプリケーションを実行して、一連の処理が完了するまでの時間を計測して評価しました。 DWHおよび検証用クライアントPCに最大の負荷が掛かると考えられる全項目・全件検索に対して、キャッシュが有効な場合と無効な場合とに分け、4種類のデータセットおよび4種のデータセットを統合したデータセットを用い、それぞれの条件における検索および表示に要する時間を計測しました。 その結果を表1にまとめます。統合検索システムはキャッシュシステムを有効にすることで、実験室内のデータ処理には十分な能力があることが確認できました。

(*3) XMLデータ問合せのための問い合わせ言語。

表1: 全項目・全件検索の結果
表1: 全項目・全件検索の結果

まとめ

このテーマでは健康関連サービスで利用することを目的として、広く社会に分散して蓄積されている体形情報を含む健康情報を収集するシステムの開発を行っています。 このプロジェクトでは、主として数値データからなるこれらの情報を統合検索・統計処理する際に効率的に処理できるよう、XMLDBとRDBの特徴を併せ持つハイブリッド型の統合XML検索システムを開発しました。

参考文献

(1) 平成21年度中小企業支援調査委託費「人間特性データベース検索システム構築検証に係る調査研究」報告書、産業技術総合研究所、2010年2月
(http://www.meti.go.jp/meti_lib/report/2010fy01/E000923.pdf)

Top ∆