データ公開用ページ

HOME / データ公開用ページ

医学概念・知識連結データベース(以下、本データ)は、既存の医療・医学関連の辞書やリソースをまとめた大規模な医学概念・知識連結データベースです。本データは、電子カルテ(EHR)や患者記録(PHR)など様々なテキストから構造化された医療知識を抽出する情報収集・分析の基盤として応用することを目指して開発されています。

ここでは、本データの特徴、仕様、開発中のビューアー、詳細な仕様書を紹介します。

特徴
Features

主な特徴は以下の3つです。

1.人間用ではなくAI用

  • 人間用の辞書のように、意味や正しい用語を調べるためのデータではありません。
  • 医療用語の言い換えや、外部のターミノロジーへの変換を目的とした、AI用のデータです。

2.紐付け(リンク)のデータ

  • 医療テキスト内に出現する語の中で、一定以上の頻度で出現する語はすべて掲載しています。

3.AIと人手の協働による継続的なメンテナンス

  • 各エントリに付与された頻度・信頼度情報を利用してメンテナンスの優先度を把握できます。

本データは4つのサブデータから構成されます。

病名データ

症状や病名を収載。
ICD-10や11、標準病名などに紐付けが可能。

医薬品データ

医薬品名を収載。
一般名、ATCコード、KEGGコードなどに紐付け可能。

部位データ

人体部分表現を収載。
代表的な解剖学辞書の表現に紐付け可能。

検査データ

検査表現を収載。
代表的な臨床検査項目の分類に紐付け可能

仕様
Specification

属性情報

ラベル 概要 タイプ
基本情報 ID 出現形に対応する一意に割り当てられたID。 文字列
出現形 医療テキストから抽出した、用語の出現形(ユニーク)。 文字列
出現形よみ 出現形のよみ 文字列
正規形 出現形の標準的な表現。何を正規形とするかはサブデータによる。
例えば、病名であれば標準病名。医薬品であればKEGG一般名としている。
出現形に対して複数の正規形が該当する場合、最大3つまでを半角セミコロン (;) で接続し列挙する。
文字列
TREE 最大4桁の記号による分類。ビューアー使用時のツリー構造の表示に用いる。 文字列
翻訳情報 出現形EN 出現形の英語訳。 文字列
出現形ZH 出現形の中国語訳。 文字列
関係情報 REL:IS-A 上位下位関係。 文字列
REL:PART-OF 部分全体関係。 文字列
REL:CAUSAL 因果関係。 文字列
その他 用語難易度 用語の難易度 整数
YEAR エントリの収集年度 整数

リンク先候補

リソース名 概要 リンク
TO:日本医学会医学用語辞典 日本医学会が出版している日英辞書。   見出し語 ✔️ ✔️ ✔️ ✔️
各種厚労省標準マスター関連用語集 MEDISが公開しているマスター。   ✔️   ✔️  
TO: CLIDAS 循環器に関する臨床情報データベース。   ✔️      
TO: J-CaseMap 自治医科大・東大が開発している辞書。   ✔️      
TO:Lilak 医学知識連結DB。 東京大学が開発したオントロジー。 疾病名または部位コード ✔️     ✔️
TO:薬効分類 総務省が定めた日本標準商品分類番号にしたがって分類された、
医薬品の効能に関する分類。
分類番号   ✔️    
TO:JAPICID 医薬商品に関するコードへの紐付け。     ✔️    
TO:KEGGエントリ 京都大学が管理している医薬品DBへのID。 エントリID   ✔️    
TO:PubChem アメリカNCBIが管理する化学物質データベースのID。 SID   ✔️    
TO:ATC WHOによる薬品の分類コード。 ATCコード   ✔️    
TO:JLAC10 日本臨床検査医学会が制定した臨床検査項目の分類コード(第10回改訂版)       ✔️  
TO:JLAC11 日本臨床検査医学会が制定した臨床検査項目の分類(第11回改訂版)          
TO:ICD-10 WHOが制定した国際的な病名分類(第10回改訂版)。 ICDコード ✔️      
TO:ICD-11 WHOが制定した国際的な病名分類第11回改訂版)。 ICDコード ✔️      
TO:HPO Human Phenotype Ontology (HPO) 研究用のフェノタイプ用語集。 ID ✔️      
TO:SNOMED-CT-IPS SNOMED-CTの縮小版。SNOMED-CT/International Patient Summary Terminology ID ✔️      
TO:MedDRA/J 医薬品規制調和国際会議(ICH)が制定した医薬用語集の日本語版。 見出し語 ✔️      
TO:UMLS アメリカNLMが公表している、医療概念のメタシソーラス。CUIを収載。 ID ✔️ ✔️ ✔️ ✔️
TO:一般名処方マスタ 厚生労働省が策定している医薬品の一般名処方の標準的な記載。 一般名コード   ✔️    

信頼度

信頼度 概要
S 信頼度最大。既存のリソースと照合済み。
A 信頼度高。人間3名以上がチェック済。
B 信頼度中。人間2名がチェック済。
C 信頼度低。人間1名がチェック済。
D 信頼度低。自動推定された結果。

公開スケジュール
Schedule

今後の公開予定は以下の通りです。

step
1

2025年3月までに第2版

step
2

2025年8月から正式ライセンス開始

サンプルデータ・アプリケーション・API
Sample data / Applications / API

サンプルデータ

サンプルデータ

頻度上位の一部データを公開しています.こちらからダウンロードできます.

KnitBoat

KnitBoat

メンテナンスのためのWEBアプリケーション。「KnitBoat」を開発しています。ユーザーはKnitBoat上でデータを閲覧し、修正が必要な箇所にコメントを付けたり、データを編集して修正することができます。

スマートフォンビューアー

スマートフォンビューアー

閲覧およびコメント用の環境として、スマートフォンで動作するビューアーを開発しています。ユーザーは用語を検索してデータを閲覧したり、エントリに対してコメントを付けることができます。ビューアーは App store や Google Play で公開する予定です。

スマートフォンビューアー

API

外部アプリケーションとの連携を想定しAPIを開発しています。

マニュアル・仕様書・QA
Manual / Document / FAQ

医学概念・知識連結データベース詳細仕様書

本データの詳細な仕様およびメンテナンスの手法を記載しています。

SIP3医学概念・知識連結データベースとは

本データの特徴・概要を記載しています。

利用・申し込み方法
How to use

準備中

更新情報
Updated information

2024/09/06 サイトを公開しました。

PAGE TOP