• こんにちは!

    医療用医薬品の添付文書の提出形式がSGMLからXMLに変わって少し経ちました

    徐々にPMDAに登録されるファイルもXML形式が増え始めてきていますが、結局のところ、XMLになったらどんないいことがあるの?と思われている方も多いのではないでしょうか?

    そこで、印刷会社のシステム屋としての観点からXMLとはなんなのか、どんなふうに役立つのかを数回に分けて書いていきたいと思います

    よろしくお付き合いください

  • XMLの概要

最初から少し固い話になりますが、そもそもXMLとは何なのでしょうか?

XMLの正式名称はExtensible Markup Language(エクステンシブル マークアップ ランゲージ)です

ウェブページに使われているHTML(Hyper Text Markup Language)と後半は同じですね

マークアップ言語、つまり文字をタグで囲って構造化する=マークアップする言語です

<h1>タイトル</h1>

のように、山括弧のタグで囲うことでその文字が何を表しているのか、どういう用途なのか等を明示する言語です

Extensibleは「拡張可能な」という意味ですので、つまり、用途に応じて好きなようにタグを定義していいよ、というのがXMLの大雑把な定義になります

医療用医薬品の添付文書XMLの場合、たとえばPreparationOrRevisionというタグが改訂情報を入れるタグですよ、という風に定義され、利用されています


【医薬品添付文書XMLの構造例】

<DateOfPreparationOrRevision>             --改訂年月情報
 <PreparationOrRevision id="今回">          --今回改訂の情報
  <YearMonth>2021-07</YearMonth>          --改訂年月
  <Version>                       --版数
   <Lang xml:lang="ja">第1版</Lang>
  </Version>
 </PreparationOrRevision>
</DateOfPreparationOrRevision>
  • XMLのメリット

XMLの利点は機械的に解析しやすく、扱いやすいことです

表に見えている2021-07だけでは今回の改訂年月なのか、前回の改訂年月なのか、販売開始月なのか、はたまた何かの数式なのかは前後関係や出現位置で推測するしかありません

人間が見れば一目瞭然であっても、機械的に判定しようとすると一筋縄ではいかなかったりします

それがXMLでタグで囲っておくことで簡単に確実に取り出せるようになります

  • XMLの活用事例

  1. Microsoft Officeのファイル形式

    ワードやエクセルを2000年台前半からお使いの皆様は、昔はdocやxlsだったファイル形式が、2007以降docx, xlsxに変わったことはお気づきの方も多いと思います

    この末尾についた”x”はXMLの”x”の意味です

    doc時代はMicrosoft自身のソフトだけが扱えればOKとなっていたファイル様式が、XML形式になったことで、互換ツールを他社が開発することが可能になったのです

  2. メーカーのカタログ作成

    ベースとなる製品のXMLデータのみを作成し、その形式を変換することで、HTML、紙カタログ、あるいはCD-Rなど様々な形式に変換することができます

    入力元を一つにすることで改訂時の記載・転記漏れが軽減される上に、校正の回数も減らすことができ、更新の完了までのスピードを上げることができるようになりました

  • 長くなってしまいましたが、XMLは各システムごとに拡張が容易ながらも、他システムで読み取り・再利用することが可能なファイルということがおわかりいただけたでしょうか?

    つまり、XMLは、データを二次、三次に利用するのに優れたファイル形式であるといえます

    次回は、添付文書XMLをHTMLやワードへ変換することについて解説します

NEXT >>