最初から少し固い話になりますが、そもそもXMLとは何なのでしょうか?
XMLの正式名称はExtensible Markup Language(エクステンシブル マークアップ ランゲージ)です
ウェブページに使われているHTML(Hyper Text Markup Language)と後半は同じですね
マークアップ言語、つまり文字をタグで囲って構造化する=マークアップする言語です
<h1>タイトル</h1>
のように、山括弧のタグで囲うことでその文字が何を表しているのか、どういう用途なのか等を明示する言語です
Extensibleは「拡張可能な」という意味ですので、つまり、用途に応じて好きなようにタグを定義していいよ、というのがXMLの大雑把な定義になります
医療用医薬品の添付文書XMLの場合、たとえばPreparationOrRevisionというタグが改訂情報を入れるタグですよ、という風に定義され、利用されています
【医薬品添付文書XMLの構造例】
<DateOfPreparationOrRevision> --改訂年月情報 <PreparationOrRevision id="今回"> --今回改訂の情報 <YearMonth>2021-07</YearMonth> --改訂年月 <Version> --版数 <Lang xml:lang="ja">第1版</Lang> </Version> </PreparationOrRevision> </DateOfPreparationOrRevision>
XMLの利点は機械的に解析しやすく、扱いやすいことです
表に見えている2021-07だけでは今回の改訂年月なのか、前回の改訂年月なのか、販売開始月なのか、はたまた何かの数式なのかは前後関係や出現位置で推測するしかありません
人間が見れば一目瞭然であっても、機械的に判定しようとすると一筋縄ではいかなかったりします
それがXMLでタグで囲っておくことで簡単に確実に取り出せるようになります
-
Microsoft Officeのファイル形式
ワードやエクセルを2000年台前半からお使いの皆様は、昔はdocやxlsだったファイル形式が、2007以降docx, xlsxに変わったことはお気づきの方も多いと思います
この末尾についた”x”はXMLの”x”の意味です
doc時代はMicrosoft自身のソフトだけが扱えればOKとなっていたファイル様式が、XML形式になったことで、互換ツールを他社が開発することが可能になったのです
-
メーカーのカタログ作成
ベースとなる製品のXMLデータのみを作成し、その形式を変換することで、HTML、紙カタログ、あるいはCD-Rなど様々な形式に変換することができます
入力元を一つにすることで改訂時の記載・転記漏れが軽減される上に、校正の回数も減らすことができ、更新の完了までのスピードを上げることができるようになりました
XML活用のすゝめ ②XMLを他の形式へ変換 その1
添付文書XML, ブログ