(2) 主要な電子化技術の概要
主要な電子化技術として、SGML、HTML、XML、PDFについて、それぞれの技術的な概要について説明する。
ア SGML
文書構造を記述するための国際標準規格(ISO8879,JISX4151)。
SGMLで作成された文書は「SGML宣言」「文書型定義(DTD)」「文書インスタンス(文書内容そのもの)」の3つから構成される。
SGML宣言は、コンピュータ側に対する宣言文であり、SGML文書を表示させるコンピュータのハードウェアやソフトウェア(OSなど)のプラットホームの制約を受けないために必要になる。
文書型定義は、文書中に出てくる各項目の出現回数や属性及び各項目の深さ(階層の深さ)などの文書構造を示す設計図である。会議議事録を例にとって文書構造を説明すると、通常議事録はあらかじめフォーム(記入項目やレイアウト)が決まっており、記入項目のうち例えば議題項目は1つ以上存在するなどの出現回数や属性を持つ。また、本文は第1章の中に第1節、第1項のようにツリー構造で表現される。このような文書構造を文書型定義として規定しておくことにより、異機種間での文書交換や検索性、再利用性等の向上を可能にすることができる。
文書インスタンスは、通常の文書の中味であり、文書中に文書型定義に基づいたタグを付与する。
大まかなSGML文書作成の流れは、まず文書型定義(DTD)を作成し、その定義に基づいたタグを付与しながら文章を記述していくことになるが、各種のツールを活用して作成する方法が一般的である。なお、既にワープロなどで作成されている文書を、SGML文書に自動変換するツールも存在する。ただし、ワープロの書式定義からSGMLタグへの対応付けの難しさなどのため、完全な自動変換が可能なレベルには達していない。
イ HTML
WWWのホームページを記述するための言語。テキスト文書中にHTMLタグを付加することにより、タイトルや見出し、文字の色や大きさなどのレイアウトを表現できる、また画像やリンクなどを組み込むこともできる。
HTMLは、基本的にSGMLからの応用形であるが、主な相違点として以下のものが挙げられる。