DTD |
対語表XML用のDTDは、dtd/glossary.dtdで、その内容は以下になります。
<!ELEMENT glossary (alphabet+ | term+)> <!ELEMENT alphabet (term+)> <!ATTLIST alphabet initial CDATA #REQUIRED> <!ELEMENT term (en, ja, category, spec?, note?, erratum*, link?)> <!ELEMENT en (#PCDATA)> <!ELEMENT ja (#PCDATA)> <!ELEMENT category (#PCDATA)> <!ELEMENT spec (#PCDATA)> <!ATTLIST spec name CDATA #REQUIRED> <!ELEMENT note (#PCDATA)> <!ELEMENT erratum (#PCDATA)> <!ELEMENT link (#PCDATA)> <!ATTLIST link href CDATA #REQUIRED>
これにより、対語表XMLは、以下のようになります。
<?xml version="1.0" encoding="Shift_JIS"?> <!DOCTYPE glossary SYSTEM "dtd/glossary.dtd"> <glossary> <alphabet initial="A"> <term> <en>absolute property</en> <ja>絶対プロパティ</ja> <category>XSL</category> <spec name="JIS">絶対特性</spec> </term> <term> : </term> : </alphabet> <alphabet initial="B"> : </alphabet> : <alphabet initial="Z"> : </alphabet> </glossary>
XMLファイル自体は、シフトJIS(SHIFT-JIS)で保存します。ルート要素はglossaryで、その子供要素としてalphabetを持ちます。alphabet要素には必ずinitial属性を指定しなければならず、その値としてAからZのうち1つのアルファベットを指定します。つまり、頭文字がinitial要素で指定されたアルファベットで始まる英単語毎に、alphabet要素にまとめるようになっています。
各alphabet要素は、子供要素としてtermを持ちます。term要素が、1つ1つの対語の詳細情報となります。term要素内の各要素は、以下のような情報を指定します。
en [必須] |
対語訳に登録する英語を指定します。
ja [必須] |
en要素で指定した英語の対語となる日本語を指定します。
category [必須] |
この英語が用いられる仕様や分類を指定します。また、対語訳は、複数存在する日本Apache XMLプロジェクトのサブプロジェクトで共通で使用するため、その意味での分類を指定することもあります。
値は特に規定されていませんが、以下のような情報を入れると良いです。
-
- 該当するW3Cの仕様
- 例えば、XML、XSL、XPath、HTML、SOAPなど
-
- The Apache XML Projectのサブプロジェクト名
- 例えば、FOP、Cocoon、Axis、Forrestなど
-
- The Apache XML Projectのサブプロジェクトで関連する仕様
- 例えば、PDF、PS、RFCなど
-
- The Apache Software Foundation内のプロジェクトやサブプロジェクト
- 例えば、Apache、Jakarta、Tomcat
-
- Javaに関連する分類
- 例えば、Java、J2EEなど
- その他、日本Apache XMLプロジェクトに関連する分類
spec [任意] |
対語訳に登録する日本語が、category要素で指定した仕様や分類で使用されている日本語と異なる場合に指定します。
日本Apache XMLプロジェクトでは、基本的には、category要素で指定した仕様の日本語版に合わせるようにしますが、そのcategory要素で指定した仕様の日本語に無理がある場合などは、日本Apache XMLプロジェクトで使用する日本語をja要素に、category要素で使用されている日本語を本要素に記載します。
note [任意] |
注意書き、単語の意味や説明を記載します。単語の意味や説明をしっかりと記載すれば、対語訳でなく辞書として使用できるようになるでしょうが、気が向いたら記載する程度で良く、本要素は特に必要ないです)。
erratum [任意] |
対語訳として適していない日本語を記載します。erratum要素は、term要素内に複数指定することができます。
link [任意] |
対語訳を決める際の元となった資料を指定します。link要素には必ずhref属性を指定しなければならず、資料のURLを指定します。