この記事と関連の高い記事
関連キーワード:文書構造化- デベロッパーズコーナー:エンジニアのためのXMLスキーマ講座 III(4)
- デベロッパーズコーナー:エンジニアのためのXMLスキーマ講座 III(2)
- ビギナーズコーナー:SGML再入門 (2)-3
- ビギナーズコーナー:SGML再入門 (2)-2
- ビギナーズコーナー:SGML再入門 (2)-1
ホーム > X-Plus > XML Square > デベロッパーズコーナー > エンジニアのためのXMLスキーマ講座
1.はじめに
3.STEP2:要素を洗い出す
|
STEP2以降では実際にサンプルのデータの分析を行っていきます。
STEP2では、データの分析の最初のステップとして、サンプルとして集めたデータを構成している要素を洗い出します。この作業は実際の作業においては最も時間と手間がかかる部分です。なぜなら、多くのサンプルデータから想定し得るあらゆるパターンを考慮しなければならないからです。
ではこの電子メールのサンプル文書の構成要素を洗い出してみましょう。
まず、この「電子メール」そのものが最上位の要素として考えられるでしょう。1行目の「重要度」は「電子メール」に付帯する情報と考え、「重要度」は「電子メール」要素の属性とします。
次に、2行目以降の「送信元」「宛先」「cc」「bcc」の4行は、それぞれが要素として存在することができそうです。そして、これらの4行をよく見てみると、それぞれ送信者や宛先の人の「名前」と「メールアドレス」を含んでいることが分かります。この「名前」、「メールアドレス」も要素として考えましょう。
6行目の「件名」も電子メールに欠かせない部分です。では「件名」も要素とみなすことにしましょう。
7行目以降は「本文」です。これもひとつの要素とみなします。また、本文中には幾つかの「段落」が存在していることがわかります。ではそれぞれの「段落」も要素としましょう。
10行目の「署名」、11行目の「添付ファイル」もそれぞれ要素と考えます。
このようにして電子メールのサンプルデータから要素を洗い出すことができました。要素が特定できたらそれぞれの要素に要素名をつけていきます。
以下に、電子メールのデータを構成する要素とそれぞれの要素名を記します。
要素 | 要素名 |
「電子メール」そのもの。属性「重要度」を持つ。 | |
送信元 | from |
宛先 | to |
cc | cc |
bcc | bcc |
名前 | name |
メールアドレス | mail-address |
件名 | title |
本文 | body |
段落 | p |
署名 | sign |
添付ファイル | appending-file |