ホーム > X-Plus > XML Square >  スタンダーズ

この記事を送る はてなブックマークに追加する BuzzurlにブックマークBuzzurlにブックマーク Yahoo!ブックマークに登録
テキストリンクコードを取得する

スタンダーズコーナー:W3C規格解説 「SRGS」

2004年08月03日作成 

W3C規格解説
SRGS(Speech Recognition Grammar Specification)
   

(株)日本ユニテック
青木 秀起

「Speech Recognition Grammar Specification Version 1.0」(以下「SRGS」)とは、音声認識で使用される文法を表現する構文定義で、2004年3月16日にW3C勧告となりました。 (http://www.w3.org/TR/2004/REC-speech-grammar-20040316/)

「SRGS」の位置づけ

W3CのVoice Browser(音声ブラウザ)ワーキンググループで開発している音声インターフェイスフレームワークには、以下の仕様があります。

XKMSは、XKMSサーバとサービス要求者/サービス提供者間で、公開鍵の登録や配布を行うためのメッセージとプロトコルを規定しています。

  • 「VoiceXML」:音声対話(勧告)
  • 「Speech Synthesis」:音声合成(勧告案)
  • 「SRGS」:音声認識文法(勧告)
  • 「Semantic Interpretation」:音声認識の意味解釈(ワーキングドラフト)
  • 「Call Control (CCXML)」:呼出し制御記述(ワーキングドラフト)

音声によるやり取りでは、質問への回答は1つとは限らず複数になる場合があります。たとえば、肯定の返事をする場合、”はい”、”もちろん”、”いいですね”など、複数の表現方法が考えられます。「SRGS」は、ユーザが発言すると思われる単語をグループ化し、それらのうちのいずれかが返ってきた場合でも、1つの応答を返せる仕組みを提供します。これにより、音声アプリケーションの対応が容易になります。

「SRGS」の構文

「SRGS」の文法構文は、拡張BNF (ABNF) 構文とXML構文で表現されています。XML構文によるマークアップの例をご紹介しましょう(仕様書より)。

<rule id="town">
  <one-of>
    <item>Townsville</item>
    <item>Beantown</item>
  </one-of>
</rule>
<rule id="city" scope="private">
  <one-of>
    <item>Boston</item>
    <item>"San Francisco"</item>
    <item>Madrid</item>
  </one-of>
</rule>
<rule id="command" scope="public">
  <ruleref uri="#action"/>
  <ruleref uri="#object"/>
</rule>

ruleは、文法ルールの定義を、one-ofは代替表現のセットの定義を、rulerefはrule要素への参照を表わしています。

まとめ

音声によるWebアクセスが容易になれば、障害者の方々をはじめWeb利用者が増加することでしょう。Lucent Speech Solutions社のLucent Speech ServerやMicrosoft社のSpeech Serverなど、実装も進んでいます。




関連サービス

標準化仕様の動向調査
最新動向を伝えるDXメールニュース (無料)



この記事と関連の高い記事

関連キーワード:XML関連規格




ページトップへ戻る