スタンダーズコーナー：W3C規格解説　「SRGS」

2004年08月03日作成　

W3C規格解説
SRGS(Speech Recognition Grammar Specification)
　　　

（株）日本ユニテック
青木秀起

「Speech Recognition Grammar Specification Version 1.0」（以下「SRGS」）とは、音声認識で使用される文法を表現する構文定義で、2004年3月16日にW3C勧告となりました。 (http://www.w3.org/TR/2004/REC-speech-grammar-20040316/)

「SRGS」の位置づけ

W3CのVoice Browser（音声ブラウザ）ワーキンググループで開発している音声インターフェイスフレームワークには、以下の仕様があります。

XKMSは、XKMSサーバとサービス要求者/サービス提供者間で、公開鍵の登録や配布を行うためのメッセージとプロトコルを規定しています。

「VoiceXML」：音声対話（勧告）
「Speech Synthesis」：音声合成（勧告案）
「SRGS」：音声認識文法（勧告）
「Semantic Interpretation」：音声認識の意味解釈（ワーキングドラフト）
「Call Control (CCXML)」：呼出し制御記述（ワーキングドラフト）

音声によるやり取りでは、質問への回答は1つとは限らず複数になる場合があります。たとえば、肯定の返事をする場合、”はい”、”もちろん”、”いいですね”など、複数の表現方法が考えられます。「SRGS」は、ユーザが発言すると思われる単語をグループ化し、それらのうちのいずれかが返ってきた場合でも、1つの応答を返せる仕組みを提供します。これにより、音声アプリケーションの対応が容易になります。

「SRGS」の構文

「SRGS」の文法構文は、拡張BNF (ABNF) 構文とXML構文で表現されています。XML構文によるマークアップの例をご紹介しましょう（仕様書より）。

<rule id="town">
  <one-of>
    <item>Townsville</item>
    <item>Beantown</item>
  </one-of>
</rule>
<rule id="city" scope="private">
  <one-of>
    <item>Boston</item>
    <item>"San Francisco"</item>
    <item>Madrid</item>
  </one-of>
</rule>
<rule id="command" scope="public">
  <ruleref uri="#action"/>
  <ruleref uri="#object"/>
</rule>

ruleは、文法ルールの定義を、one-ofは代替表現のセットの定義を、rulerefはrule要素への参照を表わしています。

まとめ

音声によるWebアクセスが容易になれば、障害者の方々をはじめWeb利用者が増加することでしょう。Lucent Speech Solutions社のLucent Speech ServerやMicrosoft社のSpeech Serverなど、実装も進んでいます。

この記事と関連の高い記事

関連キーワード：XML関連規格

スタンダーズコーナー：W3C規格解説 「SRGS」

「SRGS」の位置づけ

「SRGS」の構文

まとめ

関連サービス

この記事と関連の高い記事

スタンダーズコーナー：W3C規格解説　「SRGS」