W3C規格解説
SRGS(Speech Recognition Grammar Specification)
(株)日本ユニテック
青木 秀起
「Speech Recognition Grammar Specification Version 1.0」(以下「SRGS」)とは、音声認識で使用される文法を表現する構文定義で、2004年3月16日にW3C勧告となりました。 (http://www.w3.org/TR/2004/REC-speech-grammar-20040316/)
「SRGS」の位置づけ
W3CのVoice Browser(音声ブラウザ)ワーキンググループで開発している音声インターフェイスフレームワークには、以下の仕様があります。
XKMSは、XKMSサーバとサービス要求者/サービス提供者間で、公開鍵の登録や配布を行うためのメッセージとプロトコルを規定しています。
- 「VoiceXML」:音声対話(勧告)
- 「Speech Synthesis」:音声合成(勧告案)
- 「SRGS」:音声認識文法(勧告)
- 「Semantic Interpretation」:音声認識の意味解釈(ワーキングドラフト)
- 「Call Control (CCXML)」:呼出し制御記述(ワーキングドラフト)
音声によるやり取りでは、質問への回答は1つとは限らず複数になる場合があります。たとえば、肯定の返事をする場合、”はい”、”もちろん”、”いいですね”など、複数の表現方法が考えられます。「SRGS」は、ユーザが発言すると思われる単語をグループ化し、それらのうちのいずれかが返ってきた場合でも、1つの応答を返せる仕組みを提供します。これにより、音声アプリケーションの対応が容易になります。
「SRGS」の構文
「SRGS」の文法構文は、拡張BNF (ABNF) 構文とXML構文で表現されています。XML構文によるマークアップの例をご紹介しましょう(仕様書より)。
<rule id="town">
<one-of>
<item>Townsville</item>
<item>Beantown</item>
</one-of>
</rule>
<rule id="city" scope="private">
<one-of>
<item>Boston</item>
<item>"San Francisco"</item>
<item>Madrid</item>
</one-of>
</rule>
<rule id="command" scope="public">
<ruleref uri="#action"/>
<ruleref uri="#object"/>
</rule>
|
ruleは、文法ルールの定義を、one-ofは代替表現のセットの定義を、rulerefはrule要素への参照を表わしています。
まとめ
音声によるWebアクセスが容易になれば、障害者の方々をはじめWeb利用者が増加することでしょう。Lucent Speech Solutions社のLucent Speech ServerやMicrosoft社のSpeech Serverなど、実装も進んでいます。
関連サービス
標準化仕様の動向調査
最新動向を伝えるDXメールニュース
(無料)
|