iOS SDK用音声認識ライブラリ VocalKit の使い方

tsutsumi

Sep 30, 2011

3D
ar
AR
art
class
closure
Dictionary
flash
iPhone
iphone
js
kayac
Number
object
php
png
sdk
swf
wav
プロパティ
勉強会

みなさまこんにちは！tsutsumiと申します。

突然ですが、こちら、先日（2010年12月4日）とある勉強会にて発表した際の資料です。

VocalKitについて

View more presentations from 堤修一

iPhone SDKで利用できる音声認識ライブラリ（Pocket Sphinxのラッパー）VocalKitについて紹介しています。

中身を読むのが面倒な方のために、下記に内容を抜粋します！

『勇気をください』

「勇気をください」と言うと、勇気の出るエピソードが表示されるiPhoneアプリ。
音声認識を使っているので、ちゃんと「勇気をください」といわないと怒られます。

（AppBankさんへの寄稿記事）
（AppStore）

VocalKitとは？

オープンソースの音声認識エンジン、Pocket Sphinxのラッパー
https://github.com/KingOfBrian/VocalKit

使い方

録音を開始する

[vk startListening];

認識を開始する

[vk postNotificationOfRecognizedText];

認識結果を受け取る

（NSNotificationが飛んでくる）

単語辞書の記述方法

単語名音素1 音素2 音素3 . . .
同じ単語を複数の発音で定義したい場合は(2)とか(3)とかつける

me	M IY

encourage	EH N K ER IH JH

encourage(2)	IH N K ER AH JH

認識結果

NSNotificationのUserInfoプロパティに認識結果が入ってくる。

NSDictionary *dict = [notification userInfo];	
NSString *phrase = [dict objectForKey:VKRecognizedPhraseNotificationTextKey];
NSNumber *score  = [dict objectForKey:VKRecognizedPhraseNotificationScoreKey];

辞書作成のコツ

単語数が多いと、処理も重いし認識率も悪い

まず標準の辞書で、認識結果をためしてみる（sayコマンド便利）
出てきた単語だけで辞書を再構成する

自分で作るとかなり大変な音声認識機能ですが、VocalKitを使うと超簡単にiPhoneに実装できてしまうので、ぜひぜひお試しください！