音声入力ソフト

日本語音声入力その後

注:
この文章は、ITI日本語ネットワークの会誌"Japanese Network Bulletin"第23号(2001年4月?発行)に掲載したものです。2000年9月に日本語ネットワークの勉強会で日本語音声入力ソフト「ドラゴンスピーチ」Ver.3の簡単なデモを行ったのですが、そのフォローアップ記事です。

 昨年のバース大学ワークショップ音声入力デモンストレーションを見た人は、日本語版と英語版のパフォーマンスの落差に愕然としたのではないかと思う。あれを見て日本語版は使えないとあきらめてしまった人も多いと思うので、その後の進歩の程を報告しておきたい。

 バースでのデモンストレーションの後、私の日本語ドラゴンのVer.4.05アップグレードCDが到着した。

 アップグレード後は、旧版のスピーチファイルをそのまま利用することもできるが、旧版での入力がそれほど正確でなかったこともあり、機能的にも制限されるということで、新しいスピーチファイルを作った。

 ウィザードの指示通りに画面に表示される文章を読み、トレーニングを行う。このトレーニングが大幅に短くなったというのがアップグレード版の売り文句のひとつだが、5分ですむというのは理想の話で、実際にはもっとかかった。とは言え、Ver.3のトレーニングに比べれば相当短い。

 なお、アップグレード版を使い始めたのと同時に、音声入力ソフトの使い方についても、ワークショップでの英語版のデモの時に聞いたアドバイスをもとに、少し変えてみた。

 Wordで入力する代わりにドラゴンの入力ウィンドウで入力するようにしたことと、入力の区切りをなるべく長くするように気をつけたことだ。

 結果はというと、これが同じソフトかと思うくらいの差がついた。

 Ver.3をしばらく使って少しは進歩したかな?という状態になっていたのだが、Ver.4では基本トレーニング直後の入力でも同等の結果(それ以上か?)が得られた。

 また、ドラゴンの入力ウィンドウを使うと、Wordのウィンドウでの入力に比べて、音声入力した文章が画面に現れるまでの待ち時間が大幅に短くなる。

 考えてみたら、バースでのデモでも、私の日本語デモはWordでの入力だったので、ディクテーションしてもなかなか画面に文字が出てこなかったが、英語版のデモはドラゴンのウィンドウで入力していた。これだと音声入力とテキスト表示のギャップは一呼吸程度で、それほど気にならない。

 また、音声入力ソフトは文脈の前後関係から単語を選択していくので、文節ごとに区切って入力するよりは、文章を一息にディクテーションしてしまった方が認識結果が正確になる。

 使い始めは、入力が正しく認識されたかどうかが気になって、ついぶつぶつ区切ってしまうのだが、これはかえって逆効果で、あまりの認識精度の低さにがっかりして使わなくなってしまう結果になる。

 私の場合、頭の中できちんとした文章を考えてすらすらと話すというのはどうしても苦手で、すぐにつっかえてしまうのが、入力精度を下げる原因になっている。ところが、手元にあるテキストをそのまま読み込む場合など、画面を気にせずにたったかたったかと読んでいくと、入力結果はほとんどミスがなかったりするのだった。

 最初はディクテーション専用に使っていたが、入力精度が向上するにつれ、コマンドの音声入力も少しずつ増やせるようになった。

 音声入力というと音声しか入力できないのかと思う人がいるかもしれないが、実際にはキーボードもマウスも以前と同じように使える。だから文章の入力だけ音声でやって修正や編集作業を手で行うこともできるし、すべて音声だけで済ますこともできる。

 これは好きずきだと思うのだが、私の場合は腕を休ませたいというのが音声入力使用のそもそもの目的なので、なるべくマウスの使用を減らすよう心がけている。これが結構難しくて、ついつい手がマウスに伸びてしまうので、マウスのプラグを抜いておいたりすることもある。

 私は最初音声入力をメールを書いたりWebページの文章を書いたりするのに使っていたのだが、慣れてきたところで納期に余裕がある和訳の仕事がひとつ入ったので、試しに音声入力で翻訳をやってみることにした。すると驚いたことに、普段使っているときよりも認識精度が高くてさくさくと入力できてしまうのである。

 考えてみたら翻訳の場合には、英文とは言えテキストが目の前にあって頭のなかで文章を組み立てやすいので、入力する文章単位が長めになる。またきちんとした文体をつかうので、くだけたおしゃべり調の文章が多い私設Webページの駄文などよりもよほど認識されやすいわけで、実は当然の結果なのであった。

 さて、日本語音声入力と英語版のスピードを比べてみると、やはり日本語が負ける。

 もっともこれはキーボード入力の場合も同じだろう。日本語の場合変換が入るから、その分どうしても遅くなるわけで、直接の比較はちょっと不公平である。

 日本語音声入力と日本語キーボード入力を比べた場合は、キーボードの入力の速さにもよるが、タッチタイプですらすら入力できる人だと、やはり音声入力が負けてしまうと思う。

 それなら日本語音声入力なんか使う意味があるのかというと、これは人それぞれかもしれない。キーボードを何時間叩いてもへっちゃらという人なら、おそらく音声入力を使ってもストレスが増すだけだろう。しかし日頃RSIに悩まされている私にとっては、キーボード以外にも入力のオプションがあるというのは大きな助けだ。

 日本語のキーボード入力は英語の入力に比べて腕の負担も大きいので、音声入力の有用性はそれだけ高いと言えるだろう。最近腕の疲れが気になってという人には、将来のためにも今から音声入力を試してみることをぜひおすすめしたい。

トップに戻る