音声認識の技術が向上し、今や色々な場面で利用されるようになりました。
スマートホンでもその技術を利用したアプリが無数あり、当たり前のように使われています。
そこで、そんなアプリを利用してブログの記事が簡単に書けないかを試してみることにしました。
目次
試してみる価値がある
ブログの記事を書いていると、その執筆には非常に時間が掛かります。
もちろん記事にもよりますが、どんな場合でも
「文章を考えること」と「実際に文字にすること」
の2つの作業が発生し、両者ともそれなりの時間を要します。
そのような時間は、記事が長ければ長い程、それに比例して長くなりますので、特に長い記事を書く場合は、その作業時間は決してバカにできなくなります。
一方、人が言葉をしゃべる場合、文字を書くよりも動作が速く、その速度の違いはかなり大きくなります。
そこで考えたことは、
「書きたい記事を言葉で話し、それを音声認識アプリで文字に変換してそのまま記事にしたらどうだろう」
というアイデアでした。
ブログ記事の場合、筆者が読者へ語りかけるような表現で筆記することも少なくありません。
従って、「話し言葉」をそのまま「書き言葉」として文章にしても、違和感はそれほど感じることはないでしょうから、なおさら有用に思えました。
ここでは、音声認識の有用性を確かめる第一歩として、まず簡単な文章を記事にして評価してみることにしました。
実際に書いてみた記事
私が実際に用いたアプリは、iPhoneのアプリとして公開されている「Speechy」という音声認識アプリケーションでした。
これはApp内課金のアプリで、サービス向上のために追加インストールなどをしなければ無料で使用できるアプリケーションです。(Lite版)
無料版の場合は、「一度に話す時間は一分以内」という制限がありましたが、試してみるには十分でした。
では、実際に試しに作ってみた短い記事を見てみましょう。
音声認識を利用して作成した記事が下記ですが、これは、アプリを用いて話した音声が文字に変換された後、少し修正・変更して作成したものです。
実際に文字認識を利用して試作した記事
この記事はためしに音声認識のアプリを使って書いてみたものです。
実際にどれぐらいしっかりと正確に認識できるのか試そうと思って書くことにしました。
もしこれが、かなりの完成度で書けたとすると、記事を書く上でものすごく短縮ができると言うことになります。
実際、記事を1つ書くだけでもかなりの時間を要しますし、しゃべった感じの言葉と書く言葉と言うのは違いますが、ブログと言う意味では語りかけるような表現のほうがいい場合もありますので、ちょっと皆さんその感じが出てるかどうか比較してみてください。
いかがでしょうか
修正・変更前と比較すると
では、音声認識アプリで実際に作成された元の文章をそのまま掲載します。
これは、全画で数えて245文字、しゃべっている時間はおおよそ30秒でした。
「この記事はためしに音声認識のアプリをついて書いてみたものです実際にどれぐらいしっかりと正確に認識できるのか試そうと思って書くことにしましたもしこれがかなりの完成度でかけたとすると記事を書く上でものすごく短縮ができると言うことになります実際記事を1つ書くだけでもかなりの時間を要しますししゃべった感じの言葉と書く言葉と言うのは違いますのでAAブログと言う意味では語りかけるような表現のほうがいいわ乗りますのでAAかなりちょっと皆さんその感じが出てるかどうか比較してみてくださいいかがでしょうか」
如何でしょうか。
試しに作った上記の記事と大差が無く、大きな手直しもなく作成できたことが分かると思います。
難点を言えば、しゃべった内容そのものが少し変な表現になっていますから、そのまま文章にした結果も、ちょっと不自然な記事になってしまっています。
ただ、話した言葉を忠実に再現しているという点ではかなりのレベルと言え、実用上は十分ではないでしょうか。
実際に手を入れたところは
ちなみに、手を入れた箇所を示してみます。
元の文章に★、●、▲のマークを挿入して、変更した点が分かるようにしています。
マークの意味は下記の通りです。
★:「句点+改行」を挿入
●:「読点」を挿入
▲:修正変更
「この記事はためしに音声認識のアプリを▲「ついて→使って」書いてみたものです★実際にどれぐらいしっかりと正確に認識できるのか試そうと思って書くことにしました★もしこれが●かなりの完成度で▲「かけた→書けた」とすると●記事を書く上でものすごく短縮ができると言うことになります★実際●記事を1つ書くだけでもかなりの時間を要しますし●しゃべった感じの言葉と書く言葉と言うのは違います▲「のでAA→が、」ブログと言う意味では語りかけるような表現のほうがいい▲「わ乗りますのでAAかなり→場合もありますので、」ちょっと皆さんその感じが出てるかどうか比較してみてください★いかがでしょうか」
見て分かるように、基本的に句読点と改行の挿入、段落の調整などだけで済んでいます。
修正したのは▲の4箇所だけですが、そのうち1箇所は「かけた」を「書けた」のように漢字に直しただけですから、実質は3箇所の修正のみということになります。
ようするに、文章の修正が必要な認識ミスなどはごく一部だけで、ほとんどは原文のままで良いことが分かります。
ちなみに、変換後の元の文章にある「AA」は、しゃべっている途中で、「えーっ」、「えーっ」と、何を話そうかを考えている最中に発した音声です。
文字認識の有用性
以上、ごく簡単な記事を音声認識アプリを利用して試しに作ってみました。試してみたことで、分かったことや感じたことが色々ありました。
アプリによって多少の差はあると思いますが、まとめると、以下の4つのことが言えると思います。
(1)認識力は十分
(2)短い記事には不適
(3)項目分け可能な記事に効果的
(4)メモ代わりにも利用可
では、それぞれを具体的に見て行きましょう。
(1)認識力は十分
まず、「認識力は十分」についてですが、これは音声を相応の文章に変換してくれる正確さが十分で、実用的なレベルであると言う意味です。
音声認識技術は、デジタル時代に入ってからその研究が始まり、当初は実用化されてもまだまだ性能が低い状態でした。
しかし、今や色々な場面で普通に使われるようになり、実用上はほとんど問題のないくらいの性能になっています。
今回私が心配していたのは、スマートフォンのアプリというレベルで、どれほど正確な認識ができるかと言う点でしたが、実際に使ってみて、十分問題ないレベルと言うことが確認できました。
読者のみなさんも上記の結果を見て頂いて、ほとんど誤認識がなかったことが分かって頂けたと思います。
もちろん、専門用語が多いとか、難しい言い回しであると言った場合は、ここまで認識するのは難しいことでしょう。
しかし、逆に言えば、普通の言葉、文章であれば問題なく使えるということです。
(2)短い記事には不適
さて、「短い記事には不適」についてですが、これは、短い文章の場合は、直接文章をキーボードから打ち込んで編集した方が作業が速いという意味です。
今回試したのは二百数十文字、話す時間にして30秒ほどでしたが、アプリの利用だけでなく、データの転送などを含む一連の作業時間を考えた場合、直接文字を打ち込んだ場合の処理時間の方が速いと感じました。
従って、ある程度の長さのある文章・記事を作成する場合でないと、音声認識を利用した記事作成は、あまり効率的ではないと言えます。
ただし今回、私が試したアプリでは、無料で使う場合は一回の処理は一分以内という制限がありますから、長い話を処理するのであれば、他のアプリや有料版を利用する方がいいかも知れません。
また、仮に時間制限のない処理が出来たとしても、中身のある話を何分にも渡って話し続けることは結構難しいと思います。
人間は、話しをする場合には、どうしても頭で考えながらしゃべりますから、話しを途切れさないで続けられるのは、話すテーマや内容にも依存すると思います。
仮に長い話を続けたとしても、その分だけ、どうしても日本語としておかしな言い回しや表現が多くなってしまうことでしょう。
例えば「○○なので、○○なので、○○なので・・・」のように「なので」を複数回繰り返すみたいな、文章としては不自然な話し方ってけっこうあります。
(3)項目分け可能な記事に効果的
次に、「項目分け可能な記事に効果的」についてですが、これは記事内容を項目に分けやすい場合に、より使いやすという意味です。
前述のように、人間は話をうまくまとめながら一度に全てを話すのは、なかなかできることではありません。実際、今回、私は「えーっ」「えーっ」と何度もつぶやいてしまいましたし。
休むことなく、ずーっと話し続けるってけっこう酷です。中身のない話なら別ですがー。
しかし、話す内容を何かのテーマごとに分ければ、ある程度まとまった話をしやすくなります。
例えば、グルメレポートを書こうとした場合、「店の雰囲気」「メニューの内容」「食べた料理の味わい」と言った具合に、いくつか項目に分けて別々に話をして、その項目ごとに音声認識をして文章を合成すれば、より効果的に利用できると思います。
要するに、文章を、あるまとまった単位に分割できるような場合に、上手く処理しやすくなると言えます。
(4)メモ代わりにも利用可
最後に「メモ代わりにも利用可」についてですが、何か記事にしようとしてメモをとる代わりに、その場で思ったことをしゃべって文章として記録する場合にとても便利だという意味です。これは、今回、試してみたことで直感的に感じたことです。
メモを取る場合、どちらかと言うと、まとまった文章が多く、場合によっては箇条書きになったり、要点のみに成ったりしがちです。
あとあと文章を起こすのであれば、メモ書きの段階である程度まとまった文書にしてしまえば、けっこう役立つはずです。
思いついたその時に話す言葉は、より実感がこもりますし、その場の様子を端的に表現できている場合も少なくありません。
あとで上手い言葉や表現を考えるよりも、記事を書くキッカケを得た時に出た言葉の方がリアルですし、忘れてしまわずに済むことも多いハズです。
また、スマホのエディターを使ってブログを書くことは、多くの人がやっていることですが、その場合、外出先で作業するだけの違いで、真剣に文字を起こすことに変わりはありません。
しかし、音声認識の場合、外出先で手軽に、メモ代わり感覚で記事の草案を作り上げることができますから、そういう意味では使い分けとしてのメリットがあると言えましょう。
以上のように、音声認識をブログ記事作成に利用することは、状況によってとても有用です。
今後、このブログにおいても、音声認識のメリットを活かせる作業には、十分活用して行きたいと考えています。
使ったことの無い人も、試してみるといいかも知れませんよ。