言語化の質と量を別次元にする音声入力のススメ

(この記事は、音声入力の方法について書いていると共に、途中から言語化・言葉にすることに対しての熱い想いを書き綴っています。音声入力についてだけ知りたい方は序盤だけドライにどうぞ!)

ようこそ。

みんな、音声入力、使ってる?

「なにそれ?」と聞こえそうですが・・・音声入力超!おすすめです。

特にこんな方。

  • 忙しいけど文章書きたい、ブログもやりたい
  • 子育てで、自分の時間をなかなか創ることが難しいんだけど、ブログを書いたり、メッセージを送ったりしたい
  • スマホで入力するのは時間がかかるから、PCで入力するほうがいいと思っているんだけど、最近なかなかデスクの前でゆっくり座る時間が作れない

音声入力の文字入力速度はなんと1分間に300文字!(詳細は後述)また、指で文字を入力するのと比較しても、自然な言葉選びになります。

音声入力に関するうんちくや、「音声入力ってすげえ!!!」と、すごいものを活用しながら自分が言葉を紡いでいる感覚になれるような情報もありますが、別にそれは必要ないという人もいると思うので(たぶん妻は「へー」と言うくらいでしょう・・・)、使い方と、使うと実際どんな感じか、ということから書いていきますね・・・(ぼくはそういうの大好きなんだけど)

「音声入力」の使い方

使い方はとっても簡単。iPhoneでもAndroidでも使えます。MACでも常用しています。Windowsでも使えるものがあるようです。そのあたりはググってみてくださいね!

iPhoneなら、文字入力のキーボードの中の左下「マイクボタン」を押せば始まります。その後40秒間、音声入力を受け付けてくれます。

メモアプリにて。もちろん他のアプリでもOK。

(Androidの画面については後日妻に協力してもらってからアップします・・・)

音声入力の変換精度が高まる要素は、

  • なるべくはっきりと、適度に大きな声で話していること
  • まわりに音が少ないこと

息子が近くにいてガチャガチャ遊んでいる音がしていたり、声を出されると変換がうまくいきません・・・

音楽の大きなカフェでも難しい事が多いです。そもそもカフェの中で一人で音声入力をするというのも勇気がいるし、他の人にも迷惑かもしれませんね!

なので、「一人の空間で、スマホのマイクになるべく口を近づけ、適度な大きさの声で話す」ことを基本にしています。あとは、後述しますが、クラウドを使った機能であるため、オンライン環境でないと使えません。そして、あまりに回線速度が遅いと、変換にも支障をきたします。

できることなら一人でいられる空間で使います。それは、周囲の音に影響されないようにということと、周りに人がいるとやっぱり恥ずかしかったり、人に聞かれていることを意識した言葉を選ぶことになり、自分の思考をそのまま言葉にする試みにさわりがあるためです。

「とはいえ、実際はどんな感じなの?ほんとに使えるの?」という声にお応えして、実際に音声入力している様子を動画にしました!

百聞は一見にしかず。どうぞ。

声入りでちょっと恥ずかしい・・・

多少変換ミスがあることと共に、かなりの精度で音声を文字に変換してくれることを目撃できると思います。

音声入力、すごいでしょ。

40秒で変換受付時間が一旦終わるときの様子もわかると思います。

また、文中に句読点や改行を入れたいときにはこちら。
・「、」を入れたい→「てん」と言う
・「。」→「まる」
・「・」→「なかぐろ」
・「→」→「やじるし」
・「改行」→「かいぎょう」
※iPhone、MACの場合。AndroidやGoogleドキュメントではできない。

収録中ということもあって緊張しちゃっているのと、妻と息子が寝たあとでちょっとぼそぼそ話していることも、変換ミスにつながっているなと思います。普段はこれよりも変換精度高い感じがします。

調子が出ているときはもっと早く話しますが、それでも余裕で拾ってくれます。文章の間に空白の時間がないほうが、前後の文脈として判断しやすく変換精度は高くなります。

日々、なにか思いつくたびに急いでメモアプリを立ち上げ、こんなことをやっています。1分くらい入力して終わることもあれば、話し始めたらどんどんと後の言葉や思考が続いて、10分近く話し続けてすごい長文が出来上がっていることもあります。

それがブログの記事のベースになることもあるし、人にメッセージを書くときの下書きになることもあるし、仕事で使う資料の素地になることもあります。

いろんな形で活用していて、「これは知っていたらかなり捗る」と思っていることがいくつもあるため、それはまた追って更新したいと思います。

注意点として、40秒で途切れるため、それに気づかず話し続け、変換されていないことに気づいて「あっ///」となることもあります。慣れましょう。

ひとつふたつは変換ミスがある、というのが常なので、一旦音声入力をして、その後に変換ミスを修正する、というのが通常の流れです。

「言葉にすること」の真の価値

ここまでぼくが熱く紹介してきても「なんか手間だし、早いって言っても修正する時間も含めたら遅いんじゃない?」と思うかも知れません。しかし、音声入力の価値のより深いところは、「自分の思考をまずは言葉にしてみる」というハードルをずいぶんと低くしてくれるところにあるのです。

人は、自分の内側にある感覚や考えを確かに持っていますが、それは、実際に言葉や文章にしてみてはじめて、それが本当には何なのかを知ることができる、という見方にぼくは強い賛意と実感を持っています。(これは、ナラティブ・アプローチからの学び。)

言葉にするほど、自分が日々で感じていること、これからやりたいと思っていることなどを、本当の意味で自分のものにすることができるという見方です。

だから、そうして出力された文章が画面上で正確になっていなくても、一旦はいいのです。誤字、脱字、変換ミスがあろうと、自分の内側から外側に出力される過程を経た時点で、それは自分にとって言葉になっています。言葉にした後の文章が正確かどうかよりも、たった今自分の思考を言葉にするとしたらそれはなんなのか。そこに自分の意識を集中させることが重要です。

そのプロセスは、誰かと語り合う中でも大いに進みます。そこには、対話の価値、問いかけの価値、聴くあり方の価値。様々な要素があり、それについてはまた別に語りたいですが、誰かと語り合うには、誰かが必要です。誰かはいつでもは一緒にいません。相手の存在からの影響を、良くも悪くも受けます。そして、だいたいの場合、語り合うときにはその内容を記録することはないでしょう。あとからその内容を正確に思い出すことや、話した内容がとても豊かだったから誰かにシェアしたい、ブログに書きたい、というときにもそれを書き起こすには時間が掛かります。

だから、自分一人でも、言葉にするプロセスをどんどん進められる環境であり、かつ、その言葉が確実に残っていきあとからも参照できると共に、発信したい時にベースになる文章を手にできているという音声入力は、すごいのです。

(もちろん、フリック入力、キーボード入力、ノートに手書きなど、気に入った方法でやればいいと思っています。はたまた、頭の中で思考を動かすだけで十分言葉にできる!という方もいると思うので、その場合には置き換えて読んでいただけたら。)

「音声入力すごい!これ読んで感じたことももう音声入力で記録してみたい。」という素敵なあなたはぜひそうしてみてください!

このあともう少し語りますが、それは読んでも読まなくても音声入力はあなたの言語化の背中を毎日ぐいぐいと押してくれるでしょう。

でも、この「言葉にすること」を熱く語っている背景をもう少し語ってみます。

「言語化」の世界観

人が数十年生きてきた、長大な時間膨大な経験を持ちながら、目の前に展開する自分しか経験しないであろう出来事を体感した時に、自分の内側でどんなことを感じどんな意味付けをしどんな言葉が出てくるかというのは、本当にその人でしか成しえない、稀有なことです。宇宙広しと言えども、そこにしかない言葉になるでしょう。

だから、毎日ふとした時に自分の中に流れ星のごとく訪れる着想の瞬間を、「あ、そうだ、これやってみようかな」「これってこういうことかも」「あの人にこれを伝えたい」といった様々な形で現れるひらめきを、言葉にすることでとらえることは、これ以上ないくらい自分にしかできない営みだと思うし、自分の人生を自分でかたちづくっていくという行為そのものだと思うのです。

人は、言葉としてとらえることで初めてそれを実際の行動にすることができます。なんとなく思っている間は、そのことを現実にすることはできません。その間は、世の中に存在している膨大な量の言葉や、誰かが私にかけ続けている言葉が、私の実際の行動をつくり、そして、私の現実をそのようにします。

自分のまわりを、
着想や、ひらめきや、体験の意味付けや、世界の見方や、瞬間瞬間感じていることなど、
自分にまつわる多種多様な事柄について自分で紡いだ言葉でつくった豊かな生態系が繁茂しているようにすること。

世の中に存在している様々な意図を持った情報や、誰かがその人の価値観を元に自分にかけ続けている言葉は、それがどれだけ真実のように発信されたとしても、自分のまわりにその豊かな言葉の生態系があれば、自分を持ち続け、自分の夢に、自分が願う世界に向かい続けることができる

ぼくは今、そういう世界観の中で生きています。

そして、そういう世界観の中、自分の言葉を紡いで世界を創ろうとする人たちと、ぼくは一緒に生きていきたい。そのための言葉を、紡いで紡いで、この記事はできています。

というわけで、言葉を紡いで生きていこうとするとき、この音声入力が超!オススメです。というお話でした。ぼくの熱い想いが届けば幸いです。

ここからはマニアックなお話

音声入力や文字入力に関する少しマニアックなお話。興味ある方はどうぞ!

生産性の高さで有名な人はたくさんいるけど、その中でぼくが敬愛する勝間和代さんは、文字入力を早くするために親指シフトという方法を使っていることで知られていて。ローマ字入力でもかな入力でもない特殊なキーボード入力方式で、理論上はローマ字入力よりも1.7倍早く打てる!というもの。ちなみにぼくも勝間さんに影響を受け、2015年から親指シフトにシフト!今では立派な親指シフターになれました。

(この親指シフト自体もマニアックな入力方法で、これも語りだしたらたくさんあって・・・やっている人たちはマイノリティとしてネット上で不思議な親近感を感じるのです)

その勝間和代さんが、昨年から音声入力に傾倒しているのです!実は僕も昨年の9月から音声入力を使い始め、その入力速度・効率の高さに魅了されました。

勝間さんが計測したところでは、親指シフトで200文字/分。これでも超はやい。そして、音声入力では300文字/分!!しかも、親指シフトはもちろん指を動かして入力するため、その速さで打った翌日は疲れが溜まってしまっているということでした。

音声入力が今の変換精度でできるようになるまでは長い歴史があったようで。元々はPCにインストールする形の音声入力ソフト。ただ、人の言葉を認識してそれを膨大な可能性の中から文字に変換するというのはPCに高い処理能力を要求し、フリーズしてしまうこともしばしば。さらに、言葉はどんどん新しく生まれるため、それに追いつくことは難しい。一般の人が音声入力の恩恵を受けるなんてまだまだという時代が続いたようです。

そんな頃から、今なぜこうして一人一台持っているスマホでそれができるようになったかというと、AI(人工知能)の発達と、ネット回線速度の高速化がそれを可能にしています。(他にもたくさんあるけど省略)

ぼくたちがスマホの入力画面でマイクボタンを押して音声入力画面に声を発すると、その音声をデータとしてクラウドが吸い上げ、クラウド上にある高性能なAIがそれを処理し、「これだよね」という文字情報としてぼくたちのスマホに送り返してくれるのです。AIがそれをできるのは、「ディープラーニング」という、高速に無限に近いパターンを試み学習することができる機能を持っているから。超高性能でなんでもできる、というより、学習力が超高いから、それができる、ということ。

そう、ぼくたちが手に持っているスマホは超!優秀だけど、そのスマホでさえ、人の声を文字に変える処理をするには能力が足りないのです。それくらい高度な処理をクラウド上の高性能なAI(スーパーコンピュータのようなものと思ってもいいと思います)がしてくれて成り立っている機能を、ぼくらは、いつでも、ただで!使うことができるのです。

どうでしょう。本当にすごいことなんだ!ということ、伝わりますか?

マニアックな話にまでお付き合いいただき、ありがとうございました!

(専門家ではないため、情報が足りないところ、表現が間違っているところ、あるかと思いますが、正確な情報を伝えるよりも、その実感を伝えられたらというのが趣旨ですので、ご容赦ください!)


(音声をクラウド上に送ることになるため、自分の生体情報も露出していることになるし、内容もクラウド上には存在することになります。もちろんセキュアで安全なプロセスですが、国の諜報機関の監視の中には入ってしまう可能性があります。それは、なんらかのクラウドのサービスを使っていればもう既にその可能性の中にいますが、念のため、そうした視点を持っていることも大切だと思うので、併記しておきますね。)


それでは、また会いましょう。

この記事を書いた人

Seita
Seita
ひとつまみの希望 主宰 oiwai.life
Life Embody Facilitator & Writer

仕事として、NVC等のトレーナー、コミュニティビルディング、会議ファシリテーター、組織のビジョニング、企業研修(共感能力開発、言語化能力開発、チームビルディング等)。WEB制作、ライティング。
Life Workとして、鹿児島中央助産院の支援、夫婦ブログの運用。家族クラウドファンディングプロジェクト・「星の家」挑戦中。


*少し詳しい自己紹介はこちらから。

*これまでに書いた記事の一覧はこちらから。

*妻・Sakikoの記事一覧はこちらからどうぞ!