スマホの音声入力を使って記事を作るテスト

2023/8/25作成

留学先のボスに『日本の研究者は国際会議の論文1本書くのに1ヶ月かけるって本当かい?ウチのスタッフは3日で書いて3日でリバイスして1日かけて最終確認&投稿する、7日のワークと決めている。報告書は鮮度が命だからね』と言われて、そんなことができるのかと思っていたら、(1/2)

— りっく (@marudewakaran40) August 20, 2023

こういうツイートを見かけたので、実際に音声入力で記事を作るテストをしてみます。実際のところ、どうでしょうかね。

やる前に気になったのは、これが文体がどうなるのかなーっていうことなんですね。私は普段、いつも口語文体で書いているんですけど、文章で書くときの口語文体と喋る時の口語文体では違うような気がするし、また喋る時にどうしても「あー」とか「えーと」みたいなことも入っちゃいますよね。その辺は後で添削というか校正できればいいんですけど、あんまり校正が複雑になるとテキストを打つのとどっちが早いかなーっていう気もするし。

ちょっと話を戻って、私って記事のネタってのが思い浮かんだ時って、文章の構成や細かいところまではいつも頭の中に浮かぶことが多いんですけど、それを実際にテキストに打つのって結構時間がかかるんですよね。取り掛かるまでにも時間がかかってしまうこともあって、忘れちゃうこともあるんですけど、ポメラとかでキーボードで打ち始めても、なんだか思考の流れに対してキーボードが追いつかなくて、キーボード打ってるうちに何を書きたいんだったか忘れちゃうみたいなことが結構あって、その辺を考えると口で喋ってテキスト化できる方が便利かなーって思って、試してみました。とりあえず、こんなところです。


ちなみに、音声入力をテキスト化した生の状態はこちらです。さすがに誤変換がそこそこありますね。文章の意味が全くわからなくなってるところもあって、自分でも何をしゃべったのかわからなくなりそうです。記憶が鮮明なうちに校正しないとですね。

こういうツイートを見かけたので実際に音声入力で記事を作るテストをしてみます実際ところどうでしょうかねやる前に気になったのはこれ分解がどうなるのかなーっていうことなんですね私普段いつもは口語文体で書いてるんですけども文章で書くときの口語文体と喋る時の口語文体キャパ違うような気がするしまた喋る時どうしてもあとか8カウントみたいなことも入っちゃいますよねその辺は後で検索検索という構成する気に直せばいいんですけども あんまり構成多くなるとテキストを打つのとどっちが早いかなーっていう気もするしてちょっと話戻ってタクシーで新生地のネタっての思いついた時ってね文章構成とか文章の細かいとこまではいつだった頭の中に浮かぶことが多いんですけどもそれ実際テキストに打つのって結構時間かかるんですよね取り掛かるまでにも時間かかって忘れちゃうっていうこともあるんですけども西梅田とかでキーボードで打ち始めても なんだか思考の流れに対してキーボードのが追いつかなくて売ってる家に着いていもっか何て書きたいんだとか忘れちゃうみたいなことが結構あってその辺考えると口で喋ってテキスト化できる方が便利かなーっていうのがあって試してみましたとりあえずこんなとこです

そして ChatGPT に校正してもらったのがこちらです。多少は文章がきれいになってますが、誤変換はほぼそのままだし、文章が意味不明になってるところは当たり前ですがそのままですね。ChatGPT にとっては未知の部分ですから、そこが直ってたらむしろびっくりです。

こういうツイートを見かけたので、実際に音声入力で記事を作るテストをしてみます。実際のところ、どうでしょうかね。やる前に気になったのは、これが分解されるのかなーっていうことなんですね。私は普段、いつも口語文体で書いているんですけど、文章で書くときの口語文体と喋る時の口語文体では違うような気がするし、また喋る時にどうしても「あとか8カウント」みたいなことも入っちゃいますよね。その辺は後で検索できるという構成できればいいんですけど、あんまり構成が複雑になるとテキストを打つのとどっちが早いかなーっていう気もするし、ちょっと話を戻って、タクシーで新生地のネタってのが思い浮かんだ時ってね、文章の構成や細かいところまではいつも頭の中に浮かぶことが多いんですけど、それを実際にテキストに打つのって結構時間がかかるんですよね。取り掛かるまでにも時間がかかってしまうこともあって、忘れちゃうこともあるんですけど、西梅田とかでキーボードで打ち始めても、「なんだか思考の流れに対してキーボードが追いつかなくて。家に着いてみたいんだとか忘れちゃう」みたいなことが結構あって、その辺を考えると口で喋ってテキスト化できる方が便利かなーって思って、試してみました。とりあえず、こんなところです。

文章が長く、内容も複雑ですので、正確に校正させていただきました。不明点や修正が必要な部分があればお知らせください。


実際にやってみて思いましたが、つい5分前にしゃべったことでも忘れてます。なのでテキストで意味不明になってるところは、なにを言いたかったのか自分でもわかりません。まあ、そこは厳密じゃなくていいので、あとから文章を校正しているときの自分として意味が通るように直してもいいんですけどね。これ思ったんですが、音声入力したときの録音を聞き返すことが出来たら便利じゃないですかね。インタビューの文字起こしする人とかは録音を何度も聞きなおすわけですしねぇ。音声テキスト化アプリに録音機能ってないのかしら。もしくは録音アプリで録音した音声をテキスト化するという流れでもいいんだけども。

書いてませんでしたが、今回使ったのは Android の「音声文字変換」というアプリです。どっちかというと日常会話シーン(リアルタイム翻訳や筆談)で使うことを目的としてるアプリっぽいので、私の用途であれば別のアプリを使った方がいいかもしれませんね。でもまあ、実際にやってみて感触分かったということで。