YouTubeの自動字幕の精度が良くなってきたので、文字起こしツールとして使えるかも?

今回は数学にあまり関係ないんですが、YouTubeの新しい活用方法になるかも??と思いついたことをかきます。自分で十分に実践を重ねたわけではなく単なる思いつきレベルの話ですが一応かいておきます。

最近、YouTubeの自動字幕の性能がめちゃめちゃ良くなってます。

 :20180228212744p:plain

使ったことがない方ために一応使い方をいっておくと、自動字幕はYouTube画面右下の歯車ボタンを押すことで設定できます(スマホでもできます)。自動で音を解析して、自動で字幕を作ってくれるのです。

確か2017年夏時点では、この字幕機能は誤変換ばかりで、全然使い物にならない精度でした。「グー◯ルさんやる気あるのか?日本語は諦めてるのか?」という思いがあったのですが、最近になって自動字幕の精度がめちゃくちゃ良くなっていたのでびっくりしました。一般の人々には見えないところで技術的な改良が進められているのですね。さすが天下のグーグル様!

で、この字幕を全部見たい場合は、歯車とかのある段のさらに下の段にある、「…」というところをクリックし、「文字起こし」という画面を押します。

 :20180228224758p:plain

縦にビヨーンと全部の字幕がでてきます。セリフをクリックすると動画の該当箇所に移動できます。

 :20180228212751p:plain

また、テキストを選択してコピーすることもできます。最初の1分間のところだけ貼り付けてみます。なかなかの精度で、発した言葉を文字にできていると思います。

(コピーした文の一部)

00:00

はい皆様こんにちは今日はですね pdf データに書き込みスペースをつける方法

00:07

その人ということで紹介していきたいとおもいます

00:10

えーとまずそもそもその書き込みスペースをつけるって言うのはどういう意味なのか

00:15

っていうのとか

00:16

あとはどういういいがあるのかっていうねそういうお話をしてから具体的な在り方を

00:21

紹介していきたいと思います宜しくお願いします

00:23

えーと今こちらにですね good ノートというアプリの中に pdf のデータが

00:27

今入っている状態です

00:29

これはちょっと世界史の

00:30

データで町の3枚分ほど用意したんですけどもまぁこんな感じになっていて good

00:35

ノートというアプリを今開いていますからこれに上から来て書き込みがいろいろできる

00:39

状態になっているわけです

ワードに貼り付けるとこんな感じ。5分ほど喋ると2000文字弱(時間部分も込みなので実際はもう少し少ない)の文字数になるようです。

 :20180228212758p:plain

今までだと、人が話したことを文字に起こすって結構大変だったわけですが、それが自動である程度の精度で、タダで簡単にできるようになるわけです。

こういう技術、もしかしたらいろいろな場面で使えるかも?と可能性を感じました。ちょっと思いつくのは次の通り…

①うまい授業動画・参考動画をテキストベースで書き出し、それを読んで(必要なら動画の対応部分も見ながら)感覚をつかむ。

②自分の授業をテキストベースで書き出し、客観的な視点で構成の入れ替えや論理の修正を紙で行う(“自力で”改良した説明の仕方のスクリプトができる)

今回はとりあえず、この自動字幕の精度が実用レベルに近づきつつある!っていう感想をまとめました。まだ可能性を感じる、という程度の段階ではありますが、使えそうな場面を見つけて積極的に使ってみようと思います。何かあればまた書きます。今回はここまで!