学芸員という生き物について

博物館で生業を立ててる人のはなし。

やっぱりAIは信用できない…

こないだ書いたAI文字起こしをやってみたのよ。テープ起こしが必要になったので。

 

gakugei-i.net

 

いつまで「テープ起こし」というのか、という問題はさておき。

それでWordの機能でざざーっとやってみたんだけど、これが全くもって使い物にならないというかなんでそうなったのというか。どうしてこんなになっちゃったのよとしかいいようが無いものが出てきて笑うしか無かった。

笑う?いや呆れる?

もともとの音声データ自体が良くなかったのもあるだろう。インタビュー映像から音声だけ切り抜いたモノなんだけど、ホワイトノイズは出てるし、広い空間で行ったから妙に音声が広がってるし、そこにきてマイクでしゃべってるので反響もしているし、で、状態としては最悪だったかもしれない。しかし聞けるレベルだからいけるかなとか思うじゃない。

読み込ませてやってみて、出てきたのが話者が一言も喋ってない内容だったからビックリしたよね。ビックリを通り越して怖い。一体誰の話を文字起こししたの…とかなり怖かった。

画家に話を聞いていて、本人の作品の説明とか描いた動機みたいなのをつらつらとだったはずなのに、AI文字起こしでできたモノは病院と入院に関するものだった。マジでどうした。

一言もそんなこと言ってなかったぞ。

これは、まだまだ精度が低いと見るべきか、データが不完全だとするべきか。もうちょっとマシになってるだろうと思っていたけど、数年前あったサービスの時とそんなに変わらない気もする。マイクロソフトではなく、他のサービスを使えば変わるだろうか。これは博打だな…データの加工(音声ボリュームの変更、ホワイトノイズ除去いろいろやってAIでも問題無く読み込めるような状態にする)の時間を考えると人力テープ起こしの方が早い気がしてきたぞ。

まだまだ「使える」ようになるまで遠い気もする。

他にAdobePremiere Proで起こしてみたけどこれもほぼダメだった。今度は女子大生の話になってしまった。なんでや。そんなこと一言も言ってなかったのに。どうやら音声の強弱でかなり変わるようだ。これ調整してやらないと使い物にならないな難しいわ。