マスコミの味方!? 音声・映像をAIで「自動文字起こし」手作業の時間 を3分の1以下に

パナソニック システムソリューションズ ジャパンは10月28日、AIとクラウドの技術を活用し、撮影・録音したデータを自動でテキスト化するサービス「P-VoT」(ピーボット)を11月13日にリリースすると発表した。放送・新聞・出版といったメディア企業のコンテンツ制作を効率化する狙い。
メディア業界では、コンテンツを制作する下準備として、インタビューなどの録音データをスタッフが聞き直し、手作業で書き起こすケースが多い。だが同社の試算によると、1時間分の音声・動画をテキスト化する作業の所要時間は約5時間掛かることもあり、長時間労働の一因になっているという。P-VoTでこれを約1.5時間にまで短縮し、業務改善につなげるとしている。
料金体系は従量課金制になっており、音声・映像を10秒分析するごとに20円の利用料が発生する仕組みとなっている。

引用:https://www.itmedia.co.jp/news/articles/1910/28/news101.html

─ YODOQの見方あ───────────────────────────

このシステムはマスコミだけでなく、システム業界でも活用が可能となっている。例えば重要な打合せの議事録としても活用が可能になる。データは複数人で共有できる上に、共同で編集作業を行うこともできたり、セクションごとにロックをかけて編集が完了したテキストを改変されないようにすることもできる。
およそ一時間の打合せとすると、60秒×60分で3600秒、で10秒が20円になっているので、1時間7200円の利用料となっている。社内用として利用するにはコスト的に厳しい面もあるが、重要な案件での取引先との打ち合わせであれば、このようなサービスの利用も検討範囲かもしれない。
また、本来想定される使い方の一環として、WEBページに掲載するためのインタビューコンテンツ作成にも利用できる。
今後、他の分野や業界でも工夫次第で様々なシーンでの活用が可能になるかと思う。