音声の書き起こしとビジネスモデルと

【レビュー】夢の「音声自動書き起こし」はもうすぐ実現!? Microsoftの「Video Indexer」を試す～動画・録音の音声を自動でテキスト化し翻訳も - PC Watch https://t.co/iFh4k4XIAV @pc_watchさんからあと読み
— 不破雷蔵 (@Fuwarin) 2017年12月14日

Microsoftは、同社のクラウドサービス「Microsoft Azure」において、機械学習を中心としたいわゆるAIをサービスとして提供する「Cognitive Services」を展開している。そのなかに「Video Indexer」というサービスがある。

AzureによるCognitive Servicesは、ソフトウエア開発者やサービスを使う企業のためのものであり、コンシューマには直接関わりはない。だが、ぜひみなさんにも状況を知っていただきたいと思う。Video Indexerは、現在「AI」として開発されている技術の先端であり、技術者であれば誰もが使えるものだ。「現在どこまで来たか」を知ることで、近い将来の姿を予見することができるはずだ。

技術の進歩は人を幸せにするのか、生活を便利にするのかという哲学的な話もあるけれど、少なくとも翻訳やメディア間のデータコンバートの件では便利になったよなあ、という感はある。自動翻訳はこの数年で随分精度が上がっているし、画像の識別も随分と整合性が取れるようになった。音声認識によるAIの対応も結構未来的な話ではあるけど、例のスマートスピーカーで一気に実用化に近づいた感じ。

音声データのテキスト化もまた然り。というか、スマートスピーカーと技術を共用するところはあるのだけどね。要は音声データから言葉に転換して、それをテキスト化するか、命令として判断するロジックにぶち込むかの違いでしかないから。

おおっと、公開されました。
「もうこのレベルになってる」ことが重要。AWSも乗り出してきたし、競争が起きつつあるので、改善はここから加速する、と期待しています。
（実際、音声認識はどんどん改善していますし） https://t.co/6K4k62fHbr
— Munechika Nishida (@mnishi41) 2017年12月13日

こちらの記事中には、実際にVideo Indexerで自動書き起こしとインデックス化がなされたデータに対するリンクがあります。
そのリンク先は自由に見れるので、「どのくらい、いまの段階でできているか」をまずチェックしていただければ。 https://t.co/DDPHK03xw4
— Munechika Nishida (@mnishi41) 2017年12月13日

AWSは先日のre:inventで、音声書き起こしの「Amazon Transcribe」と、文書解析の「Amazon Comprehend」を発表しています。これは、「書き起こしが実現したら文書量が爆発するので、サマライズとか自動分類とか、必要だよね？」（そうするとAWSの回転量が増えてAWSが儲かる）という論理。
— Munechika Nishida (@mnishi41) 2017年12月13日

要は「音声書き起こしがあたりまえのビジネス環境になる」ことを、AmazonやらMSやらはもう現実のものと想定しているわけで。もちろん、今日の段階では完璧ではないけれど、競争と改善が進むとどうなるだろうね......と考えてみていただければ。
— Munechika Nishida (@mnishi41) 2017年12月13日

まさに。「インデックス化されて再利用可能になる＝議事録の製作時間が不要になる」あたりが超絶キラー。しかも、映像にうつってるPPTとかもOCRされますし。 https://t.co/tG0AroP95S
— Munechika Nishida (@mnishi41) 2017年12月13日

ていうかAPIベースで提供されているので、そういう連携サービスを作るのはすぐにもできると思います。どっかが作ってくれないかな、と......（どこかを見る
— Munechika Nishida (@mnishi41) 2017年12月13日

で、指摘されている通り、音声データのテキスト化は非常に大きな需要がある。逆はテキストデータの発声化ですでに商用化されているけどね(ボーカロイドなどが好例)。これが気軽にできるようになれば、インタビューなんかも非常に楽になるし、難聴な人には大きな福音となる。YouTubeの字幕などでは精度が低いもののすでに導入されているけど、海外の報道などの動画をよりスマートに取得できるようになる。議事録なんてのも手間がダイナミック省ける。

その時に自分達の一連のサービスを使ってね、と提案すれば、大きなビジネスになる。この類のツールってのは一度使うと、他サービスへの乗り換えには躊躇するようになるからねえ。

言語圏によって高いハードルを持つところもあるけど、超えられないわけじゃない。色々な意味で将来が楽しみである......のと共に、この技術が浸透したら、テープ起こしの仕事は需要が減退するのだろうな、と思うと色々と頭に渦巻くものも生じたりする。

日	月	火	水	木	金	土
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

音声の書き起こしとビジネスモデルと

カテゴリ:

コメントする

カテゴリ

月別アーカイブ

最近の記事15件

サイト概略＆管理人

この記事について

検索

2021年6月

音声の書き起こしとビジネスモデルと

カテゴリ:

コメントする

カテゴリ

月別 アーカイブ

最近の記事15件

サイト概略＆管理人

この記事について

検索

2021年6月

月別アーカイブ