ペーパーカップ、自動AI吹き替え動画で2,000万ドル調達

吹き替えVerified Market Research社は、映画の吹き替えサービスだけでも2027年までに年間36億ドルを生み出すと予測している。

吹き替えはもうかる市場であるが、手間とコストがかかる作業でもある。平均して、5分間のナレーションを録音するのに、1時間の録音スタジオの時間がかかります。ある計算では、簡単なでさえ1分あたり75ドルかかるとされています。

この分野で期待されているのは。特に自然言語処理で、複数の言語で人間らしく聞こえる吹き替えを作成することによって、この作業をスピードアップすることです。これを追求している英国のスタートアップのひとつ、Papercupはこう主張しています。

「その技術がメディア大手のSkyNews、Discovery、Business Insiderに採用され、ボブ・ロスの代表的番組”The Joyof Painting”の30シーズンの翻訳に使われた」

CEOのJesse Shemen氏は、過去12ヶ月間でPapercupが翻訳したビデオを3億人以上が視聴したと見積もっている。「ローカライゼーションや翻訳の需要と、その需要を満たす能力との間には、大きなミスマッチがある」とShemen氏は言う。

Netflixの「イカゲーム」などの番組は、娯楽性が高く面白いコンテンツであれば、人々はどこで、どの言語で作成されたものでも視聴するというテーゼを実証しています。これが、この分野が成長する理由です。

Papercupは本日、Octopus Venturesが主導し、Local Globe、Sands Capital、Skyand Guardian Media Ventures、Entrepreneur First、BDMIが参加したシリーズA資金ラウンドで2000万ドルを調達したと発表した。

これにより、ロンドンを拠点とする同社のこれまでの調達総額はおよそ3050万ドルに達し、その大半は表現力豊かなAIが生成する音声に関する研究や、Papercupの外国語サポートの拡大に当てられると、Shemen氏は電子メールでTechCrunchに語っています。

Shemen氏とJiamengGao氏によって2017年に設立されたPapercupは、対象となる映画や番組の人間の声を識別し、新しい言語での吹き替えを生成するAI搭載の吹き替えソリューションを提供しています。

動画コンテンツ制作者は、動画をアップロードして言語を指定し、Papercupのネイティブスピーカーのチームが音声を品質チェックするのを待ち、合成ナレーションによる翻訳を受け取ることができます。

Shemen氏は、Papercupのプラットフォームは、手作業では追いつかない規模とペースで吹き替えを生成できると主張している。Papercupは、顧客のために作成したカスタム翻訳以外にも、「リアルな」トーンや感情を持つ音声のカタログを提供している。

映画やテレビだけでなく、社内コミュニケーション、企業アナウンス、教材などにも多く使用されているという。

「ヒューマン・イン・ザ・ループ」アプローチは、人間の翻訳者が品質管理を行い、正確さを保証することを意味しますが、翻訳全体を提供する場合よりもはるかに少ない手作業で済むため、より速く、より多くの翻訳を行うことができます。

「パンデミックの間、人々はより多くのビデオコンテンツを視聴し、それがわれわれのサービスに対する需要を大幅に増加させました。」

AIが生成する「合成メディア」の市場は拡大している。

Synthesia、Respeecher、ResembleAI、Deepdubなどの映像や音声に特化した企業が、番組や映画のAIダビングツールを発売している。スタートアップ以外にも、Nvidiaは俳優の顔の表情を取り込み、新しい言語とマッチングさせる方法でビデオを変更する技術を開発している。

しかし、デメリットもあるかもしれない。ワシントン・ポストが指摘するように、細部にまで注意を払わないAIによる吹き替えコンテンツは、「ローカルな味わい」を失う可能性がある。ある言語での表現が、別の言語では同じ意味にならないかもしれないのだ。

さらに、AIによる吹き替えは、亡くなった人の声を再現するかどうかなど、倫理的な問題を提起する。

また、現役の俳優の演技から生成された声の影響も不透明だ。ウォール・ストリート・ジャーナル紙は、複数の企業がプライベートなデモでモーガン・フリーマンの声を再現しようとしたと報じており、スタジオ側も「必要な場合」、例えばポストプロダクションでセリフに手を加える場合など、出演者の代わりに合成音声を使用しようとする条項を契約に追加するケースが増えているという。

Shemenは、Papercupをほぼ中立的なプラットフォームと位置づけていますが、その一方で、(ディープフェイクの作成など)悪用される可能性がないか、プラットフォームの利用を監視しているのも事実です。また、AIが生成する音声の表現力をよりきめ細かく制御し、洗練させることも可能です。

「(吹き替えの)価値は明確で、人は自分の言語ではない短いビデオを見たときに41%の情報を保持する。字幕をつけた場合は50%、Papercupを通して吹き替えをした場合は70%を保持する。字幕をつけるだけで、40%もアップするのです」とシェメンは言います。

真に感情的なクロスリンガルAIダビングで、Papercupはあらゆる形態のコンテンツに取り組み、ビデオとオーディオをより身近で楽しいものにします。Papercupは現在、ロンドンで38人を雇用し、3つの大陸に翻訳者ネットワークを構築しています。

同社は、年末までにこれが倍増することを期待しています。・・・日本版のNetflixはどうなんだろう?

あわせて読む

広告