1: 2019/03/28(木) 06:11:08.39 ID:CAP_USER
■名探偵コナン』のアノ発明品が現実に

もはや国民的アニメと呼んでも良いだろう『名探偵コナン』。その中でお馴染みなのが、主人公・江戸川コナン(実は高校2年生の工藤新一が、悪の組織によって小学1年生に変えられてしまった姿)が私立探偵・毛利小五郎の体を借りて事件の真相を暴くシーンだ。

コナンは彼を睡眠薬で眠らせると、胸に付けた「蝶ネクタイ型変声機」を使って、自分の声を毛利小五郎そっくりに変換する。そして自らつきとめた事実を語って、問題を解決するのである――あたかも毛利小五郎が事件の謎を解いたかのようにして。

もちろん名探偵コナンはフィクション作品だが、多くのフィクション作品と同様に、劇中に登場するテクノロジーに現実のテクノロジーが追い付こうとしている。そう、この蝶ネクタイ型変声機さながらの「声の変換」を実現する技術が登場しているのだ。

まずはこちらのデモ映像をご覧いただこう。

(中略)

自分や誰かの声を任意に変化させることを「音声モーフィング」と呼び、いまAI技術をこの分野に応用しようという取り組みが盛んになっている。

そしてModulateがこのサービスを実現するのに活用したのが、「GAN(Generative Adversarial Networks、競争式生成ネットワーク)」と呼ばれる最新のAI技術だ。

■悪用防止の対策はあるものの…

GANについては、以前フェイクニュースに関する記事でも取り上げたことがある。簡単に説明すると、目標とするコンテンツを自動生成するAIと、そのコンテンツが本物かどうか見破るAIを用意し、その間でコンテンツ生成と真偽鑑定の「競争」を何千何万回と繰り返させることで、より自然で本物に近いコンテンツを生成できるようにするという手法である。

GANはいま、映像コンテンツ生成の分野で大きく注目されており、その威力を見せつけるものとして、同じくオバマ前大統領をサンプルとした(なぜか彼はデモの素材として人気らしい)有名なフェイク動画がある。

■動画
You Won’t Believe What Obama Says In This Video! 😉 https://youtu.be/cQ54GDm1eL0

この中で偽のオバマ氏は、「キルモンガー(映画『ブラックパンサー』に登場する悪役)は正しい」「トランプ大統領は大バカ者」など、本物がまったく言いそうにないセリフを口にしている。

そのため彼をよく知る人であれば、「何かおかしい」というフェイクの可能性を疑うことだろう。しかし彼の性格や表現のスタイルについてよく知らないという場合は、これがフェイクかどうか見破るのは至難の業に違いない。

そうした高品質のフェイク映像をつくり出せるAI技術を活用しているのが、Modulateのサービスというわけだ。となれば悪用が心配されるところだが、当然ながら同社もそのような使い道は推奨しておらず、たとえばオンラインゲームなどで使用するアバターに好きな声を喋らせるといった活用法を想定しているそうである。

最近は他のユーザーとマイクを通じてコミュニケーションできるオンラインゲームも増えているが、いくらアバターを可愛らしい女性にしても、野太い声では自分が中年男性だとばれてしまう(もちろんその逆のパターンもあるだろう)。そこでアバターを自分好みに着飾るのと同様に、声も好きなようにカスタマイズできれば、というわけだ。

■動画
Modulate: Unlock Your Voice https://youtu.be/lJBJOnryOLU

https://amd.c.yimg.jp/amd/20190326-00063693-gendaibiz-000-1-view.jpg
 
■オレオレ詐欺がさらに横行? 

人間がいかに音声によるコミュニケーションに騙されやすいか、振り込め詐欺、つまり「オレオレ詐欺」の被害が一向に無くならない日本に住む私たちには、痛いほどわかっているだろう。そんな状況でModulateのような音声モーフィングサービスが普及すれば、さらに詐欺行為が横行してしまう不安はないのだろうか。

実際に、気になる研究結果が出ている。アラバマ大学バーミンガム校コンピューターサイエンス学部の研究によると、人間の脳は、よく似た人間の音声の聞き比べができない可能性があるそうだ。

この研究を指揮した、主任研究者のNitesh Saxena博士は、同校のニュースリリースにおいて「人間は音声モーフィングを使用した攻撃に対し、根本的に脆弱な存在である可能性がある」と指摘している。

この研究では、オリジナルの声と変換によってつくられた声を被験者に聞かせ、その際に脳がどのような反応を示すかを、機能的近赤外分光法(fNIRS)という手法を使って観測した。

すると違う人の音声を聞かせた際には、脳の動きに違いが見られたものの、オリジナルの音声と、変換によってそれに似せた音声を聞かせた際には、脳内で同じ処理が行われていたそうである。つまりあくまで音声だけをインプットとした場合、人間の脳はオリジナルの声と、変換によってつくられた声に対して、脳のレベルで聞き分けができていないわけだ。

続きはソースで

https://amd.c.yimg.jp/amd/20190326-00063693-gendaibiz-000-1-view.jpg

https://gendai.ismedia.jp/articles/-/63693

images

引用元: ・【AI】まるで『名探偵コナン』…遂に誕生した万能「変声機」の凄さと怖さ[03/26]


続きを読む

Source: 理系にゅーす