概要
このプロジェクトは等身大美少女ロボット制作計画で開発中の人型ロボット「足立レイ」の、音声合成ソフトを作る事が目的です。目標金額が達成された場合、一般向けに販売します。
足立レイ ロボット初期設計図
どんなソフト?
AI技術を用いたテキスト読み上げソフトです。株式会社エーアイ様が提供するA.I.VOICE(エーアイボイス)の技術を使用しています。ただ、その元となる音声は、声優の声ではなく、独自技術で生成された合成音で、合成音のさらにレプリカ、「レプリボイス(Replivoice) 」と名付けました。
クラウドファンディングが成功した場合、その名称で独自ブランドとして販売します。(※他A.I.VOICEライブラリとは同じエディター上で使用可能になる予定です)
(技術協力:株式会社エーアイ )
A.I.VOICE
特徴
大きな特徴として、いわゆる中の人(声優さん)がいません。
どういう事かというと、普通は声優さんの声を録音して合成音声の素材にしたり、声を機械学習させたりして声のモデルを作るのですが、この音声は元々正弦波合成で、100%人工的に音波を生成した音声だからです。
簡単に図解すると、こういう作り方になります。
作った音声をUTAUで喋らせたのがこちらです。
「合成音」感の強い声ではありますが、ちゃんと女の子の声には聞こえるようになっていると思います。また、「合成音感」が程よく強い声、というのを目指して作ってもいます。
これまでの経緯
ロボット開発の一環として、ロボット用の合成音声の開発も行ってきました。声はキャラクター用エンターテイメント向けロボットにとっては重要な要素で、完成には必ず必要と考えています。
足動作試験
その際、「せっかくロボットキャラなんだから声も一から人工的に生成したら面白いんじゃないか」と思って開発を始めたのがきっかけです。
そこで先ずは歌声合成ソフトUTAU用に足立レイのUTAU音源を作りました。(DLリンク)
【足立レイ】中の人のいない合成音声作った【UTAU音源配布】
UTAU音源を用いて喋らせられるソフトを使って、ロボットの開発実況なども行っています。
しかし歌声合成用のソフトを使って喋らせているため、特にイントネーションが不自然という問題がありました。
(※より詳細な経緯については、トップ画像にもリンクされているこちらの動画を見て頂けると幸いです。内容的には以降の記事とほぼ同一です)
そこで2年ほど前、テキスト読み上げソフトAITalkを提供している株式会社エーアイさんに連絡を取り、「人間の声じゃない合成音声ソフトからの声でもAITalkのライブラリにする事が可能か」というかなり無茶な問い合わせをしました。
普通、読み上げソフトを作る場合、音素バランス文と呼ばれるいろいろな声をバランスよく含んだ文章を500文くらい声優さんに読み上げてもらい、それを合成用の素材として使えるように分割していきます。 (ここからここまでが「か」の子音、ここからここまでが母音、というように)
しかし今回はそもそもその元となる声優さんがいないため、「収録」できません。
そこで、合成音で喋らせた音声を使って、人間用のシステムをそのまま利用して「合成音声の合成音声ライブラリ」をつくれないか、3回ほどの試作と試行錯誤の末、それなりにちゃんとしゃべってくれるものができました。いわば「ロボットの声を収録して作ったロボットが中の人の合成音声」です。
ロボット搭載用としては目途が立ったわけですが、せっかくここまでできたので、ロボット専用のシステムとしてだけでなく、一般向けの販売もしてみたいと考えました。
そこでそのための資金を得るために今回のクラウドファンディングを計画しました!もし面白い、欲しいと思って頂けたら、ぜひご支援よろしくお願い致します。
また、これまでこのようなイレギュラーかつ、新開発の音声合成システムの方向性・コンセプトと、ある意味真逆の試みに快くご協力頂いております株式会社エーアイ様に深く感謝申し上げます。
リターン
リターンは足立レイの合成音声ソフト(A.I.VOICE)パッケージ版と、固有製造ナンバー入りの3Dモデル、その3Dモデルデータの入ったナンバー入りカード型USBメモリです。モデルはフルスクラッチで自作しました!
3Dモデルは通常版(00番)はすでに配布しています。ニコニ立体
支援者の方には胸のナンバーを固有のものに変更したモデルを配布します。今後ナンバー入りを作るかは分かりませんが、初期ロットとして今回のクラウドファンディング支援者の方のナンバーが何番までか発表します。形式はVRMとMMD用テクスチャです。
また、完成後の公式告知動画に支援者名をクレジットさせて頂きます。任意のハンドルネーム(もちろん本名も可)を備考欄に記入をお願い致します。
また、10万円のプランとして製作中のロボットの開発過程で生じた、各身体パーツの実寸大の試作品を含めたリターンを用意してみました。各部1つ限定です。機械部品は高価で無理なので、3Dプリントの樹脂構造体パーツになります。
また、ロボットの3Dプリント骨材として採用しているカーボン(短繊維)入りのエンジニアリングプラスチックでできたキーホルダーもこちらのプランに入れます。(写真は実際のパーツです)
素材の値段も高くプリント難度も高いため大量には作れないのですが、記念品として作ってみようと思います。
------------------------------------------------------------------
2021.3.22追記
新たにデータのみのリターン(支援者名クレジット、色違い3Dモデル、パッケージ絵先行公開、レプリボイス足立レイによるお礼ボイス(発売に先行))と、足立レイ(ロボット)一日操縦体験のリターンを追加しました!
パッケージ絵(リターンで先行公開)はみさいる(@missile_39)が自分で描く予定です。参考に先日描いた絵を載せます。気合いを入れて描きます!
データのみリターンの方の3Dモデルは色違い(紺色)ですが胸のナンバーは2021番で共通です。
操縦体験の方のプランのモデルのレスキューカラーの胸ナンバーは個別に振り分けます。
追記終わり
------------------------------------------------------------
ストレッチゴール
AITalk5の機能として、感情表現対応させることが可能です。これは話者適応という技術で、個別に新たな収録をすることなく、喜び・悲しみ・怒りの感情対応をさせる事が可能です。そこで450万円、550万円、650万円達成毎に感情パターンを追加します。
音声の感情機能はロボットのコミュニケーション用の用途としても期待でき、実現した場合は感情表現に対応したロボットの表情変化などの機能の実装を実現したいと考えています。
ロボット開発には多くの費用がかかりるため、多く達成された場合にはロボット開発に存分に使わせて頂こうと思っています。
余裕があればもっと挑戦的な開発ができるので、大きく達成できると嬉しいです!
達成後のスケジュール予定
クラウドファンディング終了:3月末
法人登記:4月中旬
感情決定・音声辞書制作開始:4月末
マスタ完成:7月初旬
パッケージ制作・メディア増産:7月中旬
パッケージ納品:8月中旬
発送開始:9月
一般への販売開始は10月以降になる予定です。
これまでの活動
2008年頃から、等身大のエンターテイメント向けキャラクターのロボットの開発を行ってきました。(当時の記事)2017年からは現在開発中の足立レイの開発を開始しました。同時に、2018年にそのロボット用合成音声としてUTAUライブラリの開発を行い、リリースしました。今回のクラウドファンディングはその合成音声の「読み上げソフト化」の計画になります。
現在、日本大学理工学研究科精密機械工学専攻博士後期課程2年次に所属し、等身大2足歩行ロボットの研究や合成音声の研究をしています。
本クラウドファンディングに関連した研究としては以下のような論文も書いております。
Q&A
・最低目標金額が低くないか
これはいくつかの要因がありますが、一つは人工の音声であるため収録費用等が掛からない事、また、元々ピッチの安定した合成音声データであるため技術的に収録データが少なくて済む事、イラストや3Dモデルも自ら制作している事、等があります。
感情機能についてはAITalk5の新機能により追加され、新たにライブラリを増やす必要はないため、比較的低コストでの追加が可能となっています。
・UTAU音源からの声質の変化
ほとんど無いと考えられます。試作として50文章から作成したライブラリでの音声を聞いてみたところ、製作者自身でもほぼ同じだと感じられる程に同じ声質でした。これは元々合成音声である事と、合成音(UTAU単独音、一対の音素のピッチ変化)であるために辞書化するためのデータとしてもかなり均質なデータになるためだと考えています。
・どのように販売されるのか
クラウドファンディングが成功した場合、販売の為に法人を設立する予定です。また、今のところ通信販売のみを考えています。
理由としてはまず、エーアイ様とのライセンス契約の為に法人格が必要なためです。また、大規模な販売網なども持っておらず、当面はできるだけコンパクトに手の届く範囲で展開したいと考えています。
・A.I.VOICEとの関連性
【レプリボイス「足立レイ」powered by A.I.VOICE 】の様な形の表記になる予定です。
元音声の人工的な合成以降の部分は同じものを用いているのですが、根本の合成技術やコンセプトが全く異なり、つまるところ最新のエーアイ様の合成エンジンを使いながらも、性質上、生声らしさとは逆の方向を目指した声であるため、A.I.VOICEの合成音イメージに影響を与える事を避けたいという面もあり、明確に判別可能な別ブランド名にしようと考えています。
コメント
もっと見る