【音楽生成AI】GPT-2を応用した音楽生成AI「Chord2Melody」リリース

GPT-2を応用した、Transformerベースの音楽生成AI、「Chord2Melody」がリリースされました。

リリース内容

これまで、日本語版GPT-2プロジェクトを通じて、GPT-2及びTransformerをベースとしたニューラルネットワークの学習について知見を得てきました。

この度、GPT-2を応用した、Transformerベースの音楽生成AI、「Chord2Melody」を作成し、リリースしました。

「Chord2Melody」は、音楽を構成する音符を時間単位に分割し、音階とトラックからなる‘単語’の列を、GPT-2の文章生成と同じように生成する事が出来ます。

これはつまり、AIによる音楽の作曲と言えます。

「Chord2Melody」の特徴は、コード進行からメロディーを生成する機能や、（GPT-2と同じように）途中まで作った曲の続きを作曲する機能がある点です。

「Chord2Melody」は、以下のGitHubにて公開しています。

https://github.com/tanreinama/chord2melody

Related Works

これまで、音楽を生成するAIとしては、敵対的生成ネットワーク（GAN）を使用した、MuseGANがありました。

MuseGANは、AmazonのDeepComposer（Amazonの作曲AI）のベースとして利用されていることでも知られています。

MuseGANでは、音符をpianorollとして扱い、1トラックの情報を2次元の画像状に加工します。そして、複数のトラックを含めた3次元データを、畳み込みニューラルネットワーク（CNN）を使ったGANで生成しています。

一方、Transformerベースの画像を生成するAIとして、Image-GPTがあります。

Image-GPTは、画像を構成する画素を、k-meanによってクラスタリングし、画素の並びを‘単語’列として扱うことで、GPT-2と同じように画像を生成しています。

Image-GPTは、Transformerベースのモデルは、離散的な時系列的データであれば、様々なデータを生成可能な事を示しています。

Our Works

音楽を構成する音符を時間単位に分割し、音階とトラックからなる‘単語’の列を作成しました。

‘単語’の列は、音が鳴っている事を表す‘Note’と、時間を進める事を表す‘Timenote’があり、‘Note’は、トラック（鳴らす楽器）と、音階を表す固有のIDからなっています。

‘Timenote’は、音楽を16分音符単位で時間的に分割し、次の単位へと移動することを表します。

つまり、「NoteA・NoteB・NoteB・Timenote」という単語の進行は、A,B,Cという三つの音を同時にならす和音の、16分音符分の時間を表しています。

学習させたデータは、Lakh Pianoroll Datasetを使用し、Data Augmentationとしてランダムに変調したデータを6倍用意しました。

そのデータを、GPT-2と同等のTransformerベースのモデルに学習させました。

モデルは、12層のヘッダー、12層のTransformers、768のノード数、1024のコンテキスト数からなり、GPT-2（117M）と同等の深さがあります。

Lakh Pianoroll Datasetは、5トラックからなるデータと、17トラックからなるデータがあるので、学習したモデルも2種類あります。

トラック数により出力される‘単語’の総数が変わるので、モデルのパラメーターも異なります。各モデルは、それぞれ86,167,296個と86,941,440個のパラメーターからなっています。

Samples

「Chord2Melody」が生成した音楽のサンプルは、以下のURLからダウンロード出来ます。

https://github.com/tanreinama/chord2melody/tree/main/samples

【GPT2日本語版】正式版のモデル（mediumモデル-旧名称345Mモデル）をリリースしました

【改良BERT】BERTの改良版「RoBERTa」日本語版リリース

活動報告一覧を見るプロジェクトを見る

tanreinama

東京都

初めてのプロジェクトです

坂本俊之フリーランスの機械学習エンジニア・件ITコンサルタント。現在は人工知能関連のエッジ開発に携わる。

認証していません
https://nama.ne.jp/

メッセージを送る

リターンを選ぶ

500円

学習済みモデルの公開時にメールでお知らせします。

支援者：2人

お届け予定：2020年11月
3,000円

学習済みモデルの公開時にメールでお知らせします。また、special_thanks.txtにお名前（またはニックネーム）を掲載します。 ★必ず、掲載するお名前（またはニックネーム…

支援者：6人

お届け予定：2020年11月
10,000円

学習済みモデルの公開時にメールでお知らせします。また、special_thanks.txtにお名前（またはニックネーム）を掲載します。 ★必ず、掲載するお名前（またはニックネーム…

支援者：17人

お届け予定：2020年11月

リターンを選ぶ

500円

学習済みモデルの公開時にメールでお知らせします。

支援者：2人

お届け予定：2020年11月

このリターンを選択する
3,000円

学習済みモデルの公開時にメールでお知らせします。また、special_thanks.txtにお名前（またはニックネーム）を掲載します。 ★必ず、掲載するお名前（またはニックネーム）を備考欄に記載してください。 ★または掲載して欲しくない場合にも、備考欄にその旨お願いします。

支援者：6人

お届け予定：2020年11月

このリターンを選択する
10,000円

学習済みモデルの公開時にメールでお知らせします。また、special_thanks.txtにお名前（またはニックネーム）を掲載します。 ★必ず、掲載するお名前（またはニックネーム）を備考欄に記載してください。 ★または掲載して欲しくない場合にも、備考欄にその旨お願いします。 GPT2のトレーニングに使用したソースコードと、クローリングに使用したプログラムを提供します（ほぼ公開されているコードそのままですが、データの作成に必要となるコマンド等です）。

支援者：17人

お届け予定：2020年11月

このリターンを選択する

このプロジェクトは、All-In方式です。
目標金額に関わらず、2020/09/21 23:59:59までに集まった金額がファンディングされます。

FAQ

Q. 支払い方法は何がありますか？
A. クレジットカード払い（Visa/Mastercard/JCB/Diners Club/American Express）、コンビニ払い（全国の主要コンビニエンスストア）、銀行振込、auかんたん決済、ソフトバンクまとめて支払い・ワイモバイルまとめて支払い、d払い、PayPal、FamiPay、PayPay、楽天ペイ、au PAYをご利用いただけます。
Q. クレジットカードの決済はいつ行われますか？
A. 「All-or-Nothing」では募集期間中に目標金額を達成した場合、「All-In」では目標金額の達成・未達成に関わらず、プロジェクトは成立となります。募集期間内にプロジェクトが成立した場合のみ、支援金の決済が実行されます。募集期間内にプロジェクトが成立しない場合は、支援金の決済は実行されません。その場合はプロジェクトオーナーに支援金は支払われず、選択したリターンの発送（履行）もありません。
Q. プロジェクトに関する質問はどうすればいいですか？
A. プロジェクト内容に関するご質問やご意見は、プロジェクトオーナーへCAMPFIREのメッセージ機能をご利用ください。
Q. 間違って支援した場合はどうなりますか？
A. 選択したリターンの変更・キャンセル・返金は一切受け付けておりません。リターンの変更・キャンセル・返金については、各プロジェクトオーナーへ直接お問い合わせください。

「危険すぎる」と話題になった文章生成AI、GPT2の日本語版を作成したい

このプロジェクトを見た人はこちらもチェックしています

「危険すぎる」と話題になった文章生成AI、GPT2の日本語版を作成したい

このプロジェクトを見た人はこちらもチェックしています