RRR日記(12)
長嶋 洋一
2026年3月12日(木)
柏から帰ってきた翌日の昨日は「3.11」ということで、 RRR日記(11) のラストにちらっと書いたが、HTMLが目安の200KBを超えてこちらのページに移動したので、そこでオシマイとしていたが、実はその後が長かった。 ここに書いているのはそういうわけでまだ昨日の3/11なのだが、まぁ長期的には誤差に埋もれるのでご容赦を。 午前にはロボット教室のアドバンス教材の4回目を完成させたが、タッチスイッチから光センサになっただけなので、動画も撮らず今回はさらっと流した。
![]()
午後に最初にやったのは上のように、これまで「Arduino専用機」だったWindowsマシンへのProcessingインストールである。 Processingのバージョンは4.5.2になっていて、それは僕のお仕事Mac miniでは「古過ぎる」と断られたのだが、まぁ中身はぼちぼちほぼ互換だろう。 例によって「寄付してね」の画面にふっとばされたが、だいぶ前にちゃんとDonateしているので今回はパスとなった。 これで新しいプロジェクトで、このPCでプログラミングしたArduino(センサ出張所)からserialで受けてProcessingがグラフィックを生成したり音が鳴ったり・・・というマルチメディア版に展開できる。
![]()
そして次に、だいぶ懸案として残っていたのだが、あの秀逸な「Matrix.swf」をWindowsで走らせる・・・という課題に取り組んだ。 Adobeはだいぶ前にFLASHサポートを終了しているので、 ChatGPTによれば「Ruffle」というエミュレータがあるとの事で試してみたが、これでは動かなかった。 さらにChatGPTによればGitHubの奥底にはexeのFlash Playerが残っているとの事で、こちらは無事にゲット出来て、上のように動作も確認できた。 これでようやく、「Windows」・「古いIntel Mac」・「新しいMac」の3種類とも、「Matrix.swf」を走らせることができたので、ここで備忘録としてまとめておこう。
新しいMacの「Elmedia Video Player」の様子は以下のようなもので、ビデオのための「再生/早送りボタン」は無関係で実行される。
- Windows11 - このzipを解凍して中のswfを中のexeに投げ込む
- 古いIntel Mac - このzipを解凍して中のswfを中の「Flash Player.app」に投げ込む
- 新しいMac - ここから「Elmedia Video Player」をゲットしてインストールして、そこにMatrix.swfを投げ込む
![]()
最後に、新MacBookAir(Apple Silicon)にProcessing4.5.2をインストールして、主だったライブラリやサンプル等を完備しようかな・・・と思ったところ、既に4.4.10がインストールされていた。 そこで、こちらもApple Silicon対応の4.5.2に上げて、主だったライブラリ等も完備してみた。
そしてsunoである。 RRR日記(11) のラストにまとめたように、ChatGPTの解説から「sunoに楽器の指定は無意味」ということもあって、今回は形容詞をテンコ盛りにしてみた。 危ない、おどろおどしい、怪しい感じの単語をズラズラと並べてみたのである。
●本日のsuno生成音楽(2026.03.11)●
タイトル : Underground Earthquake Gospel
使用したモデル : v5
与えたPrompt : noise, shout, break, bomb, explosion, violence, crazy, ecstasy, hell, space, distortion, powerful, very slow tempo, deeply, chaos, eccentric, duration is 5 minutes, earthquake, madman, witch, underground, growl
出てきたPrompt : Monolithic doom-metal slab at a glacial tempo; male vocals shifting between guttural growls and unhinged shouts, Guitars tuned down and drenched in fuzz, feedback howling in long tails; bass rattles like distant tectonic plates, Sparse, cavernous drums strike like falling granite, with ritual tom patterns, Reverb-drenched witch-chant harmonies rise in the bridge, then everything collapses into a single, distorted riff that grinds the track to its final breath, noise, slow
Result : Underground Earthquake Gospel 1 - Underground Earthquake Gospel 2出てきたタイトルは「Underground Earthquake Gospel」ということで、僕のプロンプトから拾っている感じ(Gospelは未指定)なのだが、結局のところ、また「メタル」なのだった。 suno自身が「doom-metal」とプロンプトに明記していた。 本当にsunoはメタルが好きなのか、あるいはメタル好きがどんどんsunoに学習させているのか、デスメタルというか重低音(これ自体は嫌いではないが)に満ち満ちた、6分9秒と6分12秒の曲が、およそ3分間と4分間で作られた。 まぁ、これは即「捨て」ではないものの、ちょっと「イイネ」も付けられないなぁ。
![]()
そしてようやく、ここから本当に3/12の朝に書いているのだが、「果報は寝て待て」の格言通りに、昨夜は遂にアイデアが降ってきた。 ずっと懸案だった日本時間学会大会の発表内容(要旨原稿提出)について、あれこれメモは散発的に書いていたのだが、遂にそれらが結び付いて、夜中に夢現(ゆめうつつ)の状態ながらスッキリと整理されていた。 起床して日々のroutineをこなして自室に入り、ものの10数分で上のような、学会大会当日にデモするための全てが完成してしまった。 伏線としては、ずっと続けていた音楽生成AI(suno)もあり、さらに音楽即興学会大会の招待講演・大黒先生のトークと著書2冊もあり、これまで進めてきた色々がちゃんと結実しているのは面白い。 やはり、人間の脳というのは統計学習であり「睡眠」の機会に潜在学習するのだろう。
そして午前中には、上のような「要旨」を完成させて、時間学会事務局に送ってしまった。 これで準備は完了ということになる。 少しずつ懸案を片付けていかないといけないので、まだまだ気を抜けないのだ。 明日はロボット教室のミドル、明後日はロボプロのスタートアップ、その翌日は午前ミドル→午後アドバンスなのだが、土曜の午後には以下のイベントに遅刻しつつ駆け付ける必要があり、クルマで行って飲まずに速攻で帰る(2次会もパス)ことになりそうである。 まぁ、主役は定年退官する3人の元同僚なので、僕は隅っこでちらっと挨拶するだけにしよう。「タイパ」の時代と音楽 筆者は日本時間学会第2回大会(2010)にて「コンピュータ音楽における"時間"」、第5回大会(2013)にて「音楽における人間の知覚認知と時間」と いうタイトルで発表し、他の時間学会大会でも時間芸術である「音楽」に関連した時間学的な視点・知見を提供してきた。本発表ではその延長として 「ある音楽作品を作曲するのに要する時間」と「その音楽作品を演奏/鑑賞するのに要する時間」との関係について考えてみたい。 かつて作曲家がピアノに向かって楽譜を書いていた時代に比べて、コンピュータ時代の作曲はずいぶん楽になったと思われている。MIDIベースの 「打ち込み音楽」(DTM)であれば、3バイトのデータを送ると1つの楽器音(高さ、強さ、音色)がONで鳴り、続くデータでOFFに減衰して「音価」 (音の長さ)が決定する。これはMIDI電子音源(音響信号処理技術)の助けがあって実現されているのだが、シーケンスソフトウェアの効率的編集に よって確かに効率は上がった。しかしMIDI音源でなく実際の音響まで手作りする電子音響音楽の作曲では、長さ25分の作品を作曲するのに繰り返し 繰り返し音響要素を微調整して1000時間かかり、次の作品では作業の要領が10倍良くなって100時間で出来た経験がある。「ある音楽作品を 作曲するのに要する時間」については、出来る可能性が拡張されれば時間をいくらでもかけるのが「創作」の世界であると言える。 一方、作曲された作品を「演奏」する場があり、さらにその音楽を聴取/鑑賞する場がある。音楽作品が演奏されるコンサートホールやライブ会場に 出かけるだけでなく、「ウォークマン → iPod → スマホ」などを個人が持ち歩いて音楽鑑賞できる時代となって、この「時間」は大きく変貌してきた。 「タイパ」(Time Performance)のために動画を倍速で見る若者も多いという現代、頭出し選曲にヒットしたいポピュラー音楽では「イントロ」がどんどん 減ってきて、昔よりもいきなりサビから入る曲が増え、ボーカルの歌詞もぎっしりと詰め込まれている。ここで問題となるのが、会話音声を倍速再生しても 内容が聞き取れる(タイパ良し)として、果たして音楽作品を倍速で聞くことは作曲家の意図に従って「鑑賞」していることになるのか、という問いである。 最近の音楽生成AIは「5分間」と指定したプロンプトを与えると2-3分間ほどで立派な楽曲(音響)を生成してくれる。人間の作曲家は作曲のために ほぼ演奏時間以上の時間をかけてきたが、音楽生成AIはMIDIベースの音楽情報(音楽理論や音楽知識)を持たない。演奏時間よりもずっと短時間で データとして「生成」(作曲)されたその音楽作品を倍速で演奏/鑑賞した場合、これは音楽体験としてどのような意味があるのか、興味は尽きない。
![]()
次にChatGPTに行って、こちらも懸案だった点を聞いてみた。 sunoをゲットしたWenCatalogというのには、sunoともう一つ、suno AI Musicという謎のものがあったのだが、そちらはガセだとの事で、安心してuninstallできた。 これも一つの収穫である。
そしていつものChatGPT余計なお世話で「AI音楽研究者が今一番驚いていること(2025〜2026)を解説しましょうか?」というので聞いてみたが、とりあえずメモしたのが上のリストである。 そして最後の項目から「Sunoが苦手な音楽トップ10」を紹介できる、とのことだったが、以下のようにほぼ明確だった。
- 音楽生成は「音声生成」問題だった : 昔の研究は「music = symbolic sequence」、今の研究は「music = audio generation」
- これから起きると予想されていること : 個人専用音楽AI、リアルタイム作曲、映像と同期生成、インタラクティブ音楽
- テンポを曖昧にする : 「free tempo」・「rubato」 → ドラムが消えやすい
- ドラムが消えやすいプロンプト : 「minimal ambient piano」・「slow evolving pads」・「free tempo」・「no percussion instruments」・「atmospheric soundscape」
- Sunoが最も苦手な音楽ジャンル : 現代音楽、完全無拍子音楽、ノイズ音楽
そして「逆にSunoが得意なジャンル」として、「現代商業音楽」と開き直っていた。 別にChatGPTが開き直っているわけではないのだが、そんな感じである。 なんでもメタルになる、という僕の感想も強ち間違いでもなさそうだ。 しかし、現代音楽や無拍子音楽やピアノソロが苦手だ・・・ということだったが、 これ とか これ とかは立派に出来たので、やみくもに入れてみたプロンプトが成功していたらしい。
- 完全な無拍子音楽 → かなりの確率で勝手にビートが入る
- 完全なソロ楽器 → パッド、ピアノ、ドラムなどが勝手に追加される
- 長いクラシック形式 → Sunoはポップ曲構造(3〜4分)に最適化されている
- 複雑なポリフォニー(バッハ風フーガや多声対位法) → AIは「和声+メロディ中心」なので独立した複数声部は弱い
- 正確な楽器指定 : 「oboe + bassoon + contrabassoon」 → 「strings + piano + synth」に置き換えられがち
- 実験音楽(ノイズやグリッチやmusique concrete) → Sunoは「音楽らしい音楽」に寄る
- 現代クラシック → AIが不協和の構造を維持できない
- 完全な無伴奏歌(a cappella や solo vocal) → 背景パッドやビートが入りやすい
- 非西洋音楽 → トレーニングデータが西洋ポップ中心
- 数学的音楽 → AIは統計音楽なので規則的な作曲体系は苦手
sunoの「Song Description」には、いつも使う「Instrumental」(ボーカル無し)の他に「+ Lyrics」(歌詞)と、あと「+ Audio」というのがある。 これが気になっていたので聞いてみると、やはり文章ではなく「音声・音楽ファイルを元に曲を作る」機能だ、とのことだった。 「Audio をクリック」→「音声ファイルをアップロード」→「その音を **参考素材(プロンプト)**として曲生成」らしい。 音声ファイルとしては、自分のメロディ(鼻歌やピアノ)、雰囲気サンプル、ボイス素材などなんでもいいらしい。
「もう一つ重要(Sunoの裏仕様)」として、このAudioは「Suno v4以降」でかなり強く効く(テキストより影響が大きい)ので、「no drums」などが効かない時は「ドラム無しのAudioを入れる」と成功率が上がるという。 これはもう、早速やってみたくなった。 また「面白い裏技」として、「無音Audioを入れる」→ AIの暴走を減らす / 余計なアレンジが減る、というのもあった。 ただしここで先に「no drums」を通す方法、というのがあったので聞いてみると、以下のようなものだった。そして、ついでに「既存の曲をそのまま入れると著作権的に問題は?」と聞いてみると、以下のような「ChatGPTによる説」が出てきたので、これも置いておこう。
- 「ドラム無しジャンル」を書く : 「solo piano」・「ambient piano」・「minimal piano」・「string quartet」・「chamber music」・「ambient soundscape」・「drone ambient」
- 「ドラムが存在しない楽器編成を書く」 : 「solo harp」・「piano and cello duet」・「string quartet」・「choir a cappella」
- tempo を消す(これ重要) : 「free tempo」・「rubato」・「no percussion」・「floating」・「ambient piano」
- rhythm を「弱く」指定 : 「floating rhythm」・「no strong beat」
- Audioを使う(かなり効く) : 「無音」・「ピアノ単音」・「環境音」
- 「ambient」・「drone」・「soundscape」を入れる
- 「Lo-fi」を避ける
- 上級者テク(かなり効く) : 「through composed」(繰り返しリズム無し)
- Sunoでドラムを消す黄金プロンプト : ambient piano solo, free tempo, rubato, intimate, through composed
ということで、Audioを入れることと、「Sunoでドラムを消す黄金プロンプト : ambient piano solo, free tempo, rubato, intimate, through composed」を試すこと、は必須となった。 ここで思い出した(実は昨夜、夢現の中で出てきた)のが、かつて作ったサウンドである。 意外とすんなり発掘できたのだが、 RRR日記(11) の「2019年3月29日(金)」のころにあった、 どこを切り取っても"Stairway to Heaven"と3秒で分かる である。 ところがやってみると、どうもsunoは「Audioの最初の数秒しか見ていない」とのことだった。 そこでMaxで「5秒間のホワイトノイズ」というwavファイルを作ってsunoに食わせて、「Instrument」指定、「ambient, free tempo, rubato, intimate, through composed」というプロンプトでやってみたが、面白くないpiano曲が生成されただけだった。 原因はChatGPTがsuno v4をベースとしていたためで、v5で仕様が変われば役に立たないアドバイスとなっていた。 どうもこれは、なかなか厄介なのかもしれない。
- 既存の曲をそのまま Audio に入れるのは注意が必要
- 個人的に試すだけ(公開しない)なら通常は問題になりにくい (日本でも「私的複製(著作権法30条)」の範囲に近いケース)
- 公開すると問題になる可能性 - Audioに入れた音源は著作物の複製、生成曲が似る可能性
- 特に危ない使い方 : 有名曲のサビを入れる、フル曲を入れる、そのまま似た曲を公開
- Sunoの利用規約の基本思想 : ユーザーはアップロード素材の権利を持つ必要がある
2026年3月16日(月)
前回の日記が先週木曜日だったが、「超多忙月間」である3月のまさにど真ん中ということで、ほぼ何も書けない日々が続く。 先週金曜日から昨日の日曜日まで3日間びっしりのロボット教室(その途中でSUACにクルマで行って元同僚[的場・羽田・日比谷]先生の送別会参加)、今日明日は12週目の柏行脚、浜松に戻って水曜日は通院予定、そして週末の金土日はまたまたびっしりのロボット教室、来週その翌日からの月火もたぶん柏行脚・・・という感じで、予定していたものの実際にその通りにこなしていくのもなかなか大変なのだった。 「音楽生成論」の教材作成も、sunoでの実験も、Arduinoの新しいシステム実験も、全て棚上げの状態で乗り切っていくしなかい。 昨日は藤井六冠が棋王戦で2勝2敗に戻して最終局へ、という瞬間だけAbemaTVで見届けたものの、まだまだ厳しい(2勝3敗)王将戦第6局も観られるかどうか、そしていつの間にか終わっていたらしいWBCなんてのは、とりあえず阪神の選手は活躍したという噂ぐらいしか知らないのだ。 こうやって朝、浜松駅に向かうバスまでの時間が30分ほどあったのでこれを書いて、とりあえず空白を回避しただけである。2026年3月18日(水)
昨日までの2日間は「12週目の柏詣で」だったが、遂に今回は母親とのコミュニケーションが皆無となった。 頷きあいとかアイコンタクトも無く、寝ている母親の顔を見るだけの面会時間だった。 いよいよ老衰は穏やかな終末に向かっている感じで、引き続き見守る日々が続く。
![]()
Makerコミュニティからは、 Kyoto Micro Maker Faire 2026 という案内が届いたが、そういえば前回の大垣Mini Maker Faireから2年なので、また今年も過去の参加者には参加打診の連絡が来るのだろうか。 基本的には「待つ」という体制で待機である。
![]()
今年は1月からほぼ12週の全てで愛用している東横インだが、東京出張であれば学会の会場がどこでも新宿歌舞伎町から通うし、関西であれば甲子園に行くにも神戸の学会でも野田の東横イン、ということで、札幌すすきのから石垣島まで、推しは常に東横インである。 そんな東横インの「ホテルごとのバッジ」(国内47都道府県 + 韓国/フィリピン/モンゴル/ドイツ/フランスの全52種類)が話題になっている。 ただしこれを集めることもなく(あれこれ収集したのは昔のこと)、たまたまネットの記事で上の画像をゲットしたので、ここに貼っておけば十分だろう。
午後になって、柏の2日間の中で思い付いていたネタをやってみる事にした。 時間学会大会でのネタとして、「ChatGPTの作詞、sunoの作曲/歌唱/演奏」による「時間学のテーマソング」というのである。 まずはChatGPTに「時間学 Time Studies という領域があります」と投げかけると、例によって余計なお世話で以下のように解説してくれた。そこでこのChatGPTに、「その時間学 Time Studiesのテーマソングを作るつもりです。そこで、歌詞を作って欲しいのです。日本語で時間学の色々なテーマの面白さを列記紹介して、サビの部分ではそこだけ英語でTime Studiesと繰り返したいです。他の歌詞部分は日本語としてカタカナ英語になっているものはOK(生体リズムのリズムとかカレンダーとかスケジュールなど)です。それほど長大でなくて結構です」と投げてみると、ササッと歌詞を作ってくれた。 そこで「実はsunoに投げて作曲する」と加えると、歌詞だけでなくプロンプトも、つまりそのままコピペ可能な感じで作ってくれた。「時間学(TimeStudies)」は比較的新しく、かつ非常に横断的な学問領域です。 単一の分野というより、いくつかの学問が交差してできた「時間をめぐる総合研究」と考えると分かりやすいです。 ■ 時間学とは何か 時間学は、「時間とは何か」「人間や社会は時間をどう捉え、どう使っているか」を多角的に研究する分野です。扱うテーマは大きく3つに分けられます: 1. 自然科学的な時間 - 相対性理論における時間、宇宙論における時間の始まりや終わり、物理的な「時間の矢(不可逆性)」 ここでは時間は「測定可能な量」として扱われます。 2. 生物・心理的な時間 - 体内時計(概日リズム)、主観的時間(楽しいと早く過ぎるなど)、注意や感情と時間感覚の関係 同じ1分でも、人によって長さが違って感じられる問題です。 3. 社会・文化的な時間 - カレンダーや暦、労働時間・余暇時間、近代社会の「時間管理」やスケジュール文化 例えば産業革命以降、「時計に従う生活」が強まりました。 ■ 関係する主な学問分野 時間学は以下のような分野が交差します: 物理学(時間の本質) 哲学(時間とは存在するのか) 心理学(時間の感じ方) 社会学(時間の制度化) 人類学(文化ごとの時間観) 哲学では、アンリ・ベルクソンの「持続(duree)」や、マルティン・ハイデガーの時間論などが有名です。 ■ 面白いポイント 時間学の魅力は、「時間は一つではない」と分かることです。 物理的時間 → 均一で客観的 心理的時間 → 伸び縮みする 社会的時間 → ルールや制度で決まる つまり、私たちは複数の時間を同時に生きているとも言えます。 ■ 最近のトピック 現代では特に: デジタル社会による「加速する時間」、SNSやスマホによる注意の断片化、ワークライフバランスと時間の再配分、などが研究テーマになっています。僕が今回、依頼してみたのは上のような3パターンである。 実際には(1)と(2)を提示して、(1)はまずまずだったのだが、どうも(2)はプログレというよりsunoお得意のメタルでアニソンぽくなったので、さらに(3)を追加してみたのだった。 実際には日本語の熟語を正しく発音できていなかったりするので、以下の歌詞は添えておかないといけないのだが、まあまあの出来だった。
- 80年代の日本シティポップ風で女性ボーカル
- 70年代のブリティッシュ・プログレッシブロック風で男性ボーカル
- スローテンポの60年代ブルースの男性ボーカル版
(2)とか(3)では、さらに「[Intro](soft Mellotron and ambient synth)」とか「[Instrumental](extended progressive instrumental, shifting time signatures, synth and guitar solos)」とか「[Outro](slow fade with Mellotron and echoing vocals)」とか「[Intro](slow blues guitar with vibrato, minimal drums)」とか「[Instrumental](slow emotional guitar solo, bending notes, spacious phrasing)」とか「[Outro](fade out with guitar and organ, lingering notes)」とかが加わっている。 タイトルは「Time Studies」である。[Verse] 宇宙のはじまり 終わりの気配 光の速さで ほどける現在 相対するクロック ゆがむストーリー 一秒さえも 同じじゃない [Pre-Chorus] 生体リズム 眠りと覚醒 伸びたり縮んだりする体感 カレンダーめくって スケジュール並べ 社会は時をデザインする [Chorus] Time Studies, Time Studies Time Studies, Time Studies Time Studies, Time Studies Time Studies, Time Studies [Verse] 記憶の奥で 重なる瞬間 未来はいつも 少しあいまい 待つ時間だけ やけに長くて 夢中の時間は 一瞬で過ぎる [Pre-Chorus] ルールと制度のタイムライン 働くリズム 休むリズム 過去・現在・未来をつないで ぼくらは時を生きている [Chorus] Time Studies, Time Studies Time Studies, Time Studies Time Studies, Time Studies Time Studies, Time Studies
●本日のsuno生成音楽(2026.03.18)●
タイトル : Time Studies
使用したモデル : v5
与えたPrompt : 1980s Japanese city pop, female vocal, smooth, nostalgic, jazzy chords, electric piano, slap bass, clean guitar, warm analog sound, groovy, polished production, slightly upbeat (100 BPM), sophisticated urban mood, Japanese lyrics with English chorus
出てきたPrompt : 1980s Japanese city pop, female vocal, smooth, nostalgic, jazzy chords, electric piano, slap bass, clean guitar, warm analog sound, groovy, polished production, slightly upbeat (100 BPM), sophisticated urban mood, Japanese lyrics with English chorus
Result : Time Studies 1 - Time Studies 2上の2曲が「80年代の日本シティポップ風」であり、まぁ日本からsunoにアクセスしている人々の多さに納得できる。 とりあえず1曲目は、Publishしてみた。 まぁ、こんなにポップなのは時間学会としては照れる感じじゃないかなぁ。
●本日のsuno生成音楽(2026.03.18)●
タイトル : Time Studies
使用したモデル : v5
与えたPrompt : 1970s British progressive rock, male vocal, complex arrangement, dynamic shifts, Mellotron, analog synthesizer, electric guitar, bass and drums, dramatic, philosophical, slightly dark, evolving structure, 7-9 minutes feel, tempo changes, expressive vocals, Japanese lyrics with English chorus
出てきたPrompt : 1970s British progressive rock, male vocal, complex arrangement, dynamic shifts, Mellotron, analog synthesizer, electric guitar, bass and drums, dramatic, philosophical, slightly dark, evolving structure, 7-9 minutes feel, tempo changes, expressive vocals, Japanese lyrics with English chorus
Result : Time Studies 3 - Time Studies 4上の2曲が「70年代のブリティッシュ・プログレッシブロック風」であり、「7-9分」というのに3分43秒と6分10秒だった。 スタートは良かったのだが、どうもこの歌詞ではアニソンみたいで、ボーカルが始まったら期待感がしぼんでしまった。 4曲目は良かったのだが、後半になったら何故かリフレインの「Time Studies」でなく、歌詞の冒頭の「宇宙のはじまり」ばかりを繰り返すようになってしまい、これじゃタイトルが「宇宙のはじまり」だよなぁ・・・という残念な結果になった。
●本日のsuno生成音楽(2026.03.18)●
タイトル : Time Studies
使用したモデル : v5
与えたPrompt : 1960s slow blues, male vocal, deep and soulful, expressive, slow tempo (60-70 BPM), minimal arrangement, electric guitar with vibrato and bends, walking bass, simple drums, organ, emotional, spacious, slightly smoky atmosphere, introspective, Japanese lyrics with English chorus, very slow, laid-back groove, raw emotional vocal, classic Chicago blues feel, space between phrases - not busy
出てきたPrompt : 1960s slow blues, male vocal, deep and soulful, expressive, slow tempo (60-70 BPM), minimal arrangement, electric guitar with vibrato and bends, walking bass, simple drums, organ, emotional, spacious, slightly smoky atmosphere, introspective, Japanese lyrics with English chorus, very slow, laid-back groove, raw emotional vocal, classic Chicago blues feel, space between phrases - not busy
Result : Time Studies 5 - Time Studies 6そして追加でリクエストした(ChatGPTの「Sunoに追加してもいい一文」も加えた)上の2曲が「スローテンポの60年代ブルース」であり、まぁまずまずだったので、とりあえず5曲目は、Publishしてみた。 これは「生成音楽論」の場合には「歌詞を除外する」と宣言するので対象外なのだが、時間学会でネタとしてウケるのかどうか、ちょっと怖い気もするし興味もある。 まぁ、実験としては面白いものになった。
2026年3月20日(金)
昨日は束の間の休日?な感じで、午後には久しぶりに地元のJoyJoyで5時間53曲を爆走した。 今日のアドバンス、明日のロボプロ、明後日のロボプロスタートアップ、という3日間で、びっしり埋まった3月のロボット教室の予定もほぼ通り抜けて(あと来週にミドル1回だけ)、いよいよ4月からは各クラスに進級者が合流し、ロボプロの新クラスも始まる。
藤井六冠は、対増田・棋王戦と対永瀬・王将戦のいずれのカド番にも勝って、フルセット最終局(3/29鳥取、3/25-26高槻)にもつれ込んだ。 棋譜も眺めてみたが、ほとんど隙が無いのに流れが出来てきて、名局というのは対局する両者の充実あっての事だと再確認できた。
![]()
今日は午前に奥さんの墓参りの運転手(→雄踏)、そして昨日が激混みでパスした床屋(小豆餅)に行って、午後には時間学会のプレゼンのために追加で思い付いた、上のような超簡単Maxパッチを作ったりして(所要5分)、晩のロボット教室(→またまた雄踏)に出掛けるまで過ごした。 このパッチはおそらくMax初学者が最初に作る「Hello, World !」みたいなものだが、これが「DTMやカラオケ」では、「テンポ - イベント間の時間で調整」・「キー - 半音単位で上下に移調」という説明そのものになっているので、今回のプレゼンの導入部としては格好のサンプルなのだった。
![]()
そして今日のロボット教室(アドバンス・生徒3人)では、僕のロボットと合わせて計4台のクレーンをタンデムに並べる・・・という構想を、上の壮観な写真のように実現できた。 ポイントは、1台目の僕のロボットは光センサが物を検知するとスグに動くのだが、生徒の3台については、テキストにあるフローチャートに追加を依頼して、光センサ検出後に「2秒のwait」を挿入してもらっている。 これによって、前段から運んできたアームが退避した後になって後段のアームが動くことで、衝突を回避しているのだ。 新しいデジカメで この動画 のように撮ってみたが、これはいい記録となった。
2026年3月22日(日)
今日は午前に3回目のロボプロ・スタートアップがあり、これで3月の過密スケジュールを乗り切ったことになる。 明日と明後日はまた柏詣で、来週は金曜日に最後のミドル教室があるだけで、ちょっと余裕のある週となる。
![]()
昨日のロボプロは今年度の最終回ということで、僕はサンプル教材を作らず(今日のスタートアップでプレステリモコンでの操縦デモを見せるため)、生徒がそれぞれのテーマのArduinoサンプルスケッチを自力で改訂する、という回にしてみた。 テーマは操縦型でなく自立走行で、「手を追いかける」・「テーブルから落ちない」・「テーブルの縁に沿って走行する」・「壁伝いに走行する」というものだった。 またまた新しいデジカメで この動画 のように撮ってみた。
2026年3月25日(水)
一昨日と昨日の柏行脚(13週目)では、先週に続いて一度も母親の目は開くこともなく穏やかに眠っていて、痩せ細った手足をマッサージするぐらいの面会となった。 改めて「傾眠」という言葉を噛み締めてみると、まさに現在の母親の「穏やかな老衰」の状況は「傾眠」そのものだった。 そしてキーワード「傾眠」で 認知症の傾眠傾向は余命が近いサイン? というページに行ってみると、思い当たること満載だった。
1月初旬に施設から筑波の病院に緊急搬送されてから約1ヶ月で肺炎が抗生剤で治り、その後に現在の柏の病院に転院してもう2ヶ月近くになったが、嚥下できないために認知症の薬も飲まなくなって3ヶ月であり、認知も傾眠も老衰も確実に進行しているのだろう。 最初から本人の意向もあり延命治療としての胃瘻と輸血はナシと確認しているのだが、ずっと続いている点滴は唯一の栄養/水分補給ルートであり、これもある意味では延命治療ということになるのでは・・・という思いも過った。
![]()
4月からいよいよRP1とRP2のロボプロ教室が始まるということで、久しぶりにRP2のテキストを眺めてみた。 去年のRP2の生徒は、4-6月のタームと7-9月のタームまで学んだところでロボット教室を退会して、残りは高校受験に向かっていたのだが、無事に進学できたというメイルも届いた。 そして途中から受け継いで担当したRP2の最初の内容は「エレクトロニクスの基礎」そのものであり、Arduinoに対して直接、部品を挿したりブレッドボードに繋ぐというものだった。 そこで、絶版になった(出版社そのものが倒産)上の本の「第1部」の原稿をそのままWebに置いていた センサとマイクロエレクトロニクスの概要 のページを、自宅での復習のために生徒に紹介することにした。
元々このページは、1997年に「京都造形芸術大学公開講座」として依頼され開催した インタラクティブ・アートのための技術講座 のテキストとして作ったページの中に置いていたものであり、マイコンは流石に時代が古いので通用しないものの、エレクトロニクスの部分の中身はまったく現在でも変わらず通用するものなのだ。
![]()
そして、気付いてみれば今日と明日が王将戦の最終局だったのだが、気付いたのは午後だったので、AbemaTVの無料ライヴ中継を見逃してしまった。 そうなると上のように、それぞれAI評価値を出している無料中継YouTubeサイトのウインドウを並べてデスクトップに置くぐらいしかなくなるが、同時3面中継だと CPU温度は90℃ぐらいまで上昇して、Mac miniの筐体が暖かくなってくる。 明日には午前の封じ手開封から途中まで、見てみることにしよう。
2026年3月26日(木)
午前中だけ見られるAbemaTVと棋譜から昨日の様子を確認して見守っていた王将戦最終局は、封じ手が「人間には指せない」AI推奨手でなかった事もあり、2日目になってじりじりと「藤井曲線」が形成されていった。 ライブの現場映像は無いものの、終局まで見守ることになりそうだ。
その裏ではロボット教室のアドバンスのサンプル教材「コピーマシン」1回目を作ったりしていたのだが、今回もちょっとこのテーマは冗長で、教室では時間を持て余す生徒が出てきそうな気がする。 教材(とテキスト)のレベルというのは難しくて、あまり難度が高いと未完成の生徒が続出してしまうし、あまり簡単だと暇を持て余してプログラミング用のタブレットでYouTubeやTiktokを見たりすることになるので、その「塩梅」はなかなか大変なのだ。
さらにその裏では、久しぶりに京都精華大「生成音楽論」のテキストの準備に関連して、既に提出して学生に公開されている「シラバス」を眺め直したりして過ごした。 そろそろこの内容を詰めて、とりあえず作っていかなければならない、と分かっているものの、まだ締め切りが先なので、ついつい後回しにしていたのだった。
![]()
そして、15時過ぎには「藤井王将5連覇・タイトル防衛」という事になった。 上のように感想戦はまた無料になったので、珍しく見ることが出来た。 攻勢に出てからの終盤の厳しさは尋常ではない感じだったが、やはり、これは「流石」としか言いようがない。 こうなると、もう一つのカド番の棋王戦がどうなるのか、目が離せない。
2026年3月27日(金)
朝イチでなかなかヘヴィなニュースが飛び込んできた。 【緊急】月間9500万DLのLiteLLMが乗っ取られた。インストールしただけでSSH鍵・AWS認証・仮想通貨が全部盗まれる というもので、「結論から言うと」と書かれた部分の「 LiteLLM v1.82.7 および v1.82.8 をインストールした場合、あなたのSSH鍵、AWS/GCP/Azure認証情報、仮想通貨ウォレット、データベースパスワードがすべて攻撃者に送信された可能性があります。さらにKubernetes環境では全ノードにバックドアが設置されている可能性があります。今すぐ全認証情報をローテーションしてください 」がまるでワケワカメなので、5ちゃんのスレでは 「あら大変」・「どうせレッドチームだろ」・「つまりこれはサプライチェーンのバックドアがブラッシュアップしてエビデンスなわけだ」・「この記事の内容が全然分からん。誰か老人でも分かる様に解説してくれ」・「俺が変態だとばれないならどうでもいい」・「Netflix、Google、OpenAI辺りもヤバいのかな?」・「へーなんか大変そう」・「これ意味がわかる奴なんているんか」・「ヤバそうと言うのは伝わったけど何をどうすれば良いのか全く分からん」・「どゆこと」・「何でもかんでもインストールするのがいかに危険かということ」・「AIヤバい\(^o^)/」・「ちょっと何言ってるかわからない」・「サザエさんとカツオが喧嘩してノリスケが出てきたという理解でも良いか」・「高市を総理にしたのと同じ感じ」・「大変っすね」・「ワイの性癖が全世界に拡散されてしまう…」・「仮想通貨とか持ってても中やロや北にいずれ盗られるってことよ」・「python厨死亡」・「一般人は気にするな」・「解説いる?いらんだろ」・「なんやDLsiteかと思って本気で焦ったやないかい!」・「いつものだなあ」・「何が書いてあるか完全に理解した。要はPCを窓から投げ捨てるしかない」・「馬鹿すぎ」・「とうとうAIが犯罪を」・「AI頼りでPythonでプログラマーデビューした俺涙目」・「AIバブル崩壊きぼんぬ」・「日本語で頼むわ」・「Geminiに聞いたけど説明すら理解できなかった」・「知識の平準化への道は遠いな」・「前からGitHubこんなもんだよ」・「これはやべーやつだな」・「ここからがほんとうの地獄だ…」・「Pythonなんか使ってる時点でもうね」・「お前らは人類滅亡の危機が来ても大喜利大会しながら死んで行くんだろうな」・「アルファがベータをカッパらったらイプシロンした、そういうことだろ?」・「Pythonやばいよね」・「考えるのもめんどくさいから会社のサーバーの電源落としたわ」・「ドラえもんのOSにアップデートが入って野比家の通帳や権利書を全部持ち去られたうえにどこでもドアやタイムマシンでいつ再侵入されるか分からないみたいな感じ」・「pip install するとたくさんダウンロードされるからな。AI開発者は全滅かも」・「ノートンについてた奴か?」・「こりゃやべえ。明日職場行きたくねえ」・「あれか、キンタマウイルスみたいなもんか」・「これは凄い。LinuxのXZ Utilsのバックドア超えたな」・「金融機関もやばそう」・「また俺達がニコニコ動画で野獣先輩動画を見ていたことが世界にバレるのか…!?」・「LiteLLMが何かわからん」・「とりあえず電源切ればいいんだろ」・「COBOLとExcelマクロしかできない自分は低みの見物」・「簡単に言うと人類は滅ぶ」・「大事件の香り」・「秘密の画像が流出するのか」・「エンドユーザーの被害は少なそうだけどサービス提供してるデベロッパーがやられたら芋蔓式でユーザーデータも流出する」・「ギフハフおわた…?」・「AIつかってるフリーソフトもヤバいな」・「俺のゴールドウォレットの100BTCが失われている。どうすれば取り戻せるんだ」・「紙の通帳に預金しとけ、だよね結局」・「stable diffusion がアウトってことか終わったなオマエラ」・「LLMから機械の声で電話きた。立法府に訴えるぞって脅したらビビって電話切ってて草」・「どう見ても犯人候補国家です」・「よし、何言ってるか分かんねえからok!」・「取られるお金がない」・「難しそうなこと沢山やってて、めちゃくちゃ頭いい集団なんだね」・「PCもスマホも捨てるタイミングかもだな」・「AIに魂を売った者よ反省するが良い」 などと「祭り」状態になっていた。
ここ を読んでみると、どうもこのハッキングはPythonそのものの仕様(の不備)に付け入って作られているのだった。 そして「認証情報を盗んだ後も、マシンは攻撃者のC2サーバーに50分おきに通信し続け、任意のマルウェアを追加でダウンロード・実行できる状態が維持される」とのことである。
![]()
今日の予定は晩にロボット教室だけという事で、久しぶりにsunoに行ってみると、上のように新しいモデル(Beta)としてv5.5の「Create Custom Model」というのが出現していた。 これまでのsunoは共通の汎用モデルで、Pro(有料)バージョンの「v4.5」・「v4.5+」・「v5」というものだったが、ここに加えて登場した「v5.5」では、24個以上の曲データをアップロードして、その音楽的傾向/嗜好に合わせたモデルになるようだった。
そこでさっそく、この「Create Custom Model」を選んで、これまにsunoで作った曲から選んで20数曲を一括指定してアップロードすると、上のように向うでは何か作業していて、結果的にはモデルを選ぶメニュー(v4.5とかv5.0とか)に、とりあえずnagasmと名前を付けた僕のオリジナルのモデルが登場した。 こうなれば、この「nagasmモデル」と、一般の「v5.0モデル」に対して、同じプロンプトを投げ込んでどうなるか、という実験をしてみたくなる。
●本日のsuno生成音楽(2026.03.27)●
タイトル : Hope in the Old Garden
使用したモデル : nagasm(オリジナル)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Romantic neoclassical ballad for solo piano and small string ensemble; slow tempo with tender rubato, soft arpeggiated left hand and singing right-hand melody, Gentle modulations from major to relative minor and back, with one luminous middle section that blooms into fuller strings and warm sustained chords before returning to an intimate, fragile ending, slow, vocal, romantic, classic, sad, happy
Result : Hope in the Old Garden 1 - Hope in the Old Garden 2プロンプトとしては最低限ということで、昨今の世界情勢を思って「romantic, happy feeling, something sad, hope piece」としてみた。 楽しいのに悲しい、とやや矛盾しているところがポイントである。 上の「Hope in the Old Garden」が、オリジナルモデル「nagasm」の生成した2曲で、ドラムが要らないので「like classic music」と指定したものの、2曲目にはまたまた後半にドラムが入ってきてしまった。 5分と指定したものの、実際には「3min08sec」と「2min48sec」だった。
●本日のsuno生成音楽(2026.03.27)●
タイトル : Hope in the Quiet Rain
使用したモデル : v5.0
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Gentle romantic chamber ballad for strings and piano, slow tempo around 60-65 BPM, Solo piano carries a simple, lyrical theme; warm legato strings enter gradually, adding bittersweet harmonies and soft swells, Midway, a tender key change and cello countermelody deepen the sadness before returning to a brighter variation of the main motif, Dynamics breathe like a string quartet in a small hall, with a delicate pianissimo ending that resolves in calm, hopeful consonance, slow, classic, happy, vocal, sad, romantic
Result : Hope in the Quiet Rain 1 - Hope in the Quiet Rain 2そして上の2曲が、標準的な「v5.0」モデルに対して、完全に同一のプロンプトを与えたものである。 曲名はちょっと変わって「Hope in the Quiet Rain」となり、durationの指定は暖かく無視されて「2min54sec」と「3min24sec」となっていた。
この両者を比較して、あまり違いは感じなかったのだが、これは、(1)sunoのオリジナルモデル(個性)というのがそれ程の性能ではないのか、(2)僕のアップロードした既成曲が一般的なsunoモデルと類似しているのか、結局はもっと極端な実験をしてみないと不明だ、という結論になった。 まぁまだBETAバージョンであり、おそらくこの性能が向上するとこちらも新たな別料金サブスクになるのだろうが、ここにプロの既存曲を入れたらどうなるか(実際にはアップロード時に「著作権の問題は大丈夫ですね?」と確認されていた)、そこに興味がある。そして、どうもこの「v5.5」では、いくつでもオリジナルのモデルを作れる・・・と判明したので、全部ごった煮ではなくて、とりあえずこの6曲(最低でも6曲を送る必要があった) ★ ★ ★ ★ ★ ★ を選んで作ったモデル「nagasm2」に対して、まったく同一のプロンプトで実験してみることにした。 その結果は以下のようになって(durationは3min22secと4min21sec)、あまり効果が感じられなかった。 「いろいろな傾向を混ぜる」と、つまりは平準化してしまうのだろう。
●本日のsuno生成音楽(2026.03.27)●
タイトル : Hope in Slow Bloom
使用したモデル : nagasm2(オリジナル)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Gentle neoclassical ballad for solo piano and soft strings, slow unfolding over ~5 minutes, Starts sparse with intimate piano motifs and distant legato strings, gradually adding warm string harmonies, subtle harp-like arpeggios, and wider chords, Emotional arc moves from tender melancholy to glowing resolve, ending on a lingering, open voicing that feels quietly hopeful, happy, slow, classic, vocal, sad, romantic
Result : Hope in Slow Bloom 1 - Hope in Slow Bloom 2こうなれば、もう出てくる事は無いと思っていた、デスメタルで5人に「死ね!」と歌ったあの計10曲だけをまとめたモデル「nagasm3」を作って実験したくなる。 モデルを作るためにアップロードした10曲は ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ である。 その結果はなんと以下のように「大当たり」であり、イントロはこれまでと同様に始まるのに、なんと途中でちゃんとデスメタルになる、という荒技を展開してくれた。 ちゃんとエンディングでは元のように静かに戻るのだから、この構想力は凄いものである。 さっそくこの2曲(1min52sec, 2min58sec)はpublishしてみた。
●本日のsuno生成音楽(2026.03.27)●
タイトル : Hope In Your Hands
使用したモデル : nagasm3(オリジナル : デスメタル10曲)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Romantic orchestral ballad for 5-minute instrumental: tender piano leads with warm string ensemble and soft woodwinds, gentle tempo and legato phrasing, First third stays intimate and slow, second third swells with wider chords and lyrical countermelodies, final third returns to a calm, hopeful resolution with a delicate high-register piano line and quiet strings holding the last chord, happy, slow, classic, vocal, sad, romantic
Result : Hope In Your Hands 1 - Hope In Your Hands 2この結果を受けると、もう次の実験は明らかである。 「無調」・「ポリリズム」・「変拍子」・「現代音楽」・「プリピアードピアノ」・「偶然性」というプロンプトで作っていた 無題の夢(1) 無題の夢(2) と似たようなのをあと4曲生成させて、その計6曲を食わせた新しいモデル「nagasm4」を作ることである。 そこでまず、前回の日本語プロンプトと、それに対してシステムが作ったプロンプト(英語)を列記した以下の2曲(1min25sec, 1min14sec)を作った。1曲目ではまたまた、リズム(percussion)が入ってきたのが、いつもの通りである。
●本日のsuno生成音楽(2026.03.27)●
タイトル : Unstable Room for Prepared Piano
使用したモデル : v5
与えたPrompt : 無調, ポリリズム, 変拍子, 現代音楽, プリピアードピアノ, 偶然性, unpredictable rhythmic structures, dissonant, avant-garde, prepared piano textures
出てきたPrompt : Sparse, pointillistic prepared piano solo; metallic plucks, muted thuds, and glassy harmonics scattered in unpredictable clusters, Dynamics swing from near-silence to sharp, percussive bursts; rhythm stretches and snaps against an elastic internal pulse, Occasional pedal swells smear dissonant overtones into hovering clouds, Recorded very close, every scrape and key noise heightened for an intimate, avant-garde chamber feel, avant-garde, rhythmic
Result : Unstable Room for Prepared Piano 1 - Unstable Room for Prepared Piano 2上の結果から、次の2曲については全て日本語プロンプトに戻して、最後に1つ「即興」を追加した「無調」・「ポリリズム」・「変拍子」・「現代音楽」・「プリピアードピアノ」・「偶然性」・「即興」というプロンプトで作ってみると、ちゃんとタイトルが「偶然に触れる指先」という日本語になった。 ところが楽器がピアノでなくなり、どうも「即興」というタームに引っ張られるのか、ミニマルミュージックっぽくなってperussionも入ってきた。 これではオリジナモデルの「純度」が低下するので、以下の2曲(3min26sec, 3min33sec)は使わないことになった。
●本日のsuno生成音楽(2026.03.27)●
タイトル : 偶然に触れる指先
使用したモデル : v5
与えたPrompt : 無調, ポリリズム, 変拍子, 現代音楽, プリピアードピアノ, 偶然性, 即興
出てきたPrompt : Sparse prepared piano and brushed percussion, shifting time signatures and atonal motifs, Male vocals half-whisper over fractured rhythms; choruses tighten into hypnotic, chant-like hooks, Occasional free-improv bursts, sudden dropouts, and close-mic room ambience heighten the sense of risk and discovery
Result : 偶然に触れる指先 1 - 偶然に触れる指先 2そしてプロンプトから「即興」を取り去って、かつての「無題の夢」と同じにして作ってみたのが、以下の2曲である。 考えてみればsunoは常に新しい楽曲を大量に学習しているので、過去のプロンプトと同じものを与えても同じ曲は出来ないのであり、この2曲はとても残念な「よくある」・「聞きやすい」・「普通の」ものだった。 これではオリジナモデルの「純度」が低下するので、以下の2曲(2min38sec, 2min38sec)も使わないことになった。
●本日のsuno生成音楽(2026.03.27)●
タイトル : 偶然に割れた鍵盤
使用したモデル : v5
与えたPrompt : 無調, ポリリズム, 変拍子, 現代音楽, プリピアードピアノ, 偶然性
出てきたPrompt : Glitchy prepared-piano piece with male vocals: inside-the-piano scrapes, muted plucks, and detuned clusters over shifting polyrhythms, Tempo keeps slipping through 5/4, 7/8, 11/8 as the vocal hovers between spoken-word and soft chant, Sparse low percussion and breathy drones bloom in the chorus, then collapse into fragmented echoes and abrupt silences
Result : 偶然に割れた鍵盤 1 - 偶然に割れた鍵盤 2こうなると、求めるような曲が出来た時のシステムからのプロンプト(英語)を使って、さらにその中の不要な情報(パーカッションとかリズムとか)を消せばいい・・・という方針になってきた。 そこで、かつての成功例のsuno側プロンプトから添削追加して「Sparse, pointillistic prepared piano solo; metallic plucks, muted thuds, and glassy harmonics scattered in unpredictable clusters, Dynamics swing from near-silence to sharp, Occasional pedal swells smear dissonant overtones into hovering clouds, atonal, avant-garde, polyrhythm, contemporary music」としてみた。 出来た2曲(1min20sec, 2min14sec)は、一応それっぽいが、だいぶ聞き易くなっていた。
●本日のsuno生成音楽(2026.03.27)●
タイトル : Shards In The Quiet
使用したモデル : v5
与えたPrompt : Sparse, pointillistic prepared piano solo; metallic plucks, muted thuds, and glassy harmonics scattered in unpredictable clusters, Dynamics swing from near-silence to sharp, Occasional pedal swells smear dissonant overtones into hovering clouds, atonal, avant-garde, polyrhythm, contemporary music
出てきたPrompt : jazz, Sparse contemporary classical piano, atonal and pointillistic, Prepared piano timbres click, buzz, and ring in asymmetrical polyrhythms, Wide dynamic swings from barely-there taps to sudden hammered clusters, with occasional pedal-sustained clouds blurring dissonant overtones, Intimate room tone, close-miked hammers and mechanical noises featured as part of the texture, contemporary, dynamics, swing, avant-garde
Result : Shards In The Quiet 1 - Shards In The Quiet 2これで、一応、それっぽい6曲 ★ ★ ★ ★ ★ ★ が出来たので、また新しいモデルを作ろう・・・と進んでみると、「モデルは3個までしか作れないので、既存のモデルをdeleteして空きを作って」と言われた。 そこで、もともとnagasmとnagasm2は不要だったのでdeleteして、上の6曲での新しいモデル「nagasm4」を作った。 「デスメタルのモデルで優しい曲」に続いて、今日の目標の2つ目としては「現代音楽モデルで優しい曲」という矛盾する実験である。 「優しい曲」の部分の与えるプロンプトは同一条件として「Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes」になる。
●本日のsuno生成音楽(2026.03.27)●
タイトル : Hope in the Quiet Room
使用したモデル : nagasm4(オリジナル : 現代音楽風6曲)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Romantic neoclassical chamber ballad for solo piano and soft strings; starts with a tender, slow piano motif, then gradually layers warm legato strings and subtle woodwinds, Dynamics swell gently through a bittersweet middle section, dipping into soft, pensive harmonies before blooming into a hopeful, luminous finale with arpeggiated piano and sustained, glowing string chords, happy, romantic, classic, slow, sad, vocal
Result : Hope in the Quiet Room 1 - Hope in the Quiet Room 2作られた2曲(2min51sec, 3min23sec)は上のようなものだが、見事に予想を裏切って、コテコテの美しいムード音楽になってしまった。 まぁ、sunoに生成されたプロンプトを見ればそれも妥当なのだが、つまりここで確認できたのは、「sunoは音楽の音響特性でカテゴライズするものの、音楽の時間的特性やメロディのスケール(時系列離散的音高情報)を見ていない」という、ちょうどChatGPTで学んだ事実の確認となった。 デスメタルであればあの音響はどこを取っても出てくるので、そういうのを加えるのだが、「不協和音(ピアノで次々に弾かれる音階の構造)」などは消えてしまっているのだろう。 結局、作ったばかりのモデル「nagasm4」はその場でdeleteして、当面残ったオリジナルのモデルは、デスメタル臭の塊「nagasm3」ただ1つだけとなった。 あと2つの枠は残しておいて、別の実験で試していこう。
2026年3月28日(土)
昨日は今月最後のロボット教室でミドルクラスだったが、来月のミドルクラスの初日は1週間後ということで、今日はサンブル教材の「バラし」をまず行って、その後に来週に提示するサンプル教材を作るというのがメインとなった。 もちろん週末のroutineである「Martinを愛でる」という時間も持った。 そのミドルの教材は、過去のテーマから新しくなった「キャプテンパイロット号」というもので、遊園地によくある、大きな船が振り子のように前後に揺れるというものだった。
![]()
予告として「バッテリの消耗が激しいので予備電池の用意を連絡して」とのことだったが、成る程、かなりの無理ゲーを電池に強いたものだった。 僕はモバイルバッテリーを繋いでいるので関係ないのだが、これは確かに消耗しそうだ。 今回はデスク上で この動画 のように撮ってみたが、電源の極性を反転できるスライドスイッチをガシガシと手で前後させる、という荒技は、船の移動と逆相で駆動すれば意外と簡単なものの、まぁ結構なものだった。
![]()
そして午後になってフト思い付いたアイデアがあった。 昨日のsunoのオリジナルモデルの続きなのだが、とりあえずモデル生成には6曲のサンプルを与える必要があるので、上のようなMaxパッチを数分で作って、全てが ★ ★ ★ ★ ★ ★ のように、汚いサウンド(不協和音より酷い)の5秒AIFFサウンドを6本、作った。 これをAll2MP3でmp3に一括変換して6本のmp3としてsunoの「オリジナルモデル作成」(100クレジットかかる)に与えて、「nagasm4」という新しいモデルを作った。 与えるプロンプトは昨日とまったく同じにして、「Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes」となっている。
●本日のsuno生成音楽(2026.03.28)●
タイトル : Hopeful Waltz in Spring Light
使用したモデル : nagasm4(オリジナル)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Romantic chamber orchestral piece in a slow 3/4 waltz: soft piano leads with warm strings and tender woodwinds, harp arpeggios, and a mellow solo cello, Begins delicate and intimate, grows into a lush, bittersweet middle section, then resolves into a gentle, hopeful coda with glimmers of joy over lingering nostalgia, happy, vocal, slow, romantic, classic, sad
Result : Hopeful Waltz in Spring Light 1 - Hopeful Waltz in Spring Light2その結果は、上のような2曲(2min09sec, 2min37sec)という、どーしよーもなく甘美でロマンティックなものであり、モデルを作るためにわざわざ作って与えた ★ ★ ★ ★ ★ ★ というサウンドの印象は完全に完璧に無視された。 うーーむ、なかなか、sunoは手強いのだった。
2026年3月29日(日)
今日は孫の七五三に駆り出される(写真館→岩水寺→昼食会)という日なのだが、朝イチで奥さんが「葉から芽」に花が咲いた、と言ってきた。 自宅マンション(3階建ての3階)のベランダには、かつて小浜島で仕入れてきた「葉から芽」(セイロンベンケイソウ)の葉っぱを切り刻んで放置していたのだが、これが浜松の吹きっさらしの寒さに耐えて耐えて、強烈な色とともに力強く育っていたのだった。
![]()
まずは 今日の記録 を置いてみたが、その中にリンクがあるように、発端は 16回目の沖縄 にあり、 ここ に書いたようにシリーズが始まり、 「葉から芽」日記 を経て、SUACの1106研究室の窓際でも このように 咲いていた。 SUACを去る際に、南棟の屋上のあちこちに「葉から芽」の葉の断片を撒いてきた(^_^;)ので、順調に推移していれば、ぼちぼちあの屋上に見られるかもしれない。 「葉から芽」に花が咲くのは、かなり過酷な環境で生命の危機にある時らしいので、今回の花(しかし全体の色合いはあまりに力強い)も、ベランダの寒風に晒された末の「最後の一花」なのである。
![]()
そして午前から午後までたっぷり、 このように あれこれ行楽した。 まずはサンストに行って、写真館で記念写真を撮って、次に某料理屋に行って豪華なランチ、そして岩水寺に行った。 ずっとスーツ(ネクタイは写真館の中だけ)で疲れたが、まぁ、桜もぼちぼち咲いて好天だったので、良かったのだ。
![]()
帰宅してみると、いよいよ今日が最終局である棋王戦も中盤から終盤に差し掛かっていた。 王将戦に続いて振り駒で先手となった藤井六冠がやや優勢という感じで、これは遂にカド番脱出をダブルでクリアするのか・・・という雰囲気になってきた。 デスクトップは、AbemaTVの中継に加えて、YouTubeの3つのライブ中継も並べて、CPU温度は90℃を超えた状態が続いたが、終局までこの状態で見守ることになった。
![]()
そして18時過ぎ、藤井六冠のダブル防衛の瞬間まで見守ったが、その最終盤にも、解説の棋士が気付かなかった 「綾の手」をAIが頑強に推奨していたりして、「人間の将棋」を堪能することが出来た。 結局、カド番となった2局をタイに戻して、逆転防衛となった2局を含めて、ラストの4局のAI評価値は全て見事な「藤井曲線」を描いていた。 いやー、素晴らしい対局だった。
2026年3月30日(月)
今日は午後に眼科の通院(散瞳検査)があり、さらに朝イチで内科(かかりつけ医)にも「検査・処方箋」のために行った。 その血液検査の結果はすこぶる良好で、ここ2年ぐらいの記録と並べても安定しているとのことで、なんとここ10年ぐらい常に飲んできた「コレステロールを下げる薬」を、ちょっと止めてみることになった。 つまり初めて「処方箋ナシ」で、次回は6月中旬あたりまで待って(薬の効き目が切れる)から、また検査通院することになった。 今年1月からずっと、明日明後日で14週目になる「筑波詣で」「柏詣で」によって、毎週、長時間の電車や駅/街ごとの徒歩によって、おそらくこの半年の僕は近年にない「運動」をしているので、その効果なのかもしれない。
![]()
午後に眼科に出掛けるまでに行ったのは、一昨日のsuno v5.5のBeta版「オリジナルモデル化」のテストの続きである。 一つだけ、デスメタル風味の「nagasm3」モデルは上手く出来たが、他のアイデアは失敗が続いてきた。 そこで上のように、GarageBandに計11種類の「効果音集」からのサウンドを選んで並べた。 その全体(順にそれぞれの音が連なっている)は このように なっていて、内容は「破壊音・機械音・爆発音・無線機ノイズ」などである。 これを最後の1つはそのまま、あとは2つずつ適当にミックス/フェード処理して、計6本のmp3ファイル ★ ★ ★ ★ ★ ★ を作った。
![]()
そして上のように、この6本のノイズ系mp3を用いたオリジナルモデル「nagasm5」を作成した。 このnagasm5モデルに対して、インストルメンタル指定しつつ同一のプロンプト「Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes」を与えると、作業中に出てきたタイトルが「Romantic Echoes」ということで、ちょっと嫌な予感がした。
![]()
●本日のsuno生成音楽(2026.03.30)●
タイトル : Romantic Echoes
使用したモデル : nagasm5(オリジナル : ノイズ系)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Tender neoclassical piano and strings, slow rubato tempo, written as a 5-minute arc: gentle solo piano opening, warm legato cello joins on the main theme, then full string section swells softly in the middle, Dynamics breathe like a slow waltz of memory―moments of bittersweet tension resolving into clear major harmonies, Final minute returns to sparse piano with delicate high-register countermelodies, ending on a lingering, hopeful cadence, romantic, vocal, classic, happy, slow, sad
Result : Romantic Echoes1 - Romantic Echoes 2案の定、出てきた2曲(2min29sec, 2min59sec)は甘美でどこにもノイズの感じが無かったが、唯一、 Romantic Echoes1 の1分23秒あたりに、不自然な太鼓?みたいな連打があり、たぶんこれがモデルの主張なのだろう。
そこでもう一つの実験として、今度はこの「nagasm5」を生かした生成を目指して、アドリブでプロンプトを「noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes」と与えたみた。 ちょうど世界中でこういう悲しい戦争が起きているので、まぁタイムリーではある。 出てきたのはメタル系の「Red Siren Sky」という曲(2min27sec, 2min37sec)であり、特に2曲目のラスト付近でちょっとノイズ系モデルの片鱗があった。
●本日のsuno生成音楽(2026.03.30)●
タイトル : Red Siren Sky
使用したモデル : nagasm5(オリジナル : ノイズ系)
与えたPrompt : noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes
出てきたPrompt : Explosive industrial rock with male vocals; harsh, distorted drums and snarling bass under the verses, siren-like synths and shouted gang vocals in the chorus, guitars grind in low tunings with feedback swells; pre-chorus pulls back to eerie, spacious pads, then the hook hits like a detonation, Final minute stretches into a crushing half-time breakdown, vocal stacked in octaves and screams, world, noise
Result : Red Siren Sky 1 - Red Siren Sky 2次の実験としては、今度はこの同じ「noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes」というプロンプトで、モデルの方を汎用有償v5にしたらどうなるか・・・という事になる。 出てきた「Cracks in the Silence」という曲(2min26sec, 3min29sec)では確かに、聞きやすくなり、ギター等が駆使されて「断然POP」になっていて、これは間違いなく「nagasm5」の音響テイストとは違っていた。 そうなると、この「nagasm5」(ノイズ群)もキープしておく事になる。
●本日のsuno生成音楽(2026.03.30)●
タイトル : Cracks in the Silence
使用したモデル : v5
与えたPrompt : noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes
出てきたPrompt : Dark cinematic rock with male vocals; slow burn from sparse piano and low drones into towering guitars, tom-heavy drums, and choral backing on the last chorus, Verses sit close and intimate, almost whispered; choruses explode with gritty belts and stacked harmonies, Distorted bass and filtered noise swell between sections, with a roomy, echoing bridge that pulls back before the final rise, world, noise
Result : Cracks in the Silence 1 - Cracks in the Silence 2こうなると、他のモデルでも同じ「戦争」プロンプトのままで試して比較したくなる。 モデル選択のメニューには、オリジナルの他になんと以下の9種類のモデルが並んでいた。
オリジナルでない汎用モデルのv5.5をまだ試していないことに気付いたが、ここは古い方から「昇順」にチェックしていきたい。 そこで、最も古い「v2 - vintage」を試してみると、せっかくのプロンプトはほぼ無視されて、普通の凡庸なロックが出てきた。 それも出てきた「Red Sirens Over Gray Skies」は2曲とも1min20secで、メリハリも盛り上がりも乏しくて、sunoも最初はこんなものだったのか・・・と安心した。
- v5.5 Pro - Powers Voices, Custom Models and My Taste
- v5 Pro - Authentic vocals, superior quality and comtrol
- v4.5+ Pro - Advanced creation methods
- v4.5 Pro - Intelligent prompts
- v4.5-all - Best Free model
- v4 Pro - Improved sound quality
- v3.5 - Basic song structure
- v3 - older
- v2 - vintage
●本日のsuno生成音楽(2026.03.30)●
タイトル : Red Sirens Over Grey Skies
使用したモデル : v2 (vintage)
与えたPrompt : noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes
出てきたPrompt : Dark cinematic rock with male vocals, low-tuned guitars and tom-heavy drums pulsing like sirens, Verses stay hushed and tense with distant choirs and droning synths; choruses explode into distortion, stacked shouts, and pounding rhythm, Middle section drops into eerie ambience and heartbeat bass before a final, bigger chorus crashes in, then decays into echo and reverb, noise, world
Result : Red Sirens Over Grey Skies 1 - Red Sirens Over Grey Skies 2sunoの出始めは全てフリーだったのだが、version(性能)が上がっていくと後に「Pro」という有料版も出てきたわけなので、同一プロンプトでこれらのモデルの成長の軌跡を確認するのは面白い。 次は「v3 - older」であり、以下のようにタイトルは「Red Sky Sirens」だが、やはりdurationは両方とも2min00secと淡白なのだった。 確かにv2に比べてメタルというかロックサウンドが進化した感じはするのだが、まぁ全体の構成というのはまだ乏しい。
●本日のsuno生成音楽(2026.03.30)●
タイトル : Red Sky Sirens
使用したモデル : v3 (older)
与えたPrompt : noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes
出てきたPrompt : Aggressive industrial metal with male vocals; triplet double-kick patterns, downtuned guitars, distorted bass, and harsh synth sirens, Verses stay tight and choked, drums syncopated with noisy stabs; chorus widens with shouted gang vocals and octave lead, Mid-song breakdown strips to kick, bass, and vocal chant before a final full-tilt wall of sound outro, world, noise
Result : Red Sky Sirens 1 - Red Sky Sirens 2そして次のモデルは「v3.5 (Basic Song Structure)」である。 細かく刻んできたもののまだフリーであり、ただし「Song Structure」と言うだけあって、前半から後半に大きく変容したりするスケール感がなかなか好感できるものになった。 タイトルはいずれも似たようなものだが「Cracks in the Siren Sky」であり、ここにきてdurationが3min22sec, 2min45secと分かれてきた。
●本日のsuno生成音楽(2026.03.30)●
タイトル : Cracks in the Siren Sky
使用したモデル : v3.5 (Basic Song Structure)
与えたPrompt : noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes
出てきたPrompt : Dark cinematic rock with male vocals; low drones and distant sirens under a slow, marching tom groove, bass pulsing like a heartbeat, Verses stay restrained and spoken-sung over sparse guitar swells; chorus explodes with distorted power chords, stacked shouts, and roomy drums, Bridge strips back to a single piano and vocal before a final full-band hit that decays into cold ambience, world, noise
Result : Cracks in the Siren Sky 1 - Cracks in the Siren Sky 2そしていよいよ次の「v4 (1st Pro)」は、初めての有料版であり、Improved sound qualityと言うだけあって、なんかプログレ心をくすぐる、いい感じの仕上がりになっていた。 流石のsunoで、このあたりで業界(プロミュージシャンの95%以上が音楽生成AIを使っているらしい)にも注目されてきたのだろう。 タイトル「Cracks In The Sky」であるが、何故かこの初Pro版になって、durationは1min16sec, 2min09secとかなり縮んだが、キャッチーなフレーズとか、まさにプロ的な感じに仕上がってきた印象だ。
●本日のsuno生成音楽(2026.03.30)●
タイトル : Cracks In The Sky
使用したモデル : v4 (1st Pro)
与えたPrompt : noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes
出てきたPrompt : Heavy alt-rock band, midtempo 5-minute arc: verse one rides a tense, palm-muted guitar over roomy drums; chorus explodes with wide distorted guitars and stacked male vocals, Second verse adds eerie lead guitar textures and tom-heavy groove, bridge drops to near-whisper over bass and sparse kick, then returns with a final, stretched-out chorus and feedback-soaked outro, noise, world
Result : Cracks In The Sky 1 - Cracks In The Sky 2次の「v4.5-all」というのは、現状フリーのモデルの最上級ということになる。 生成されるプロンプトの冒頭が「Dark cinematic rock」ということで、まさに劇的な曲「Frozen Sirens」(3min26sec, 5min11sec)が生成された。 ある意味でsunoの「命」でもあるボーカルを封印している中で、これはかなり凄いものだと言えそうだ。
●本日のsuno生成音楽(2026.03.30)●
タイトル : Frozen Sirens
使用したモデル : v4.5-all
与えたPrompt : noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes
出てきたPrompt : Dark cinematic rock with male vocals; slow-building intro of distant warlike drums, low strings, and muted guitar swells, Verses stay tense and close-mic’d over sparse percussion and pulsing bass, then the chorus explodes with distorted guitars, choir-like backing vocals, and crashing cymbals, Bridge drops to a haunting half-time with echoing toms and eerie synths before a final, bigger chorus and a long reverb tail, world, noise
Result : Frozen Sirens 1 - Frozen Sirens 2この現状フリー最上級の4.5の上には、さらに「v4.5 Pro」と「v4.5+ Pro」という2つのモデルがあって、その上がようやくv5となっている。 「v4.5 Pro」が出たところで旧版を「v4.5-all」としたのだろうから、やはり、その差はある筈である。 とりあえず先にv5をやってしまったが、「v4.5 Pro」のタイトルも同じ「Cracks in the Silence」だったので、こちらを「3」「4」にする事にした。 durationは2min34sec, 3min49secとなんか微妙な気もしたが、いやいや中身は確かに向上していた。 生成されるプロンプトの冒頭は「Dark alternative rock」であり、いやいや、さらにキャッチーで、これじゃプロのアレンジャーも頼ってしまうのが分かる。
●本日のsuno生成音楽(2026.03.30)●
タイトル : Cracks in the Silence
使用したモデル : v4.5 Pro
与えたPrompt : noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes
出てきたPrompt : Dark alternative rock with male vocals; tense, palm-muted guitars and a slow-building groove that erupts into a huge, fuzz-soaked chorus, Kick and floor toms feel like marching boots; bass grinds under dissonant synth pads, Bridge drops to near-whisper, then crashes back with stacked gang vocals and feedback-drenched outro, world, noise
Result : Cracks in the Silence 3 - Cracks in the Silence 4そして「4.5+ Pro」である。 v5が出る前の最終versionモデルということで、期待しつつスタートした。 タイトルはv3と同じ「Red Sky Sirens」だったので、こちらを「3」「4」にする事にした。 durationは3min22sec, 2min54secだったが、「alternative rock」であり「post-punk」というその曲は、いやいや素晴らしかった。 これは脱帽ものだぁ。
●本日のsuno生成音楽(2026.03.30)●
タイトル : Red Sky Sirens
使用したモデル : v4.5+ Pro
与えたPrompt : noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes
出てきたPrompt : Dark alternative rock with male vocals; tense, palm-muted guitars and a slow-building groove that erupts into a huge, fuzz-soaked chorus, Kick and floor toms feel like marching boots; bass grinds under dissonant synth pads, Bridge drops to near-whisper, then crashes back with stacked gang vocals and feedback-drenched outro, world, noise
Result : Red Sky Sirens 3 - Red Sky Sirens 4ちょっと順序がテレコになっているのと、標準v5.5のモデルが抜けているものの、ようやくsunoの「モデルの進化」を確認できた気がする。 そしてv5.5ではそのモデルをカスタマイズできる・・・というのが売りで、まだ途中ではあるものの「nagasm3(デスメタル臭)」・「nagasm5(ノイズ群)」という2つのオリジナルモデルを作ることも体験した。 明日と明後日はまたまた柏なのだが、ここらのサンプルを聞き比べつつの新幹線にしてみようか。
2026年4月2日(木)
一昨日から昨日までの「火・水」は14週連続の「柏行脚」だったが、昨日は3週間ぶりに僅かに母親とのアイコンタクトが出来た収穫があった。 ただし老衰は刻々と進行していて、x-dayはそう遠くないという事実もあり、来週もまた柏に行く。 そんな「BIG ECHO 柏駅前」でのヒトカラ4時間では42曲を完走して、3月の記録は以下のようになった。 ちなみに2月の記録およびそれ以前の情報へのリンクは、 この日記のPart11 の「2026年2月26日(木)」のところにある。そして、一昨日のこの「BIG ECHO 柏駅前」では、新しい発見があった。 たまたま空いていた部屋が10人以上も入れるという大部屋で、なんとプロジェクタが直交する2面の壁に投射されている部屋だった。 BIG ECHOの第一興商のDAMでは、曲ごとにDAMオリジナルのイメージ映像と歌詞テロップを重ねて出すので、この隣り合った2壁面には同じ映像が並ぶ(最初はちょっと気持ち悪い)。 そして何曲か歌っていく内に気付いたのだが、DAMと歌手の契約(大人の事情)によるものらしく、本人映像(アニソンの場合はオリジナルアニメ)が出る時に限って、左側の壁面映像はそのいつものDAM本人映像なのに、右側の壁面映像はこれと異なる「スクリーンセーバみたいな」抽象画像に切り替わるのだった。 1部屋で2画面投射の両方には本人映像を出さないという契約らしいのだが、なんか抽象画像が気になって面白かった。
- 2026年3月2日(月) 3.5時間 37曲 (BIG ECHO 柏駅前)
- 2026年3月9日(月) 4時間 39曲 (BIG ECHO 柏駅前)
- 2026年3月16日(月) 4時間 41曲 (BIG ECHO 柏駅前)
- 2026年3月19日(木) 5時間 53曲 (地元・JoyJoy住吉)
- 2026年3月23日(月) 3.5時間 39曲 (BIG ECHO 柏駅前)
- 2026年3月31日(火) 4時間 42曲 (BIG ECHO 柏駅前)
![]()
![]()
そして驚いたのが、サザンのTSUNAMIを歌った時だった。 いつものDAMイメージ映像でなく、なんとライヴでこの曲を歌う桑田佳祐が出てきて動揺したのだが、そういえばライヴツアーのDVDを絶賛発売中ということで、これは期間限定のプロモーションだったのだ。 そしてこの時、上の写真のように、大人の事情で抽象画像が出る右側には、この曲とは別のサザンのライブ映像が出てきたのである。 流石、太っ腹のサザンと言うべきか、2画面の両方で異なる桑田佳祐の歌唱映像と共にヒトカラ、というのは、なかなか至福の時間だった。
![]()
2日目の昨日の午前中は、いつものように3時間の時間潰しのために柏駅西口の「カラオケBanBan」に入って、スクリーンをブルーバックにしてサウンドを消してパソコンを広げて「お仕事」をした。 なんせ前夜にヒトカラ絶唱しているので、翌朝には喉を休める必要があるのだ。 そこでは、 この日記のPart1 の「2024年3月18日(月)」のところにあった実験から、「カオスの淵」付近にある挙動でピアノを鳴らしたサウンドの 1分間version と 2分間version という2本のmp3(聞いているとなかなか気持ち良い)をゲットした。 これを30秒ずつに分割して、 ★ ★ ★ ★ ★ ★ という6本のmp3を作った。 当然これは、sunoに新しいオリジナルモデルを作らせるためのものである(→後述)。
![]()
![]()
![]()
![]()
今朝はアメリカからライヴ中継の情報があり、アルテミス計画で54年ぶりに「月(の周回軌道)に人間を送る」というロケットの打ち上げを見つめた。 せっかくなので上のようにスクショを撮ってみたが、上手く進むことを期待しよう。 しかし54年前、まだ小学生だった僕は、人類が月面に降り立つのを白黒テレビの生中継で見ていたのだが、その後の人類の進展というのはあったのか無かったのか、いろいろ考えさせられてしまう。
そして午前中は役所に行ったり(退職後2年で健康保険の切り替え)MaxValuに行ったりして、午後にsuno作業を再開した。 再録すると、元となった「カオスの淵」あたりでrandomとrepetationの間を揺らぐ2本のサウンドファイル ★ ★ を30秒ずつに分割して、それぞれ30秒のサウンドファイル ★ ★ ★ ★ ★ ★ を作った。 この6本をsuno5.5の新機能「オリジナルのモデルを作る」に投げ込んで、「nagasm6(chaos piano)」というモデルを作った。 これで、「nagasm3(デスメタル臭)」・「nagasm5(ノイズ系)」・「nagasm6(chaos piano)」という、枠一杯の3個のオリジナルモデルが出来たことになる。
この「nagasm6」で、「Instrumental」(ボーカル無し)を指定しつつ、このところ使ってきた2種類のプロンプト : 「戦争 - noise, bomb, violence, world war, hate, sadness, break, death, freeze, blood, cry, weapon, duration is 5minutes (騒音、爆弾、暴力、世界大戦、憎しみ、悲しみ、破壊、死、凍結、血、泣き声、武器、所要時間は5分)」と、「平和 - Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes (クラシック音楽のようなスローバラード、ボーカルなし、ロマンチック、幸せな気分、少し悲しい、希望に満ちた曲、演奏時間は5分)」をそのままコピペで投げ込んでのcreateである。
●本日のsuno生成音楽(2026.04.02)●
タイトル : Blood in the Static
使用したモデル : nagasm6(オリジナル : chaos piano)
与えたPrompt : noise, shout, ply, chaos, eccentric, duration is 5 minutes, earthquake, madman, witch, underground, growl
出てきたPrompt : Explosive industrial rock with distorted guitars and glitchy synths, male vocals pushed forward and raw, Verses stay tense and clipped over mechanical percussion; chorus opens up with wide power chords, shouted gang vocals, and a surging bass, Middle break dives into eerie drones and filtered drums, then slams back into the final hook with doubled screams and a trailing feedback outro, noise, world
Result : Blood in the Static 1 - Blood in the Static 2上が、モデル「nagasm6(chaos piano)」に戦争系プロンプトを投げた作品「Blood in the Static」(duration : 2min33sec, 2min55sec)なのだが、ここにきて初めて、オリジナルのプロンプトの効き目を実感できた。 この2曲はもちろん、publishすることにした。 まぁ「Explosive industrial rock with distorted guitars and glitchy synths」ということで、ヘビメタ系のロックではあるのだが、なんと「chaos piano」のあの片鱗が、そこかしこに登場してくれたのだ。 これは素晴らしいことで、音響としてのピアノは別にしても、細かくトレモロのように連打されつつ、そのtonarityが刻々と揺らぐのをきちんと学習してくれていた。 まさか、あの 単調なピアノ が、ここまで効いてくれるとは、まさに想定外だった。
●本日のsuno生成音楽(2026.04.02)●
タイトル : Romantic Dawn Over the Lake
使用したモデル : nagasm6(オリジナル : chaos piano)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Neo-classical chamber ballad for strings and piano, 5-minute arc: tender solo piano opening, then warm strings enter and bloom into lyrical themes; middle section leans into a bittersweet modulation with expressive cello lines and gentle harp arpeggios; final reprise returns to the main hopeful motif in a higher register, building to a radiant, sustained cadence with soft string tremolos that slowly fade, vocal, happy, romantic, slow, classic, sad
Result : Romantic Dawn Over the Lake 1 - Romantic Dawn Over the Lake 2上が、モデル「nagasm6(chaos piano)」に平和系プロンプトを投げた作品「Romantic Dawn Over the Lake」(duration : 3min04sec, 3min13sec)なのだが、またまたオリジナルのプロンプトの効き目を実感できた。 「Neo-classical chamber ballad for strings and piano」とは、なかなか良い解釈なのだ。 チェロやピアノの細かいパッセージとかの揺らぎは、まさかこれが「カオスの淵」効果とは、知らなかったら分からないだろう。 こちらの2曲も、もちろんpublishすることにした。
![]()
午後には時間があったので、ちょっと一念発起、久しぶりにハンダ付けをして、 このように 謎の実験をしてみた。 まだ最終形のアイデアを思い付いていないのだが、mbedばかりで、これまで「ArduinoでPAWセンサ」をやっていなかった事に気付いて、やってみたのである。 せっかくなので実験の様子を動画に撮ってみたのが このYoutube動画 で、その様子とMaxパッチは以下である。
![]()
以下がArduinoスケッチであり、これまでの256LED点灯パターンは全く変更せず、そこに並列に「PAWセンサの値を取得してシリアル(115200bps)でまとめて送る」という処理を追加しただけ。 久しぶりにPAWセンサのマニュアルを開いて、電源電圧が3.3Vだった事に驚いたり、電卓を叩いてArduinoから+5Vで送る信号に220Ωの抵抗を入れたりした。 Maxの側も、過去に作った「Single PAW sensor」のフォルマント合成デモのパッチそのもので、当時は115200のMIDIフォーマットで送っていたのを、Arduinoからのシリアル受信に置換しただけである。
まだこれでは「Arduinoスタンドアロン」になっていなくて、Maxとペアでの動作なので、まだまだ構想を進めていかなければならないのだが、午後にフト思い付いて2時間ほどでやっつけた仕事としては、まぁまぁだろう。 こういうのをしていないと、どんどん退化してしまうのだ。# include <Adafruit_NeoPixel.h> Adafruit_NeoPixel pixels(256,6,NEO_GRB + NEO_KHZ800); int rgb[3], timing[3], paw[4], pointer, mode=0, paw_mode; int musicScale[] = {523,587,659,698,784,880,988,1047}; void setup(){ pixels.begin(); tone(4,880); delay(50); noTone(4); delay(50); tone(4,1760); delay(50); noTone(4); Serial.begin(115200); pinMode(8, OUTPUT); pinMode(9, OUTPUT); digitalWrite(8, LOW); digitalWrite(9, LOW); paw_mode = 0; all_clear(); pixels.show(); nice_initial(); } void loop(){ if(++timing[0] > 100){ timing[0] = 0; if(++timing[1] > 10){ timing[1] = 0; PAW_sensor_read(); led_display(); } } } void PAW_sensor_read(){ switch(paw_mode){ case 0: digitalWrite(8, HIGH); digitalWrite(9, LOW); break; case 1: paw[0] = analogRead(A0); paw[1] = analogRead(A1); digitalWrite(8, LOW); digitalWrite(9, LOW); break; case 2: digitalWrite(8, LOW); digitalWrite(9, HIGH); break; case 3: paw[2] = analogRead(A0); paw[3] = analogRead(A1); digitalWrite(8, LOW); digitalWrite(9, LOW); break; } paw_mode = (paw_mode + 1) % 4; if(paw_mode == 0){ Serial.print(paw[0]); Serial.print(" , "); Serial.print(paw[1]); Serial.print(" , "); Serial.print(paw[2]); Serial.print(" , "); Serial.println(paw[3]); } } void led_display(){ int point2; switch(mode){ case 0: all_clear(); color_set(0); point_disp(pointer); pixels.show(); break; case 2: all_clear(); color_set(0); point2 = zigzag(pointer); point_disp(point2); pixels.show(); break; case 1: all_clear(); color_set(0); point_disp(random(256)); pixels.show(); break; case 3: all_clear(); color_set(0); point_disp(random(256)); color_set(0); point_disp(random(256)); pixels.show(); break; } pointer = ++pointer % 256; if(pointer == 0) mode = ++mode % 4; } int zigzag(int i){ if(i<16) return(16*i); else if(i<32) return(16*(31-i)+1); else if(i<48) return(16*(i-32)+2); else if(i<64) return(16*(63-i)+3); else if(i<80) return(16*(i-64)+4); else if(i<96) return(16*(95-i)+5); else if(i<112) return(16*(i-96)+6); else if(i<128) return(16*(127-i)+7); else if(i<144) return(16*(i-128)+8); else if(i<160) return(16*(159-i)+9); else if(i<176) return(16*(i-160)+10); else if(i<192) return(16*(191-i)+11); else if(i<208) return(16*(i-192)+12); else if(i<224) return(16*(223-i)+13); else if(i<240) return(16*(i-224)+14); else return(16*(255-i)+15); } void point_disp(int i){ int p = 255 - i; if(((p >> 4) & 1) == 0) p = (p & 0xf0) - (p & 0x0f) + 15; pixels.setPixelColor(p, pixels.Color(rgb[0],rgb[1],rgb[2])); } void all_clear(){ for(int i=0;i<256;i++) pixels.setPixelColor(i, pixels.Color(0,0,0)); } void color_set(int mode){ int iii; if(mode == 0) iii = random(1,7); else iii = 7; switch(iii){ case 1: rgb[0]=30; rgb[1]=0; rgb[2]=0; break; case 2: rgb[0]=0; rgb[1]=30; rgb[2]=0; break; case 3: rgb[0]=0; rgb[1]=0; rgb[2]=36; break; case 4: rgb[0]=20; rgb[1]=20; rgb[2]=0; break; case 5: rgb[0]=20; rgb[1]=0; rgb[2]=20; break; case 6: rgb[0]=0; rgb[1]=20; rgb[2]=20; break; case 7: rgb[0]=25; rgb[1]=25; rgb[2]=25; break; } } void nice_initial(){ int i,j; for(i=0;i<256;i++){ for(j=0;j<3;j++){ rgb[j] = random(1,8); pixels.setPixelColor(i, pixels.Color(rgb[0],rgb[1],rgb[2])); } } pixels.show(); delay(250); for(i=0;i<256;i++){ for(j=0;j<3;j++){ rgb[j] = random(1,20); pixels.setPixelColor(i, pixels.Color(rgb[0],rgb[1],rgb[2])); } } pixels.show(); delay(250); for(i=0;i<256;i++){ for(j=0;j<3;j++){ rgb[j] = random(1,33); pixels.setPixelColor(i, pixels.Color(rgb[0],rgb[1],rgb[2])); } } pixels.show(); delay(250); all_clear(); pixels.show(); }2026年4月3日(金)
世間は「花見」の話題でもちきりだが、自宅マンションの3階ドアを開けた瞬間に一面の桜がまぶしい環境(環境音は「鶯の声」)では、人混みに出かけることも思い浮かばなくなる。 昨日の実験の続きの作戦を思い付いたのでそれを進めたいのだが、頻繁に届く京都精華大からの事務連絡を受けて「SEIKA PORTAL」に行ってみると、なんとまだ「2Q」のスタートまで2ヶ月あるのに、以下のように履修登録者が既に67人もいた。 現在は全て2回生のようだが、ここに単位目的の上回生が入ってくるとどれだけ肥大するのか、少人数SUAC出身でマンモス私大の大人数授業に慣れていない身としては、ちょっとたじろぐ現況である。
![]()
今日の予定は晩のロボット教室、あと午前にアオイ楽器にRP2キット(箱)を取りに行くぐらいなので、「生成音楽論」(suno)にも後ろ髪を引かれつつ、とりあえず「昨日の実験の続き」を始めることにした。 昨日のArduinoスケッチは完全にそのままで、PAWセンサからの4データが刻々と「300 , 250 , 400 , 350」のようなメッセージでシリアル(115200)送信されている。 その受け手のMaxパッチの方を全面改訂して、lcdオブジェクトに見立てた「スクリーン内」を、PAWセンサでグリグリと動かしてやりたい・・・という作戦なのだ。 まずは縦と横にクロスしたスライダー(value = 0〜100)でX座標とY座標を「300×300」サイズのlcd内で自在に動くようにして、次にPAWセンサに切り替えても同様にscaling(value = 0〜100)したX座標とY座標を計算すればよい、というアイデアである。
![]()
ちょっと考えてみると、元々PAWセンサ内のLEDと光センサは域内を4分割した領域に配置されているので、調べてみると「左に強い」・「右に強い」・「上に強い」・「下に強い」という4つのセンサ値が簡単に分かった。 とすれば、それぞれこの「強い」(影響が大きい)というやつだけを中央座標に対して加味してやればいいのでは? と気付いて、実際にこれでアッサリと「2次元平面上をPAWセンサでぐりぐり」という動作が、上のパッチで実現してしまった。 せっかくなので実験の様子を動画に撮ってみたのが このYoutube動画 で、その様子が以下である。
![]()
こうなると、あとはこのMaxで実装したアルゴリズムをArduinoスケッチの方に移行すれば、「ArduinoだけでPAWセンサの2次元ポインタを取得」できることになる。
・・・そして集中すること30分、なんと以下のように、今日のところの目標まで出来てしまった。動画を撮ってもこの高速LED点灯はあまりカメラで上手く撮れないのだが、せっかくなので実験の様子を動画に撮ってみたのが このYoutube動画 で、その様子が以下である。# include <Adafruit_NeoPixel.h> Adafruit_NeoPixel pixels(256,6,NEO_GRB + NEO_KHZ800); int rgb[3], timing[3], paw[4], pointer, mode=0, paw_mode, PAW_point; int musicScale[] = {523,587,659,698,784,880,988,1047}; void setup(){ pixels.begin(); tone(4,880); delay(50); noTone(4); delay(50); tone(4,1760); delay(50); noTone(4); pinMode(8, OUTPUT); pinMode(9, OUTPUT); digitalWrite(8, LOW); digitalWrite(9, LOW); paw_mode = 0; all_clear(); pixels.show(); nice_initial(); } void loop(){ if(++timing[0] > 100){ timing[0] = 0; if(++timing[1] > 10){ timing[1] = 0; PAW_sensor_read(); led_display(); } } } void PAW_sensor_read(){ switch(paw_mode){ case 0: digitalWrite(8, HIGH); digitalWrite(9, LOW); break; case 1: paw[0] = analogRead(A0); paw[1] = analogRead(A1); digitalWrite(8, LOW); digitalWrite(9, LOW); break; case 2: digitalWrite(8, LOW); digitalWrite(9, HIGH); break; case 3: paw[2] = analogRead(A0); paw[3] = analogRead(A1); digitalWrite(8, LOW); digitalWrite(9, LOW); break; } paw_mode = (paw_mode + 1) % 4; } void PAW_point_display(){ int d1, d2, d3, d4; d1 = ( 110 + map(paw[3],409,58,0,220) - map(paw[0],512,74,0,220) ) / 2; d2 = map( constrain(d1,0,100), 0, 100, 0, 15); d3 = ( 110 + map(paw[1],363,53,0,220) - map(paw[2],418,58,0,220) ) / 2; d4 = map( constrain(d3,0,100), 0, 100, 0, 15) * 16; color_set(7); PAW_point = d2 + d4; point_disp(d2+d4); } void led_display(){ int point2; switch(mode){ case 0: all_clear(); color_set(0); point_disp(pointer); break; case 2: all_clear(); color_set(0); point2 = zigzag(pointer); point_disp(point2); break; case 1: all_clear(); color_set(0); point_disp(random(256)); break; case 3: all_clear(); color_set(0); point_disp(random(256)); color_set(0); point_disp(random(256)); break; } PAW_point_display(); pixels.show(); pointer = ++pointer % 256; if(pointer == 0) mode = ++mode % 4; } int zigzag(int i){ if(i<16) return(16*i); else if(i<32) return(16*(31-i)+1); else if(i<48) return(16*(i-32)+2); else if(i<64) return(16*(63-i)+3); else if(i<80) return(16*(i-64)+4); else if(i<96) return(16*(95-i)+5); else if(i<112) return(16*(i-96)+6); else if(i<128) return(16*(127-i)+7); else if(i<144) return(16*(i-128)+8); else if(i<160) return(16*(159-i)+9); else if(i<176) return(16*(i-160)+10); else if(i<192) return(16*(191-i)+11); else if(i<208) return(16*(i-192)+12); else if(i<224) return(16*(223-i)+13); else if(i<240) return(16*(i-224)+14); else return(16*(255-i)+15); } void point_disp(int i){ int p = 255 - i; if(((p >> 4) & 1) == 0) p = (p & 0xf0) - (p & 0x0f) + 15; pixels.setPixelColor(p, pixels.Color(rgb[0],rgb[1],rgb[2])); } void all_clear(){ for(int i=0;i<256;i++) pixels.setPixelColor(i, pixels.Color(0,0,0)); } void color_set(int mode){ int iii; if(mode == 0) iii = random(1,7); else iii = 7; switch(iii){ case 1: rgb[0]=30; rgb[1]=0; rgb[2]=0; break; case 2: rgb[0]=0; rgb[1]=30; rgb[2]=0; break; case 3: rgb[0]=0; rgb[1]=0; rgb[2]=36; break; case 4: rgb[0]=20; rgb[1]=20; rgb[2]=0; break; case 5: rgb[0]=20; rgb[1]=0; rgb[2]=20; break; case 6: rgb[0]=0; rgb[1]=20; rgb[2]=20; break; case 7: rgb[0]=25; rgb[1]=25; rgb[2]=25; break; } } void nice_initial(){ int i,j; for(i=0;i<256;i++){ for(j=0;j<3;j++){ rgb[j] = random(1,8); pixels.setPixelColor(i, pixels.Color(rgb[0],rgb[1],rgb[2])); } } pixels.show(); delay(250); for(i=0;i<256;i++){ for(j=0;j<3;j++){ rgb[j] = random(1,20); pixels.setPixelColor(i, pixels.Color(rgb[0],rgb[1],rgb[2])); } } pixels.show(); delay(250); for(i=0;i<256;i++){ for(j=0;j<3;j++){ rgb[j] = random(1,33); pixels.setPixelColor(i, pixels.Color(rgb[0],rgb[1],rgb[2])); } } pixels.show(); delay(250); all_clear(); pixels.show(); }
![]()
スタンドアロンArduinoに、「256LEDパネル」と「PAWセンサ」が付いていて、これまでと同様の4モードのLED点灯表示動作をしながら、さらに「PAWセンサで指定されたポインタ(defaultではLEDパネルの中央)」は、PAWセンサのぐりぐり操作によって、16×16のスクリーン上をホワイトの輝点として明確に動くのを体感できる。 これはさっそく、今日のロボット教室に持って行って、生徒に試してもらうことにしよう。 ただし、PAWセンサは繊細なので、「そっと触って」というのが注意点となる。
2026年4月4日(土)
今日と明日の土日は予定が何もないし、全国的に「花見のラストチャンス」と言われているのだが、今日の午後から夜は全国的に凄い風雨(花散らし)だという。 午前中にMaxValuに買い出しに行く時に撮ったのが以下の写真だが、マンションのドアを開けた正面の様子で、背景の空がほぼ白いのは「曇り」だからなのだが、背景が澄み渡った青空でなくてもこんな満開の絶景が自宅前に広がっているのは幸せである。
![]()
昨日作ったArduino工作については、ちょっとゲームっぽいアルゴリズムを思い付きかけているのだが、京都精華大の教務に質問して届いた回答もあって、今日はsunoでももなくArduinoでもなく、まずは「生成音楽論」のための授業準備に集中することにした。 なんせ、「SEIKA PORTAL」という謎のシステムの中に「Web学習支援機能"クラスプロファイル"」というのがあり、これを使って教材と課題を提示して、多数の学生からのレポート(データ添付)をこれで受け取る必要がある。 さらに「学生の意見交換の機会」の確保として、『オンデマンド型授業については、「授業の終了後すみやかに」、(1)「設問回答、添削指導、質疑応答による十分な指導」を行うとともに、(2)「学生の意見交換の機会」を確保する必要があります』などというのもあるのだ。 「相手の土俵」に合わせるというのは、どんな世界でも世の常なので、これはとにかく合わせていくしかない。 ただし僕の場合には枠組みだけは合わせるとしても、自分のサイト内に実体を置いて、そこに誘導することになるのだ。
「第1週 音楽生成AIとの付き合い方」では、まず最初に全ての学生がsunoを使えるようにならないといけない。 そこでさっそく ChatGPTに聞き取り して、「sunoの概要」から始めることにした。 自分としてもここで発見があったので以下に整理してみたが、まずまず既知の内容だった。 新たな知見/発見に赤色を付けていってみよう。
無料ユーザー
- 無料ユーザーは「Basicプラン」 → 1日50クレジット付与、基本モデル(v4 / v4.5)のみ
- 1曲あたり約5クレジット消費 → 約10曲/日が目安
- 生成方法(長さやモード)で多少前後する
- 「Basicプラン」の著作権(権利)はSuno側に帰属
- 「Basicプラン」のユーザーは「個人利用・非商用のみOK」・「商用利用は不可」
- 無料で作った曲は後からProにしても「商用利用できるようにはならない」(作り直しが必要)
有料(Pro)ユーザー
- 「Proプラン」 → 月額:$10 (日本円で1500円/月)
- 年割なら 約1,200円/月
- App Storeなど経由だと多少高くなることあり
- 2,500クレジット/月
- クレジットは毎月の課金日基準でリセット(日割りではない)
- 例:4/10に加入 → 毎月10日に補充
- クレジットの持ち越し : 不可(完全に消滅) - 余っても翌月に加算されない「使い切り型」
- 追加購入(top-up)クレジットは別扱い(消えないがサブスク有効中のみ)
- 1曲あたり約5クレジット消費 → 約500曲/月
- 生成方法(長さやモード)で多少前後する
- Pro加入中に作った曲 → 実質ユーザーに権利移転+商用OK
- ただし「完全な著作権保証」ではない
- 「著作権そのもの」ではなく、「商用利用ライセンス+権利譲渡」
- Sunoの権利をユーザーに譲渡(assignment)、つまり「配信(Spotify等)OK」・「収益化OK」・「商用利用OK」
- 規約「著作権が成立する保証はしない」(AI生成物なので法的に著作権が認められない可能性あり)
- できること - 商用配信(YouTube / Spotify)、BGM販売、クライアントワーク、ゲーム・映像利用
- 注意点 : 完全オリジナル保証はない(AI由来)、他作品と似るリスク、国によって著作権扱いが異なる
Suno曲を安全に使うプロの運用方法
そして、最新のv5.5の「オリジナルモデル」についての質問でも、どこまで正しいかは別として、以下のような収穫があった。 まぁ、こちらもおよそ想定していた内容なのだが、ここに整理しておこう。
- Suno AI の楽曲は「使えるけど“完全オリジナル保証はない素材”」と認識する
- プロは「そのまま使わず、加工して自分の作品にする」
- 5つの原則
- 原則(1) そのまま公開しない
生成直後の状態は : 他人と似る可能性あり、AI臭が残る、著作権的にグレーになりやすい
対策 : カット編集、EQ・リバーブ、構成変更 → “素材化”して使う- 原則(2) 必ず「自分の編集」を入れる (→ sunoのPremiereコース)
曲を分解(イントロ・A・Bなど) → 不要部分削除 → ループ化 → フェード処理
これで「AI生成そのまま」から脱出 → 実質的に“編集著作物”に近づく- 原則(3) ボーカル曲は慎重に扱う
既存アーティストに似る可能性、歌詞が偶然類似する可能性
対策 : インスト中心で使う、ボーカルはBGM扱い(小さく)、気になるならボーカル削除・差し替え- 原則(4) 「用途」を限定する (閉じた環境ほど安全)
SNS投稿▲、YouTube○、同人・趣味作品◎、個人視聴用◎◎- 原則(5) 念のための表記(任意だけど推奨)
義務ではないが、プロは結構やっている
例 : 「音楽:AI生成(Suno)+編集」、「Music generated with AI」
効果 : トラブル時の説明が楽、誤解回避- NGの利用法 : 生成した曲をそのままYouTubeにアップ、ボーカル曲をメインコンテンツとして使用、「自作曲」と断言する
- プロの最終判断 - 「問題になっても差し替えられる運用にする」
Suno v5.5の「オリジナルモデル」とは
今回の調査での最大の発見は、『通常はプロンプト次第で大きく変動するが、オリジナルモデルでは「何も書かなくてもそれっぽくなる」』というものだった。 確かに、プロンプトを空白にして、Instrument指定(ボーカル無し)とすれば、モデルそのものが何かやってくる筈なので、v2から試せるProとしては、まずこれをしてみたくなった。 そこで午後じゅうかかって、「生成音楽論」の準備を棚上げして、これを実験することにした。
- Sunoはざっくり言うと「テキスト条件付きの音声生成モデル(Audio LLM)」
- v5.5の「オリジナルモデル」はざっくり言うと「あなた専用の“スタイル圧縮プロファイル”」
- (1)指定した曲(または生成履歴) (2)プロンプト傾向 (3)スタイルの癖 を元に、ベースモデルに“追加条件”として埋め込まれる
- フルの再学習ではなく、軽量ファインチューニング or スタイル埋め込み(embedding) である
- 通常 : [プロンプト] → 汎用モデル → 曲
- v5.5 : [プロンプト + 独自スタイル埋め込み] → 汎用モデル → 曲
- 「癖」(コード進行の傾向、音色の選び、展開のクセ)が固定される、毎回ブレにくくなる
- 通常はプロンプト次第で大きく変動するが、オリジナルモデルでは「何も書かなくても“それっぽくなる”」
- 一種の「疑似アーティスト化」 : あなたの“作風”をモデル側に持たせる
- 本当の意味での「学習モデル」ではない (GPTのフルfine-tuneのようなものではない、学習データが増え続けるわけではない)
- あくまで「スタイルバイアスを付ける」仕組み
- 元モデルの制約は残る : 音質の上限、長さ制限、構造パターン - これらはv5.5本体に依存
- Sunoは本質的に「確率的に次の音を選ぶモデル」なので、オリジナルモデルは「その確率分布を“あなた寄りに歪めた」もの
- 通常:P(音 | 条件)なのに対してオリジナルモデル:P(音 | 条件 + あなたのスタイル) → 分布が偏る
- 直感的なたとえ : 通常モデル=「万能作曲家」、オリジナルモデル=「あなたの癖を覚えた作曲家」
- 実務的なメリット : 同じシリーズのBGMが作りやすい、ゲーム・映像で統一感が出る、“ブランド音”が作れる
- 実務的な注意点 : 偏りすぎる(同じような曲ばかりになる)、劣化することがある(元データが弱いとモデルも弱い)、過学習っぽくなる(特定パターンの繰り返し)
- sunoの過学習っぽくなるパターン : 同じコード進行に収束する、展開(A→B→サビ)が固定化、音色やミックスの傾向がワンパターン化
- モデルを調整しているつもりが自分の“作風の抽出・強調”をしていることになる
- 「モデルがあなたに寄る」=「あなたがモデルに寄る」
実際には、sunoのcreate画面では「Song Description」の欄に何も入れないと薄い灰色で「Poetic drum and bass song about a fame identity crisis」とか表示されていたので(もしかするとこれは過去の僕のプロンプトの影響かも)、ここにリターン入力(改行)して明らかに「Song Description」欄が空白になった状態でcreateした。 今回はv2からv5.5までの全て、そしてオリジナルのnagasm3とnagasm5とnagasm6の計12種類のモデルということになったので、再録になるが以下に昇順に整理して、さらに間違いを避けるために固有の実験番号(最終的にはこれがmp3ファイル名の一部)を付けてみた。
- v2 - vintage - "model01"
- v3 - older - "model02"
- v3.5 - Basic song structure - "model03"
- v4 Pro - Improved sound quality - "model04"
- v4.5-all - Best Free model - "model05"
- v4.5 Pro - Intelligent prompts - "model06"
- v4.5+ Pro - Advanced creation methods - "model07"
- v5 Pro - Authentic vocals, superior quality and comtrol - "model08"
- v5.5 Pro - Powers Voices, Custom Models and My Taste - "model09"
- nagasm3(オリジナル : デスメタル10曲) - "model10"
- nagasm5(オリジナル : ノイズ系) - "model11"
- nagasm6(オリジナル : chaos piano) - "model12"
●本日のsuno生成音楽(2026.04.04)●
タイトル : Glitch in the Wires
使用したモデル : v2 - vintage
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Minimalist alt-pop, dry male vocals up close, Sparse pulse of muted synth and soft kick, then a wide, shimmery chorus with stacked harmonies and a distant, detuned piano loop, Bridge pulls everything back to near-silence before a final, clipped chorus that cuts off on the last word
Result : Glitch in the Wires 1 - Glitch in the Wires 2
duration : 1min20sec, 1min20sec上が初期バージョンsuno v2の「何も与えない」というプロンプトで作られた音楽である。 音楽としては全く破綻していないものの、どちらも全体に単調で、1分20秒も聞かずに飽きてしまう音楽となっていた。 ちなみにこのタイトルは同一のものが後で出てきたが、「1/2」というのがこちらである。
●本日のsuno生成音楽(2026.04.04)●
タイトル : Loading Bars & Love Notes
使用したモデル : v3 - older
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Warm indie-pop band feel, male vocals; softly swung drums, round bass, chiming clean guitars, Verses stay intimate and close-mic’d with gentle electric piano pads; chorus blooms with doubled vocals, tambourine, and bright harmonies, Subtle synth swells in the bridge, then a stripped final hook for a tender, bittersweet fade
Result : Loading Bars & Love Notes 1 - Loading Bars & Love Notes 2
duration : 2min00sec, 2min00sec上が次のバージョンsuno v3の「何も与えない」というプロンプトで作られた音楽である。 指定として「Instruments」(ボーカル無し)としているにも関わらず、1曲目はいきなりコーラスから入り、しっかりと歌詞のあるボーカルがあるという「馬鹿野郎」versionとなった。 2曲目はハイテンポの何ということのない金太郎飴ソングという感じで、これでは確かに金は取れないだろう。
●本日のsuno生成音楽(2026.04.04)●
タイトル : Blank Page, Warm Heart
使用したモデル : v3.5 - Basic song structure
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Gentle indie-folk bed with nylon guitar and soft piano; male vocals close to the mic, almost whispered, Subtle brushed snare entering on the first chorus, then a light swell of pad and wordless backing harmonies in the bridge to lift the emotion before returning to a stripped-down, intimate ending
Result : Blank Page, Warm Heart 1 - Blank Page, Warm Heart 2
duration : 1min19sec, 1min20sec上がsuno v3.5の「何も与えない」というプロンプトで作られた音楽である。 一応「Basic song structure」に対応したモデルということで、これまでの単調な構成に対して、1曲目はちょっとサビ?みたいな変化が加わっている。 2曲目ではイントロがあり、メロディー担当の楽器が入ってきて、しかしサビほどの展開は無い。 ギターとかピアノの聞き慣れたサウンドも、ちょっと人間っぽくなってきたかもしれない。
●本日のsuno生成音楽(2026.04.04)●
タイトル : Ghost in the Hook
使用したモデル : v4 Pro - Improved sound quality
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Bouncy electro-pop with crisp drums, rubbery bass, and bright synth plucks, Male vocals sit upfront, dry in verses with close, intimate tone; chorus blooms with stacked harmonies, side-chained pads, and a simple, catchy top-line, Short form, high replay value, perfect for looping a 2-minute single
Result : Ghost in the Hook 1 - Ghost in the Hook 2
duration : 1min54sec, 2min22sec上がsuno v4 Proの「何も与えない」というプロンプトで作られた音楽である。 v4.0で初めてサブスク(有料)としたので、上のv3.5に比べて画期的な「差」が必要となってくる。 「Improved sound quality」というように、エフェクタ類も充実して、楽器音も「Bouncy electro-pop」という感じになっている。 2曲目あたりは、まずまずBGMとしてのレベルにあるかもしれないが、全体の構成としては、サビも甘いし、まだまだ単調というところだろうか。
●本日のsuno生成音楽(2026.04.04)●
タイトル : Binary Heartbeat
使用したモデル : v4.5-all - Best Free model
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Glitchy electro-pop, bright synth arps and pulsing sidechain pads, Female vocals, close and intimate in the verses, then widening with airy harmonies in the chorus, Clean, bouncy kick and snappy clap carry a danceable mid-tempo groove, Subtle vocoder doubles on key hook lines, with a brief filtered breakdown before the final chorus for a lift
Result : Binary Heartbeat 1 - Binary Heartbeat 2
duration : 3min28sec, 3min23sec上がsuno v4.5-allの「何も与えない」というプロンプトで作られた音楽である。 これが現状、無料ユーザ(Basic Plan)に対応したversionであり、無料ユーザはこれ以外のモデルを選択することも出来ない。 流石にdurationも長くなってきて、言わば「実用レベル」(BGMとかで使えそう、ただし実際には使えない)という事だろう。 「生成音楽論」を受講する学生も、このモデルを使うことになるのだ。 個々のサウンドも、全体の構成も、色々なエフェクトも、確かに納得のレベルに進化しているのがわかる。 このレベルを無料で使えて、およそ10曲を毎日毎日作って遊べるのであれば、なかなか素晴らしいことなのだ。
●本日のsuno生成音楽(2026.04.04)●
タイトル : Empty Page, New Song
使用したモデル : v4.5 Pro - Intelligent prompts
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Intimate acoustic pop; close-mic male vocals over soft fingerpicked guitar, Gentle build with subtle piano and brushed snare entering at the first chorus, harmony stack on the hook, ending on a stripped single-voice reprise
Result : Empty Page, New Song 1 - Empty Page, New Song 2
duration : 2min51sec, 3min41sec上がsuno v4.5 Proの「何も与えない」というプロンプトで作られた音楽である。 同じv4.5-allが無料なので、差別化はなかなかの「壁」だが、ここではアコースティックなテイストでアピールしているようである。 空白プロンプトに対して、「Intimate acoustic pop」という提案をしてくれている。 どうしても無料の方は電気でテクノっぽいので、こちらはヒューマンな味で攻めている、という事だろうか。
●本日のsuno生成音楽(2026.04.04)●
タイトル : Glitch in the Wires
使用したモデル : v4.5+ Pro - Advanced creation methods
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Minimal, glassy electropop with male vocals; soft pulsing synth bass and ticking percussion under a close, intimate lead, Verses stay hushed and dry, pre-chorus adds airy pads and subtle vocal doubles, Chorus blooms with wide stereo keys, bright top-line hook, and a subtle sidechain swell that makes it gently bounce, Short form, looping vibe perfect for a tight 2-minute track
Result : Glitch in the Wires 3 - Glitch in the Wires 4
duration : 2min49sec, 3min10sec上がsuno v4.5+ Proの「何も与えない」というプロンプトで作られた音楽である。 version 4.5は最初のProと、無料ベストと、このプラスと3つもあるので、なかなか差別化が難しそうだが、「Advanced creation methods」とのことである。 なんとタイトルがv2と同じだったので、こちらはリンクにあるタイトルを「3/4」としている。 ミニマルっぽいものの、次第に盛り上がっていくあたり、これが「Advanced creation methods」というものなのだろうか。 確かにサビというよりも、最後のエンディングに向かって、ちょっと盛り上がりを工夫している感じがある
●本日のsuno生成音楽(2026.04.04)●
タイトル : Blank Space between Beats
使用したモデル : v5 Pro - Authentic vocals, superior quality and comtrol
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Warm bedroom pop with male vocals; gentle swung drums and soft fingerpicked guitar under close-up, conversational verses, Choruses bloom with simple synth pads, layered humming, and a slightly wider stereo field, Intimate, almost whispered delivery that leans into pauses and negative space, like thoughts spilling out between metronome clicks
Result : Blank Space between Beats 1 - Blank Space between Beats 2
duration : 1min54sec, 2min21sec上がsuno v5の「何も与えない」というプロンプトで作られた音楽である。 3種類にもなったv4.5から大きくv5へとメジャーバージョンアップとなっているので、ここは違いが無ければいけない。 最新のv5.5はまだBETAなので、現状はこれが有料versionの最上位なのだ。 ただし今回の実験では「Instruments」指定のために、売りであるらしい「Authentic vocals」は確認できない。 ちょっとした楽器演奏ノイズだったり、ショートブレイクだったり(1曲目のラスト前とか)、あちこちに確かに進歩を感じるのだが、まぁ、このあたりからはいよいよsunoの進化スピードも漸減していくのかもしれない。 プロミュージシャンであれば、これを活用して「お仕事」できるレベルには到達しているようだ。
●本日のsuno生成音楽(2026.04.04)●
タイトル : Glitch in the Chatbox
使用したモデル : v5.5 Pro - Powers Voices, Custom Models and My Taste
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Playful electro-pop with a rubbery synth bass and crisp finger-snap groove; verses stay tight and talky, choruses bloom with stacked vocoder harmonies and bright plucks, Light sidechain pulse keeps it bouncing, quick ear-candy fills between lines, Male or female vocals lean conversational, with a sly wink in the delivery
Result : Glitch in the Chatbox 1 - Glitch in the Chatbox 2
duration : 2min14sec, 2min47sec上がsuno v5.5の「何も与えない」というプロンプトで作られた音楽である。 createして気付いたのは、これまでに比べて音楽を生成するための時間がハッキリと長くなったことで、モデルの深さが格段に大きくなっている気がした。 売りの前半「Powers Voices」は「Instruments」指定で封じられている筈なのに、2曲とも擬似音声(voice, chorus, inst)が入ってくるあたりは、流石のsunoクンである。 売りの後半「Custom Models and My Taste」は、この後の3つのオリジナルモデルに関するものだ。 ただ、こういうボコーダ音声とかボカロ的な音声というのは、まぁ常に同じ表情なので「飽き」に繋がるので、ちょっと難しいところもありそうだ。 1曲目を聞いて「なかなか」と思っても、続けて2曲目を聞いてみれば「またか」となってしまう。
●本日のsuno生成音楽(2026.04.04)●
タイトル : Glitch in the Chat
使用したモデル : nagasm3(オリジナル : デスメタル10曲)
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Playful electro-pop with crisp synth plucks and a bouncy mid-tempo groove; male vocals with stacked, tight harmonies on the hook, Verses stay minimal with dry drums and a rubbery bass; chorus widens with bright pads and vocoder doubles, Light FX sweeps between sections for a techy sheen, mix leans forward on the lead vocal for clarity and charm
Result : Glitch in the Chat 1 - Glitch in the Chat 2
duration : 2min12sec, 2min37sec上がsuno v5.5の「オリジナルモデル作成」機能(100クレジット消費)によって作成したnagasm3(オリジナル : デスメタル10曲)モデルによる、「何も与えない」というプロンプトで作られた音楽である。 再録すると、モデルを作るためにアップロードした10曲は、デスメタルであの5人に「死ね!」と歌った ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ であり、suno v5で作ったものである。 これ(sunoで作った曲をsunoのモデル生成に使う)を繰り返すと過学習のリスクもあるのだが、これまで使った例でも、十分に曲中にあのデスメタル特有の低音叫び声が出てきたりして、なかなか有効な予感がある。 実際、この2曲でもそれは登場したし、空白プロンプトでこれだけ違う曲が生成される、というのは、大きな収穫となった。 冒頭だけは軽くスタートしたものの、ちゃんと次第に音楽がデスメタル臭に溢れてくれて、最後は完全にオリジナルとなったのである。 この2曲は迷うことなくPubishした。
●本日のsuno生成音楽(2026.04.04)●
タイトル : Glitch in the Chat
使用したモデル : nagasm5(オリジナル : ノイズ系)
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Minimalist electro-pop bed, soft pulsing synths and dry snaps; female vocals, intimate and playful, Verses almost spoken, close-mic and whispery; chorus blooms with bright pads and doubled topline, Subtle vocoder harmonies on key phrases, short filtered break before final hook
Result : Glitch in the Chat 3 - Glitch in the Chat 4
duration : 0min36sec, 0min50sec上がsuno v5.5の「オリジナルモデル作成」機能(100クレジット消費)によって作成したnagasm5(オリジナル : ノイズ系)モデルによる、「何も与えない」というプロンプトで作られた音楽である。 なんとタイトルが「デスメタル臭」と同じだったので、こちらはリンクにあるタイトルを「3/4」としている。 再録すると、「破壊音・機械音・爆発音・無線機ノイズ」など適当にミックス/フェード処理して、計6本のmp3ファイル ★ ★ ★ ★ ★ ★ をアップロードして、suno v5で作ったモデルである。 ある意味でそれぞれノイズの種類が異なるので、全部ミックスすると均一化されてしまう懸念がある。 こちらは何故か短い2曲となったが、まぁ「多少ノイズのテイストもあり」とは言えそうな程度だった。
●本日のsuno生成音楽(2026.04.04)●
タイトル : Error 404: Feelings Not Found
使用したモデル : nagasm6(オリジナル : chaos piano)
与えたPrompt : 無し(敢えて空白)
出てきたPrompt : Playful electro-pop with a glitchy, bouncy groove and female vocals, Tight side-chained synths, bubbly arps, and a rubbery bass line, Verses stay clipped and talky; chorus widens with stacked harmonies and bright, stuttering vocal chops, Short bridge strips to claps and a single pad before a final hooky reprise
Result : Error 404: Feelings Not Found 1 - Error 404: Feelings Not Found 2
duration : 7min59sec, 2min06sec上がsuno v5.5の「オリジナルモデル作成」機能(100クレジット消費)によって作成したnagasm6(オリジナル : chaos piano)モデルによる、「何も与えない」というプロンプトで作られた音楽である。 再録すると、「カオスの淵」プログラムによって作った1分/2分のサウンドファイル ★ ★ を6分割して、それぞれ30秒のサウンドファイル ★ ★ ★ ★ ★ ★ を作ってアップロードして、suno v5で作ったモデルである。 いずれも擬似音声で謎の歌詞付きボーカルが入っているのだが、明らかにそこかしこに、あのカオスのフレーズが登場して、これまたユニークなモデルとなっている。 1曲目の方はcreateの状態でグルグルがいつまで経っても終わらず、これはもしかしてsunoがバグッたか・・・と思ったのだが、生成されたdurationはなんと7分59秒と、これまでで最長だった。 しかし聞いてみると、なんと1'16"から突然無音になって(無音になる仕方はとても自然)、4'49"で突然に再開して(再開する仕方はとても自然)、ラストの終わり方はもろ唐突で、まさにsunoクンはここで暴走しかけて(深く深く考えて)いたのでは?と思われる見事な「Error 404」なのだ。 途中の3分半の無音期間を詰めてしまっては駄目なので、「sunoに憑依したジョン・ケージ」として尊重しておこう。 この2曲も迷うことなくPubishした。
2026年4月5日(日)
宿題の「Arduino + 256LEDパネル + PAWセンサ」のアイデア構想も僅かに進んでいるのだが、昨日のsuno実験に関して、どうもこれはキチンと整理しておきたい(まだいくつかの抜けがある)・・・という事実が明確になってきた。 明日からまた月火は柏なのだが、今日(全国的に好天で最後の花見日和)はこちらに集中する、と決めた。 昨日はsunoに集中して忘れていたので、いつもの「Martinを愛でる」routineも今日である。
sunoモデル 空白prompt 「戦争」prompt 「平和」prompt v2 ◎ v3 ◎ v3.5 ◎ v4 Pro ◎ v4.5-all ◎ v4.5 Pro ◎ v4.5+ Pro ◎ v5 Pro ◎ v5.5 Pro ◎ nagasm3 ◎ nagasm5 ◎ nagasm6 ◎ 今日、最終的に完成させたいのは、上のテーブルである。 とりあえずTABLEタグの思い出しと、昨日は間違いなく左から2列目の「空白prompt」を実験したので「◎」として、残りのセルは空白となっている。 まずはこのテーブルで既に実験したものを確認して埋めて、v5.5など実験していなかったものを追加して、完成させたいのである。
![]()
ちなみにテーブルも全て、上のようにHTMLで直接、タイピングしている(テキストエディタは愛用の「Jedit X」)。 作業メモを兼ねて、このテーブルがコピペで何度も登場して、追補されて少しずつ完成に近付いていく様子が今日の日記となる。 まずは昨日の日記から発掘して、「◎」のところを全て埋めてみたのが以下である。
sunoモデル 空白prompt 「戦争」prompt 「平和」prompt v2 (vintage) "Glitch in the Wires"
1min20sec
1min20secv3 (older) "Loading Bars & Love Notes"
2min00sec
2min00secv3.5
(Basic song structure)"Blank Page, Warm Heart"
1min19sec
1min20secv4 Pro
(Improved sound quality)"Ghost in the Hook"
1min54sec
2min22secv4.5-all
無料(Best Free model)"Binary Heartbeat"
3min28sec
3min23secv4.5 Pro
(Intelligent prompts)"Empty Page, New Song"
2min51sec
3min41secv4.5+ Pro
(Advanced creation methods)"Glitch in the Wires"
2min49sec
3min10secv5 Pro
(Authentic vocals, superior quality and comtrol)"Blank Space between Beats"
1min54sec
2min21secv5.5 Pro
(Powers Voices, Custom Models and My Taste)"Glitch in the Chatbox"
2min14sec
2min47secnagasm3 (デスメタル臭) "Glitch in the Chat"
2min12sec
2min37secnagasm5 (ノイズ系) "Glitch in the Chat"
0min36sec
0min50secnagasm6 (chaos Piano) "Error 404: Feelings Not Found"
7min59sec
2min06secテーブルに色を付けるのは最後にとっておくとして、ここまではサクサクと進んだが、ここからはいよいよ面倒な作業になる。 なんせ僕の日記は日々、実験とか試行錯誤をするのをそのまま書き付けているので、コピペの前にまず「発掘」が必要であり、さらにそこでHTMLの「バグ」を発見して、遡って修正する必要もあるのだ。 実際、上の表を埋めていく段階で、日記の元の部分にコピペのミスを発見して修正したりした。
まずは確認のために、「戦争」プロンプト、「平和」プロンプト、と僕が名付けて共通に使ってきたpromptを上に再録して、編集作業に取り掛かった。 以下は、「たぶんここまでは日記に書いていただろう」というのを発掘して埋めてみたものだが、ここに至るには午前から午後まで、かなりの時間がかかった。
- 「戦争」prompt : noise, shout, break, bomb, explosion, violence, crazy, ecstasy, hell, space, distortion, powerful, very slow tempo, deeply, chaos, eccentric, duration is 5 minutes, earthquake, madman, witch, underground, growl
- 「平和」prompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
sunoモデル 空白prompt 「戦争」prompt 「平和」prompt v2 (vintage) "Glitch in the Wires"
1min20sec
1min20sec"Red Sirens Over Grey Skies"
1min20sec
1min20secv3 (older) "Loading Bars & Love Notes"
2min00sec
2min00sec"Red Sky Sirens"
2min00sec
2min00secv3.5
(Basic song structure)"Blank Page, Warm Heart"
1min19sec
1min20sec"Cracks in the Siren Sky"
3min22sec
2min45secv4 Pro
(Improved sound quality)"Ghost in the Hook"
1min54sec
2min22sec"Cracks In The Sky"
1min16sec
2min09secv4.5-all
無料(Best Free model)"Binary Heartbeat"
3min28sec
3min23sec"Frozen Sirens"
3min26sec
5min11secv4.5 Pro
(Intelligent prompts)"Empty Page, New Song"
2min51sec
3min41sec"Cracks in the Silence"
2min34sec
3min49secv4.5+ Pro
(Advanced creation methods)"Glitch in the Wires"
2min49sec
3min10sec"Red Sky Sirens"
3min22sec
2min54secv5 Pro
(Authentic vocals, superior quality and comtrol)"Blank Space between Beats"
1min54sec
2min21sec"Cracks in the Silence"
2min26sec
3min29sec"Hope in the Quiet Rain"
2min54sec
3min24secv5.5 Pro
(Powers Voices, Custom Models and My Taste)"Glitch in the Chatbox"
2min14sec
2min47secnagasm3 (デスメタル臭) "Glitch in the Chat"
2min12sec
2min37sec"Hope In Your Hands"
1min52sec
2min58secnagasm5 (ノイズ系) "Glitch in the Chat"
0min36sec
0min50sec"Red Siren Sky"
2min27sec
2min37sec"Romantic Echoes"
2min29sec
2min59secnagasm6 (chaos Piano) "Error 404: Feelings Not Found"
7min59sec
2min06sec"Blood in the Static"
2min33sec
2min55sec"Romantic Dawn Over the Lake"
3min04sec
3min13secそして上のように「発掘→穴埋め」という作業が終わって、まだsunoでcreateしていないのが、「戦争」プロンブトでのv5.5とnagasm3(デスメタル臭)の2つ、そして「平和」プロンブトでの8つ、の合計10パターン(20曲)である、と判明した。 ここからの作業は、また新MacBookAirを出してきてsunoにアクセスして・・・という手順になるが、まだMartinを弾いていなかったので、ここで一旦、以下のような状態で中断した。
![]()
そしてMartinを愛でる至福の時間を経て、再び作業を開始した。 まずは残っていた「v5.5 Pro」と「nagasm3(デスメタル臭)」での「戦争」プロンプトである。 日曜日だからsunoへのアクセスが多いためか?と思われる程、時間がかかったのだが、以下の「v5.5 Pro」では2曲とも7min59secという長さであり、途中の空白も無くてミッチリとデスメタル風のテイストが詰まっていた。
●本日のsuno生成音楽(2026.04.05)●
タイトル : Subterranean Detonation
使用したモデル : v5.5 Pro
与えたPrompt : noise, shout, break, bomb, explosion, violence, crazy, ecstasy, hell, space, distortion, powerful, very slow tempo, deeply, chaos, eccentric, duration is 5 minutes, earthquake, madman, witch, underground, growl
出てきたPrompt : Crushing sludge-metal at glacial tempo, drop-tuned guitars drenched in fuzz, subby bass, and cavernous drums, Male vocals shifting between guttural growls and deranged spoken snarls; chorus opens into layered, dissonant screams behind the lead, Feedback swells and bit-crushed noise smear the edges, with a slow-blooming distortion wall in the outro like a collapsing tunnel, noise, slow
Result : Subterranean Detonation 1 - Subterranean Detonation 2そして以下が本命デスメタルの「nagasm3(デスメタル臭)」での「戦争」プロンプトである。 タイトルが過去に作った曲(このWebには紹介していないのだが、sunoのマシンでは失敗作まで全てをbackupしている)とカブッたので「3/4」としている。 durationは7min38sec, 3min29secとだいぶ異なったものの、いずれも期待したようなテイストに溢れていた。 これぞ「戦争反対」のシュプレヒコールである。
●本日のsuno生成音楽(2026.04.05)●
タイトル : Underground Earthquake Gospel
使用したモデル : nagasm3(デスメタル臭)
与えたPrompt : noise, shout, break, bomb, explosion, violence, crazy, ecstasy, hell, space, distortion, powerful, very slow tempo, deeply, chaos, eccentric, duration is 5 minutes, earthquake, madman, witch, underground, growl
出てきたPrompt : Crushing sludge-metal at glacial tempo, drop-tuned guitars drenched in fuzz, subby bass, and cavernous drums, Male vocals shifting between guttural growls and deranged spoken snarls; chorus opens into layered, dissonant screams behind the lead, Feedback swells and bit-crushed noise smear the edges, with a slow-blooming distortion wall in the outro like a collapsing tunnel, noise, slow
Result : Underground Earthquake Gospel 3 - Underground Earthquake Gospel 4ここからは「平和」プロンプトの「落穂拾い」なので、あまり前向きにはならない。 なんせ、sunoの「聞きやすい曲」・「正統的な曲」という指向性からして、あまり面白くない平凡で綺麗な曲が出てくることが容易に想像できるからなのだ(実際その通りだった)。 さらに作業の途中で、「平和」プロンブトの単語列の中にバグがあった(peaceでなくてpieceとミスタイプ)事に気付いたのだが、まぁ全体としては影響ない、と判断して、表面的に記述だけ訂正する虚偽記載を避けて、実験のまま正しく放置することにした。 生成AIが「romantic, happy feeling」に続く「hope Piece」を、なんだ「hope peace」の間違いじゃん、と理解・解釈してくれているかどうかは微妙・不明である。
以下は「v2 (vintage)」モデルの2曲であり、durationは0min22sec, 0min40secと超短かった。 ピアノの音も割れていて、子供がピアノを適当に遊んで弾いているような感じで全体としてまだ「クラシック風」にもなっておらず、言わば「曲 未満」だった。
●本日のsuno生成音楽(2026.04.05)●
タイトル : Hope in the Garden
使用したモデル : v2 (vintage)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Romantic neoclassical chamber piece, 5-minute arc built around solo piano and warm string quartet; begins with tender, simple piano motif, gradually joined by lyrical violin and cello lines, Middle section swells with rich harmonies and brighter dynamics, hinting at joy through tears, then returns to an intimate, glowing reprise of the main theme with gentle rubato and soft cadences, classic, happy, vocal, slow, sad, romantic
Result : Hope in the Garden 1 - Hope in the Garden 2以下は「v3 (older)」モデルの2曲であり、durationはいずれも2min00sec、とまだまだv2と似てイマイチのレベルであると聞く前からわかった。 まだまだ音質も悪いピアノであるものの、v2よりは「音楽」として、しっかりまともに進化している。 特に2曲目については、その後のPOPS方面への可能性を見ることもできそうだ。
●本日のsuno生成音楽(2026.04.05)●
タイトル : Romantic Echoes in Spring
使用したモデル : v3 (older)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Lush neoclassical chamber ballad for solo piano and small string ensemble; slow rubato tempo around 60-65 BPM, Piano leads with tender arpeggios and a clear main theme, strings entering softly to warm the harmony, Middle section darkens with minor-key colors and suspended chords, then gradually resolves into a hopeful, luminous restatement, Gentle dynamic swells and long reverb tail for a spacious, cinematic feel, slow, classic, romantic, sad, happy, vocal
Result : Romantic Echoes in Spring 1 - Romantic Echoes in Spring 2以下は「v3.5 (Basic song structure)」モデルの2曲であり、durationは4min00sec, 2min56secとようやく本格的になってきた。 売りの「Basic song structure」は、いきなりクラシックの超絶技巧曲みたいにスタートして、その後に静かになったりまた劇的になったり・・・という演出で十分にアピールしている。
●本日のsuno生成音楽(2026.04.05)●
タイトル : Romantic Echoes of Hope
使用したモデル : v3.5 (Basic song structure)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Tender neoclassical chamber piece, 5-minute arc: solo piano leads with a gentle, unhurried motif; warm strings (violin and cello) bloom in the middle, then recede back to intimate piano, Harmony moves between soft major colors and wistful suspensions, with a luminous, hopeful resolution in the final cadence, happy, romantic, slow, sad, vocal, classic
Result : Romantic Echoes of Hope 1 - Romantic Echoes of Hope 2以下は「v4 Pro (Improved sound quality)」モデルの2曲であり、durationは2min12sec,4min00secである。 売りの「Improved sound quality」は、なかなか難しいピアノの音響(ペダルや残響まで含めて)のクオリティとしてちゃんと進歩を感じられた。 このレベルをさらに上げたv4.5-allが現在の「無料version」なのだから、sunoが他の音楽生成AIを圧倒しているのもわかる。
●本日のsuno生成音楽(2026.04.05)●
タイトル : Romantic Hopeful Nocturne
使用したモデル : v4 Pro (Improved sound quality)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Tender neoclassical ballad for solo piano with soft, lingering chords and a gentle rubato feel, Melody begins sparse and intimate, gradually adding arpeggiated movement and richer voicings for emotional build, Middle section leans into bittersweet modulations, then returns to a warm, reassuring theme, Occasional delicate high-register motifs glimmer over sustained left-hand harmony, ending on a quiet, resolved cadence, vocal, happy, classic, sad, romantic, slow
Result : Romantic Hopeful Nocturne 1 - Romantic Hopeful Nocturne 2以下は「v4.5-all 無料(Best Free model)」モデルの2曲であり、durationは4min18sec, 3min24secである。 タイトルが被っているので「3/4」となっている。 ここにきて「Gentle neoclassical chamber piece」ということで、BGMとしても使えそうな「ピアノ+バイオリン」に進化している。 アンサンブルが広がって、まだ音質的には不満もあるが、そういう人はProに課金してね・・・という事なのだ。
●本日のsuno生成音楽(2026.04.05)●
タイトル : Romantic Echoes
使用したモデル : v4.5-all 無料(Best Free model)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Gentle neoclassical chamber piece for solo piano and soft string quartet; tender, singing right-hand piano over warm legato strings, Starts sparse and intimate, gradually unfolding into fuller chords and lyrical countermelodies, Middle section leans into bittersweet tension with subtle suspensions, then resolves into a hopeful, glowing final reprise with lingering, echoing cadence, slow, vocal, classic, romantic, sad, happy
Result : Romantic Echoes 3 - Romantic Echoes 4以下は「v4.5 Pro (Intelligent prompts)」モデルの2曲であり、durationは3min19sec, 2min53secである。 「v4.5-all」が無料のBasic Planでそこそこ十分なクオリティであるとすれば、そこから「Pro」と名乗るためには相当のステップアップが必要であり、sunoはここに「Intelligent prompts」という発展を主張したようである。 「ピアノ+バイオリン」から「ピアノ+ストリングス」へと進化すると共に、サウンドの品質も向上していて、これは流石にPro Planだろう・・・と納得させるレベルだと言えそうだ。
●本日のsuno生成音楽(2026.04.05)●
タイトル : Romantic Echoes in C
使用したモデル : v4.5 Pro (Intelligent prompts)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Tender orchestral ballad for solo piano and small string ensemble; slow rubato tempo, warm grand piano leading with expressive right-hand melodies over gentle arpeggiated left-hand chords, Strings swell in and out like breathing, adding bittersweet harmonies, Dynamic arc grows from intimate, almost whispered phrases to a luminous middle peak, then settles into a quiet, hopeful resolution with soft sustained strings and lingering piano voicings, slow, classic, romantic, vocal, sad, happy
Result : Romantic Echoes in C 1 - Romantic Echoes in C 2以下は「v4.5+ Pro (Advanced creation methods)」モデルの2曲であり、durationは3min04sec, 3min09secである。 v4.5の「ピアノ+ストリングス」から「ピアノ+ストリングス+管楽器」のような展開まで加えたのが「+」らしいが、要するに「4.5 Pro」にした人はそのまま「4.5+」まで使っていけるので、この差分で無料ユーザをどれだけ引き付けたのか、なかなか微妙かもしれない。
●本日のsuno生成音楽(2026.04.05)●
タイトル : Romantic Rememberings
使用したモデル : v4.5+ Pro (Advanced creation methods)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Tender neoclassical ensemble; solo piano leads with gentle arpeggios and spacious rubato, joined by soft strings and warm woodwinds, Piece blooms from intimate, almost fragile motifs into lush, hopeful harmonies, then returns to a quiet, lingering coda, Dynamic arc: slow, reflective opening; blossoming middle section; bittersweet yet uplifting finale, perfect for a five-minute narrative journey, classic, romantic, happy, vocal, slow, sad
Result : Romantic Rememberings 1 - Romantic Rememberings 2「v5」は既に作っていたので、以下が最新の「v5.5 Pro (Powers Voices, Custom Models and My Taste)」モデルの2曲であり、durationは2min53sec, 3min08secである。 流石にマイナーversion upでなくメジャーversion upということで、オーケストラの奥行きやリバーブの深さなど、まさに十分にこれだけで満足できるレベルになっている。 ここでは売りである「Powers Voices」(ボーカルのクオリティ)を封印した実験なのだが、それでもレベルアップは実感できた、
●本日のsuno生成音楽(2026.04.05)●
タイトル : Romantic Twilight Reverie
使用したモデル : v5.5 Pro (Powers Voices, Custom Models and My Taste)
与えたPrompt : Slow ballade, like classic music, no voice/vocal, romantic, happy feeling, something sad, hope piece, duration is 5minutes
出てきたPrompt : Tender orchestral ballad for strings, piano, and subtle woodwinds; slow rubato tempo with lyrical piano leading, warm legato strings supporting, and occasional solo violin answering the melody, Piece unfolds in three emotional waves: gentle, nostalgic opening; a more hopeful, expansive middle with fuller strings and harp arpeggios; then a soft, bittersweet resolution that leaves a lingering sense of warmth and quiet longing, happy, romantic, slow, sad, vocal, classic
Result : Romantic Twilight Reverie 1 - Romantic Twilight Reverie 2ここまで作業して夕方になり、ようやくTABLEの全ての項目が埋まった筈なので、さらにコピペ作業を繰り返して、遂に以下のような「比較表」が完成した。 これは、「生成音楽論」の資料としてなかなか面白いものなので、上手く演出(使い回し)して講義資料として活用することにしたい。
HTMLソースにも、目立つようにこのテーブルの上下に注釈行として「■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■」というのを入れてあり、後に教材としてこのHTMLを複製して前後を切り取った教材ページを作ることになる。 もちろん、再度、3種類のプロンプトをきちんと列記して、さらに3つのオリジナルモデルについても、それぞれのメイキングを追記することになるだろう。 いまそれをやっても、おそらくまだバグが残っているので、しばらくはこの日記の中のTABLEを参照して、バグが取れてからの作業となるのだが、いやー、なかなか面白い実験となった。
2026年4月7日(火)
柏の2日目の午前、柏駅西口にある「カラオケBanBan」の室内でこれを書いている。 昨日の月曜日は、浜松から東京までの「こだま」車内で、上の「suno比較実験結果」の各セルに対して、sunoが勝手に付けたタイトル部分をクリックすると別ウインドウが開いて、sunoから返ってきたPromptが表示される・・・という機能を追加した。 久しぶりのJavascriptだったが、過去に このページ に使っていたものをそのまま流用した。
そして勢いで、TABLE部分だけを抜き出して、教材用に こんなページ まで作ってしまった。 今日はまた母親の顔を見に行くまでの時間、過去の日記から資料を発掘して、TABLEの下の部分、「オリジナルモデル「nagasm3 (デスメタル臭)」の作り方」・「オリジナルモデル「nagasm5 (ノイズ系)」の作り方」・「オリジナルモデル「nagasm6 (chaos Piano)」の作り方」を追記する、というお仕事に没頭した。 なんせ昨夜、柏駅東口のBigEchoで4時間39曲を絶唱しているので、ここでは何も歌わなくていいのだ。2026年4月8日(水)
昨日の柏からの帰途の新幹線は、「静岡〜新富士間で人が線路に立ち入った」という遅延のために、熱海駅で46分ほど待たされた。 走っていない新幹線の車内が静かなことに気付いて、イアホンを付けて、午前に作ったばかりの このページ のそれぞれのセルmp3を視聴してみたが、そのお陰で2つほどHTMLにバグを発見して修正できたので、この待ち時間は有効なものとなった。
![]()
今朝は目覚めた直後の朦朧とした頭に、ずっと作りかけで懸案だった「Arduino+256LEDパネル+PAWセンサ」のアイデアがフト浮かんできたので、今日はこのプログラミングに没頭しよう・・・と思っていたら、なんと今日と明日は名人戦第1局だった。 振り駒の結果、糸谷八段の先手となったが、なんと初手が1六歩、さらに次の手が1五歩、という驚くべき展開となった。 今日は終日、このAbemaTVはBGMとしてサブウインドウに開きつつ過ごすことになりそうだ。
そして午後までかかって、遂に朝に閃いたアイデアをArduinoスケッチとして実装することに成功した。 とりあえずしばらくは、このシステムはこんな感じにしておこう、という気がした。 ちなみに今回、台座としたカードは NIME2009 に参加するために行った、ピッツバーグのカーネギーメロン大学(CMU)のゲストカードである。 注意しないとPAWセンサに過度な力を入れてしまいそうなのだが、ゲームとしては「消しモノ」となった。 まずまずの難易度で、たまに消したセルが復活するので、目がLEDの輝度にやられなければ結構続きそうなのだが、まぁ目が疲れるのが先になりそうだ。#include <Adafruit_NeoPixel.h> Adafruit_NeoPixel pixels(256,6,NEO_GRB + NEO_KHZ800); int rgb[3], timing[3], paw[4], mode=0, paw_mode=0, PAW_point; int pattern[256], color_mode=0; int musicScale[] = {523,587,659,698,784,880,988,1047}; float para[5] = {0.9, 0.6, 0.4, 0.2, 0.1}; void setup(){ pixels.begin(); tone(4,880); delay(50); noTone(4); delay(50); tone(4,1760); delay(50); noTone(4); pinMode(8, OUTPUT); pinMode(9, OUTPUT); digitalWrite(8, LOW); digitalWrite(9, LOW); pattern_set(); color_mode = random(0,6); nice_initial(); } void loop(){ int i=0,j; if(++timing[0] > 1000){ timing[0] = 0; if(++timing[1] > 40){ timing[1] = 0; if(++timing[2] > 4){ timing[2] = 0; pattern[32 + random(192)] = 1; color_mode = (color_mode + random(1,4)) % 6; } } PAW_sensor_read(); all_clear(); for(i=0;i<256;i++){ if(pattern[i] != 0){ color_set(color_mode); for(j=0;j<3;j++) rgb[j] = rgb[j] * para[timing[2]]; point_disp(i); } } PAW_point_display(); pixels.show(); pattern[PAW_point] = 0; clear_check(); } } void clear_check(){ int i,j = 0; for(i=0;i<256;i++){ if(pattern[i] == 0) j++; } if(j == 256){ for(i=0; i<9; i++){ tone(4, musicScale[i]); delay(40); noTone(4); delay(60); } pattern_set(); color_mode = random(0,6); nice_initial(); } } void pattern_set(){ int i; for(i=0;i<256;i++){ pattern[i] = 0; if((i & 0x10) == 0){ if(i%2 == 0) pattern[i] = 1; } else{ if(i%2 != 0) pattern[i] = 1; } } pattern[0] = 0; pattern[14] = 0; pattern[31] = 0; pattern[224] = 0; pattern[241] = 0; pattern[255] = 0; } void PAW_point_display(){ int d1, d2, d3, d4; d1 = ( 110 + map(paw[3],409,58,0,220) - map(paw[0],512,74,0,220) ) / 2; d2 = map( constrain(d1,0,100), 0, 100, 0, 15); d3 = ( 110 + map(paw[1],363,53,0,220) - map(paw[2],418,58,0,220) ) / 2; d4 = map( constrain(d3,0,100), 0, 100, 0, 15) * 16; PAW_point = d2 + d4; color_set(6); point_disp(PAW_point); } void PAW_sensor_read(){ switch(paw_mode){ case 0: digitalWrite(8, HIGH); break; case 1: paw[0] = analogRead(A0); paw[1] = analogRead(A1); digitalWrite(8, LOW); break; case 2: digitalWrite(9, HIGH); break; case 3: paw[2] = analogRead(A0); paw[3] = analogRead(A1); digitalWrite(9, LOW); break; } paw_mode = (paw_mode + 1) % 4; } void point_disp(int i){ int p = 255 - i; if(((p >> 4) & 1) == 0) p = (p & 0xf0) - (p & 0x0f) + 15; pixels.setPixelColor(p, pixels.Color(rgb[0],rgb[1],rgb[2])); } void all_clear(){ for(int i=0;i<256;i++) pixels.setPixelColor(i, pixels.Color(0,0,0)); } void color_set(int mode){ switch(mode){ case 0: rgb[0]=30; rgb[1]=0; rgb[2]=0; break; case 1: rgb[0]=0; rgb[1]=30; rgb[2]=0; break; case 2: rgb[0]=0; rgb[1]=0; rgb[2]=36; break; case 3: rgb[0]=20; rgb[1]=20; rgb[2]=0; break; case 4: rgb[0]=20; rgb[1]=0; rgb[2]=20; break; case 5: rgb[0]=0; rgb[1]=20; rgb[2]=20; break; case 6: rgb[0]=25; rgb[1]=25; rgb[2]=25; break; } } void nice_initial(){ int i,j; for(i=0;i<256;i++){ for(j=0;j<3;j++){ rgb[j] = random(1,8); pixels.setPixelColor(i, pixels.Color(rgb[0],rgb[1],rgb[2])); } } pixels.show(); delay(250); for(i=0;i<256;i++){ for(j=0;j<3;j++){ rgb[j] = random(1,20); pixels.setPixelColor(i, pixels.Color(rgb[0],rgb[1],rgb[2])); } } pixels.show(); delay(250); for(i=0;i<256;i++){ for(j=0;j<3;j++){ rgb[j] = random(1,33); pixels.setPixelColor(i, pixels.Color(rgb[0],rgb[1],rgb[2])); } } pixels.show(); delay(250); all_clear(); pixels.show(); }
![]()
上がその様子で、完全にWebカメラがLEDの輝度に負けているものの、せっかくなので実験の様子を動画に撮ってみたのが このYoutube動画 である。 将棋は夕方まで、珍しく糸谷八段が時間をかける展開のまま、封じ手に向かっているが、今日はこのあたりで満足して終わることにした。
2026年4月9日(木)
イラストレーター・みふねたかしさんによるフリー素材サイト「いらすとや」の新しいイラスト「TACO」がニュースになっていた。 TACOは「Trump Always Chickens Out (トランプはいつも尻込みする)」というものらしく、まぁ日々の世界情勢はそんな感じで進んでいる。
![]()
![]()
そして今日は、名人戦第1局2日目ということで、午前中に運転手としてぐるっと出かける予定がある以外は、基本的にこの観戦で過ごす一日となりそうである。 AbemaTVのライヴ中継の冒頭は以下の感じで08:30に始まったが、封じ手の開封から対局開始は09:00である。
![]()
![]()
封じ手はなんと7七桂ということで、どうも2日目は急戦模様の予感がしてきたが、午前中は藤井名人が長考することも予想される。 そして午前〜午後にかけて、ずっとAbemaTVでの名人戦を最小音量で開きつつ、京都精華大「生成音楽論」の教材ページを少しずつ作り続ける一日となった。 ただし、教材ページはまだまだ7週のうちの第1週の、ほんの「イントロダクション」あたりまでしか進まなかった。 これはかなり大きなお仕事だぞ・・・と気付いた日となった。
![]()
夕方にかけて形勢がだいぶ藤井名人に傾きかけたものの、まだまだ中盤というところで、「生成音楽論」教材のためにsunoマシンを持ち出して、screenshotを撮ってみた。 上は「sunoを起動したところ」(Home)である。
![]()
上はHome画面で「Explore」を選んで、色々な「生成された音楽」を選んで聞くことができる、という部分である。
![]()
上はHome画面で「Create」を選んで、(1)Instrumentsを指定して、(2)プロンプトを入れて、(3)Create ! と入力して、新しく2曲が「生成中グルグル」となり、その片方が生成完了してPlay Buttonが現れた、という様子である。
![]()
上は生成できた曲のタイトル部分をクリックすると、その曲データの画面となって、sunoが生成したPromptも表示される・・・という様子である。
![]()
上は生成された曲の欄の右端の「…」をクリックしたメニューからDownloadを選び、さらに「MP3 Audio」を選択してmp3をダウンロードする様子である。
![]()
上は「Search」メニューの画面の下端にある「ジャンル」を選ぶところである。 これはちょっと前には無かったのだが、どんどん新しくなっているのだった。
![]()
上は「Labs」メニューの中にある「Genre Wheel」というもので、僕が最初にsunoに触れた時には、もっとメニューの見やすいところにあったものが、ここに引っ込んだ。 この自動でグルグル回る項目は全てsunoが得意とする「音楽ジャンル」なのだ。 ここに圧倒されることから、sunoをスタートするべきだと確信している。
●本日のsuno生成音楽(2026.04.09)●
タイトル : Spectrum of Us
使用したモデル : v4.5-all(無料)
与えたPrompt : happy, sad, hope, angry, calm, hungry, sleepy, joyful, violence, terrible, tears, injured, humanity, hate, dead, inspired, crazy, singing, no vocal, duration is 5minutes
出てきたPrompt : Wide-screen post-rock build for instrumental soundtrack: clean delay guitars and warm piano start sparse and intimate, bass and brushed drums ease in, then strings swell, Midsection adds driven drums and overdriven rhythm guitar, cresting into a towering, cathartic wall of sound, Final third exhales into a calm, reverb-drenched coda with lingering guitar harmonics and soft synth pads; ideal arc for a 5-minute emotional journey, joyful, sad, happy, vocal
Result : Spectrum of Us 1 - Spectrum of Us 2上は、このサンプルのために生成した曲で、モデルは無料の「v4.5-all」として、プロンプトは喜怒哀楽ごちゃまぜの精神分裂みたいなものとした。 出来上がった2曲(duration = 4min52sec, 5min05sec)は、まぁ当たり障りのない普通の聞きやすい音楽となって、これはまぁ想定内だったものの、クレジットの「無駄撃ち」となった。
![]()
そして名人戦第1局の終盤は、20時半を過ぎても上のようにもつれた状況が続いていた。 なんせ早指しの糸谷八段がずっと消費時間で負けていたものの、それぞれ残り数分という終盤になれば、ちょっとしたミスで逆転の「綾」も見え隠れするのだった。
そして21時過ぎ、本局は「歩の前に桂を打つ」とか「桂が跳んでも成らず」などの名手を繰り出した藤井名人の勝ちでようやく終局となった。 非常にレアな糸谷八段の1分将棋もあって、なかなかの熱戦だった。 しかし、去年までは対局翌日の楽しみだった「ひふみんアイ」がもう読めないのは、なんか寂しい。 ちなみに、ひふみんに関して、さらに4段当時の「若々しい藤井聡太」に関してのページは上のようなものを作っていたので、ここにリンクを置いておこう。
![]()
2026年4月10日(金)
ネットニュースから 大学生が40年間信じられてきたデータサイエンスの定説を覆した という情報が届いた。 ハッシュテーブルによる検索に関する「アンドリュー・ヤオ(Andrew Yao)の予想」というのが覆された・・・というものだが、僕はハッシュ検索を駆使するような設計の経験は乏しくてあまり詳しくないので、ほうほう、と読み進めた。 しかし、最後のページ「セクション4:専門家向け補遺」まで読み進めて到達した末尾の、以下の「読者のコメント」でおおいに納得がいった。「AI翻訳」の普及に続いて、高校生でも中学生でも生成AIを活用する時代となって、こういう「専門解説サイト」・「海外文献サイト」というのが難しくなっているのはうすうす実感してきたが、この指摘を読んで、あちこち「腑に落ちた」。 まぁ、自分でもChatGPTなりWikipediaなりを活用しているので、他山の石としてここにメモしてみた。大変恐縮ですが、この記事の大半はAIによる翻訳かと思います。 抽象的な例えによってかえって定性的でわかりにくい表現になったり、なんとなくそれっぽいけどよく読んだら何を書いてある のかわからない、という文章になっているあたり、非常にAI感が強いです。 AIを活用することは悪いことでは決してありませんが、ライターが元の論文の意味や意図を咀嚼しないまま、AIの翻訳する 文章をそのまま載せるのは、読者としては少々がっかりです。単純にわかりにくいです。
ちょうど今日は、 ChatGPTは学習を速める一方で長期記憶には残りにくい可能性がある という、ほぼ自明な記事もあった。 まぁ、このあたりが最近のトレンドという事なのだろう。
![]()
そして晩にロボット教室に出掛けるまで、昨日に続いて京都精華大「生成音楽論」の教材ページを少しずつ作り続ける一日となった。 初回の第1週から、上のようにmodelにも言及する必要が出てきて追加したりして、ようやく、以下のように第1週の教材がほぼ完成に近付いてきた。
![]()
ただし自分でシラバスの項目として書いていた 音楽の「スタイル」・「ジャンル」とは なんてのを真面目に考え出すと進まなくなって、 What’s the difference between ‘style’ and ‘genre’? Or is there no difference? というページに辿り着いたものの、「この投稿は最初に投稿した人によって完全に削除されました」となっていて、根の深さを思い知った。 まだWeb上では このページ の「2026年度」リンク先のページにはHTMLを置かずにofflineで作っていて、実際の開講時期になってから、それぞれの週の教材HTMLを逐次、サーバに転送して公開していく予定である。
2026年4月11日(土)
この日記の「2026年4月2日(木)」のところで「出発」を見たのに続いて、アルテミス計画で月に行って周回して帰ってきた宇宙船「オリオン」の「着水」ライヴ中継Youtubeを朝から見守ることになった。 ブラックアウトの時間を含めて以下のように多数のscreenshotsを撮った(最初に撮ったのは244枚だったのを60枚まで減らした)が、まぁ後で動画でダイジェストを見ればいいものの、実際にそのライヴ中継として見届けた事に意義があるだろうか。
![]()
![]()
![]()
![]()
今日の午後には、いよいよ新セメスターとして始まる「ロボプロ」(RP1/RP2)の第1回があり、スタートアップを含めてこれまで準備してきた事の集大成的な初日となる。 そこで午前中はぼちぼち、Martinを愛でたりあれこれ整理したりして過ごして、午後に向けて気合いを充電した。
午後には、大谷翔平がヒットでイチローの記録を抜いたらしい事を、YAHOOの「一球速報」・「テキスト速報」で知った。 まぁMLB生中継の有料契約などをするつもりは毛頭ない(野球中継のダルさ[密度不足]はサッカーやアメフトと比べれば雲泥の差)ので、数十秒遅れの静止画とかテキストで十分。 やはり、野球は「甲子園ライトスタンドで巨人戦に臨む」というのが究極の贅沢/醍醐味なのである。この日記も、今日の午後はRP1/RP2の複式クラス、明日は「ミドル+アドバンス+ロボプロ(RP1)」という「3コマ日曜日」の初日、月曜日は柏に「15分間の面会だけ」の日帰り、そして火〜木は甲子園(水曜日)の大阪遠征、と目白押しなので、しばらくスキップすることになるかもしれない。
![]()
2026年4月16日(木)
阪神タイガースファンクラブ会員特典先行予約でゲットした甲子園ライトスタンド巨人戦のチケットだったが、去年は試合途中からの雨だったのに対して、今年は午前から降り続く雨のため「中止」となった。 もうチケットは取れないので、今年はこれでオシマイである。 中止の場合のチケット払い戻しというのを初めてやってみたが、まぁメイル1本、そして払い戻しページの指示に従って、ものの2分ほどで完了した。
![]()
アカペラの歌仲間の花波ちゃんと今年も一緒に行く予定で、午後にランチがてら試合前までカラオケしよう・・・と野田阪神駅前のBIG ECHOを予約していた。 その最中に試合中止の情報が確定したので、当初は4時間の筈だったカラオケをフリータイム限度一杯の6時間まで二人で熱唱、39曲ずつ歌っていた。 その後に隣の「王将」で夕食をいただいて、今年の甲子園は終わった。 今日は大阪から東海道線をずっと乗り継いで、6時間で浜松に帰ってきたのだが、まぁ、こういう年もある。
2026年4月17日(金)
今日は晩にロボット教室(ミドル2回目)があるという日だが、甲子園に行っていて「M1→M2」というサンプル教材の改訂作業をする時間が無かったので、珍しく午前中に「当日の教材改訂」を行った。 明日にはアドバンスの「AD1→AD2」改訂をすることになるが、ロボプロについてはこのセメスターでは頻繁な教材改訂は不要のようなので、ちょっと助かる。
![]()
京都精華大からは、「本学Webサイトへの掲載につきまして、ご回答くださいましてありがとうございます。長嶋さまからいただいた情報は、大学Webサイトに掲載しておりますのでご報告いたします」とのメイルが届いた。 以前に送っていた情報のようで、上のように常勤教員が多数いるのに加えて、厖大な数の非常勤講師がずらっと並んでいる一部に、僕の名前も加わった。 おそらく経費節減のために、この非常勤講師の少なからぬ人数は、僕と同様に京都に行かず、オンライン科目担当ということになっているのだろう。
![]()
その後、午前から「生成音楽論」の第2週の教材ページに取り掛かって、午後にロボット教室に出掛ける前に、上のようにとりあえずほぼ完成してしまった。 まぁ、「音楽理論」なんていうテーマは到底1週で伝えられるものでもないので、だいぶ前に実験して仕込んでいたFLASH"Matrix"を前面に押し出してみた。 これが学生にウケるのか空を切るのか、果たしてどうなるかは、まったく見えないのだ。
![]()
ロボット教室では、スイッチの手動だったモーター制御をマイコン制御にしたバージョン、さらに手動に戻して船の反対側に重りを付けて「前後に揺れる」から「ぐるっと一周する」という過激なバージョンに改訂した。 上がその様子で、紹介の様子を動画に撮ってみたのが このYoutube動画 である。 今回はミドルの代打が来週にあるので、いつもより1回多い計3回、このサンプル教材を紹介するのだ。
2026年4月18日(土)
今日と明日の土日は何も予定が無い(その翌日から月火はまた柏行脚)ということで、朝から京都精華大「生成音楽論」の教材ページ作りに精を出して、朝から夕方までかけて、第3週の8合目ぐらいまで到達した。 いろいろ仕込んだ材料の中で、この週には 「イントロ」の考察 というのをぶっ込んだ。 明日に第3週が完成すれば上出来・・・というペースである。そして残りの時間で、久しぶりにsunoで音楽生成させてみた。 昨今の世界情勢を睨んで、Promptは「vocalize, choir a cappella, no lyrics, free tempo, rubato, intimate, through composed, no percussion, floating rhythm, ambient, drone, atmospheric soundscape, prayer, world peace, eternal life, immortality, against war, duration is 5minutes」として、「Instruments」指定とした。 生成したモデルは5種類、最新のv5.5、無料のv4.5、そして僕のオリジナルモデル3種 : 「nagasm3 (デスメタル臭)」、「nagasm5 (ノイズ系)」、「nagasm6 (chaos Piano)」である。
●本日のsuno生成音楽(2026.04.18)●
タイトル : Prayer For The Unbroken Sky
使用したモデル : v5.5
与えたPrompt : vocalize, choir a cappella, no lyrics, free tempo, rubato, intimate, through composed, no percussion, floating rhythm, ambient, drone, atmospheric soundscape, prayer, world peace, eternal life, immortality, against war, duration is 5minutes
出てきたPrompt : Expansive a cappella choir, mixed voices; ultra-soft drones bloom into slowly shifting clusters, hovering around a tonal center with gentle dissonances that resolve like sighs, Free, elastic tempo with rubato entrances from small sub-groups, occasional solo voice emerging from the texture then melting back into the choir, Through-composed evolution from sparse, almost whispered vowels to a mid-track swell of luminous, stacked harmonies, then back to a transparent, high-register haze, No pulse or percussive articulation―just long, staggered breaths, overlapping sustains, and faint overtone-rich hums, Overall arc feels like a meditative plea for peace and timelessness, ending on a barely-there, suspended chord that evaporates into silence, world, a cappella, drone, ambient
Result : Prayer For The Unbroken Sky 1 - Prayer For The Unbroken Sky 2上がモデルv5.5による「Prayer For The Unbroken Sky」(duration : 4min04sec, 3min09sec)である。 プロンプトで禁止しているので冒頭は狙った通りのボカリーズでいい感じに進んだが、やはり最後にはリズム系が乱入してくるといういつものパターンに陥った。
●本日のsuno生成音楽(2026.04.18)●
タイトル : Prayer for a Still World
使用したモデル : v4.5-all (無料)
与えたPrompt : vocalize, choir a cappella, no lyrics, free tempo, rubato, intimate, through composed, no percussion, floating rhythm, ambient, drone, atmospheric soundscape, prayer, world peace, eternal life, immortality, against war, duration is 5minutes
出てきたPrompt : Ethereal mixed choir a cappella, wide reverb, and a soft evolving drone from sustained low voices; rubato phrases swell and recede like slow breaths, Through-composed arc: begin in near-whisper unison, gradually open into clustered harmonies and overtone-rich chords, then thin to a high, radiant shimmer, Floating, almost pulse-less rhythm with long suspensions and quiet dissonances resolving into luminous consonance, Occasional solo lines gently emerge from the texture like intimate prayers, then melt back into the ensemble; dynamic waves every 30-40 seconds sustain a 5-minute meditative journey toward peace and transcendence, world, ambient, drone, a cappella
Result : Prayer for a Still World 1 - Prayer for a Still World2上がモデルv4.5-all(無料版)による「Prayer for a Still World」(duration : 7min59sec, 7min30sec)である。 v5.5よりもこっちの無料版v4.5-allの方がボカリーズの感じとか良いなぁ・・・と思っていたら、2曲とも最初はいいのにまたまた後半はドラムが入ってきた。
●本日のsuno生成音楽(2026.04.18)●
タイトル : Eternal Breath for a Quiet World
使用したモデル : nagasm3 (デスメタル臭)
与えたPrompt : vocalize, choir a cappella, no lyrics, free tempo, rubato, intimate, through composed, no percussion, floating rhythm, ambient, drone, atmospheric soundscape, prayer, world peace, eternal life, immortality, against war, duration is 5minutes
出てきたPrompt : Sparse, drifting choir a cappella; mixed voices in close, shimmering clusters that open into wide, luminous chords, Free, rubato phrasing with long held drones under floating melodic fragments, like a slow exhale in a stone chapel, Intimate, near-whisper entrances bloom into brief cathedral-sized harmonies, then dissolve back to one or two voices, Occasional overtone-rich straight tones contrast with soft vibrato; dynamic swells suggest wordless prayer for peace and continuity of life, Through-composed arc over ~5 minutes, from solitary low hum to radiant multi-part tapestry, then returning to a single fading breath, ambient, a cappella, world, drone
Result : Eternal Breath for a Quiet World 1 - Eternal Breath for a Quiet World 2上がモデル「nagasm3 (デスメタル臭)」による「Eternal Breath for a Quiet World」(duration : 3min04sec, 2min52sec)である。 まぁデスメタルなのだが、今回はこのモデルは成功であり、Promptに込めた僕の想いが実現された感じがして、迷わずPublishした。 このモデルはなかなかに捨て難いのだ。
●本日のsuno生成音楽(2026.04.18)●
タイトル : Eternal Breath of One
使用したモデル : nagasm5 (ノイズ系)
与えたPrompt : vocalize, choir a cappella, no lyrics, free tempo, rubato, intimate, through composed, no percussion, floating rhythm, ambient, drone, atmospheric soundscape, prayer, world peace, eternal life, immortality, against war, duration is 5minutes
出てきたPrompt : Layered wordless choir, mixed voices, free-floating rubato phrases over a soft sustained drone; intimate close-mic leads bloom into wide, glassy harmonies and low choral pads, Texture evolves through through-composed sections: murmured clusters, open fifths, and gently dissonant suspensions resolving into luminous consonance, Very slow dynamic arcs, long exhales of sound; occasional solo lines rise like prayers then dissolve back into the ensemble, creating an ambient, meditative soundscape that feels like a continuous 5-minute breath, drone, a cappella, world, ambient
Result : Eternal Breath of One 1 - Eternal Breath of One 2上がモデル「nagasm5 (ノイズ系)」による「Eternal Breath of One」(duration : 3min24sec, 3min44sec)である。 ノイズの中には爆発音があったので、効果的な戦争反対イメージで活躍し、さらに無線混信ノイズもいい感じに入ってくれた。 まぁリズムが入ってきてしまうのは同じなのだが、これもPublishしてみた。
そして最後のモデルは「nagasm6(オリジナル : chaos piano)」なのだが、ここでsunoを使っていて、初めて遭遇する特殊な現象に直面した。 これまでは必ず、「create」すると同時に2曲を生成してきたが、常にそれらのタイトルは同一であり、生成されたPromptも同一だった。 ところがこの「nagasm6(オリジナル : chaos piano)」に際しては、なんと同時に2曲を生成するのは同じなのだが、タイトルが「Athanatos Choir」と「Prayer for an Unbroken World」というように全く別々の曲が1つずつ、そしてそれぞれの生成Promptも全く異なっていた。
●本日のsuno生成音楽(2026.04.18)●
タイトル : Athanatos Choir
使用したモデル : nagasm6(オリジナル : chaos piano)
与えたPrompt : vocalize, choir a cappella, no lyrics, free tempo, rubato, intimate, through composed, no percussion, floating rhythm, ambient, drone, atmospheric soundscape, prayer, world peace, eternal life, immortality, against war, duration is 5minutes
出てきたPrompt : Ambient choral a cappella, free-tempo rubato and through-composed, with wordless breath textures, clustered harmonies, and floating drone tones; opening stays intimate with solo voices and soft unisons, middle blooms into stacked choir swells and distant echoes, final section thins to a suspended high chord and a quiet low pedal, Reverb-rich, wide, sacred, and luminous, ambient, a cappella, drone, world
Result : Athanatos Choir上がその一方の「Athanatos Choir」であり、durationは3min18secで、まったく「カオス臭はナシ」という結果になった。
●本日のsuno生成音楽(2026.04.18)●
タイトル : Prayer for an Unbroken World
使用したモデル : nagasm6(オリジナル : chaos piano)
与えたPrompt : vocalize, choir a cappella, no lyrics, free tempo, rubato, intimate, through composed, no percussion, floating rhythm, ambient, drone, atmospheric soundscape, prayer, world peace, eternal life, immortality, against war, duration is 5minutes
出てきたPrompt : Ethereal a cappella choir, mixed voices, Tenor and alto cluster drones under a slowly shifting rubato soprano melody; basses enter in waves with open fifths, Through-composed evolution: start in a single tonal center, then gently blur into modal colors and close dissonances that resolve like sighs, Dynamics bloom from intimate hush to luminous, organ-like swells, then recede to a single high, fading tone, Occasional solo lines float over the ensemble like calls from distant chapels, Spacious reverb tail creates an enveloping, meditative atmosphere, ambient, a cappella, drone, world
Result : Prayer for an Unbroken Worldところが上の「Prayer for an Unbroken World」では、durationは3min45secで、途中にあのヒステリックなchaos pianoが登場してくれた。 まぁリズムが入ってきてしまったのは残念なのだが、これもPublishしてみた。 そんなこんなで一日が終わって、また明日もほぼ終日、「生成音楽論」テキスト作りなのだった。
2026年4月22日(水)
あっという間に日々が過ぎていくというのは、まぁ喜ばしいことなのだろう。 日曜は終日「生成音楽論」テキスト作り、月曜の柏詣での往路新幹線の車内では集中して第1週から第3週までのテキストの校正改訂をほぼ完了させた。 昨日の火曜の午前には第4週に取り掛かったものの、ここで色々と問題発生の「壁」にぶち当たった。 終末病床の母親は痩せ細って文字通り「骨と皮」になってきたが、それでも自発呼吸を続けているのは凄い生命色であり、93歳の誕生日を通過した。 今日は耳鼻科の通院のつもりで朝イチで医院に行ったのだが、この季節に多い小学校集団健診での休診に遭遇して、明日に出直す事になった。
![]()
時間学会からは6月の大会の タイムテーブル が届いて、あれこれ検索して「旅程」も立てた。 これまで何回か日本即興音楽学会の大会で神戸大のキャンパスに行っていたが、今回の「六甲台2キャンパス」というのは初めてで、これまでは一番上の「鶴甲2キャンパス」だった事が判明した。 神戸らしい、物凄いアップダウンのあるところなのだ。
![]()
そして時間学会のホームページでの告知で、上のように書いてもらったこともあり、午前中に気合いを入れて こんなページ を仕込んだ。 もちろん、このページは大会当日まで秘密となる。
ブルースの方でリズムがコケているのが気になっていたので、改めて このように 取り出してみた。 ハイハットに注意して聞いてみれば、「眠りと覚醒」の直後に明らかにヘンなタイミングでコケている(1ビート間延び)のが分かるだろう。 音響をLLMで接続しているとsunoは気付かないのかもしれないが、これではミュージシャンとしては失格だぁ。
今日の午後から明日は引き続き、「生成音楽論」テキスト作りに没頭することになる。 そして終末の金土日は代打を含むロボット教室の予定が満載である。2026年4月23日(木)
キティちゃんが合体ロボに!変形ロボトラック「ハローキティ エクスプレス トラック」新発売というニュースが流れてきて、おぉぉこれは衝動買いだ!! と思ったものの、「4180円(税込)」とのことでサッと冷めた朝である。
![]()
昨日は「生成音楽論」テキストの第4週をようやく形に仕上げたところまでだったが、その関係で昨夜の真夜中にフト目覚めて思い付いたアイデアに眠れなくなり、思わずCPAPのパイプだけ外してマスクを装着したまま部屋に行って、sleepしていたMacを起こしたりしてしまったのだ。 それは「芸術音楽」(クラシック音楽)に関わることであり、さらに6月に近付いてきた日本時間学会でのプレゼンのネタでもある、という「一粒で二度おいしい」という、マーラー「復活」ネタだった。
![]()
一つのきっかけは2006年の マーラー/小澤征爾「復活」 であり、もう一つは2013年の グロッケン音色の利用に関する考察 で、その中で比較のためにYouTubeで収集した、以下の「マーラー第2交響曲」の計59本である。
今回は「演奏時間(duration)のばらつき」(→テンポの違い)を調べたいので、対象となるのは「CD 全曲 (CD001 - CD017)」・「ライブ映像 全曲 (Live001 - Live011)」の2種、計28本となる。 なんせ5楽章の全体で1時間15分とか90分とかのボリュームがあるので、「秒」以下を切り捨てて「分」の整数データとすると共に、それぞれのMovieの演奏開始までの無音(準備)とか楽章ごとの「間」などにバラつきは全て、「誤差」として無視することにした。 ちなみにこの「復活」では、Marlerは楽譜の第1楽章の末尾に「次の楽章までに5分間のインターバルを置くこと」と明記しているがCDやMovieでは(実際のコンサートでさえ)、暖かく無視されてほぼカット(ササッと次の第2楽章へ)である。
- CD 全曲 (CD001 - CD017) - 17ムービー
- CD 第5楽章 (CD101 - CD106) - 6ムービー
- CD Finaleのみ (CD201 - CD209) - 9ムービー
- ライブ映像 全曲 (Live001 - Live011) - 11ムービー
- ライブ映像 第5楽章 (Live101 - Live102) - 2ムービー
- ライブ映像 Finaleのみ (Live201 - Live214) - 14ムービー
対象となる28本のmp4ファイルのInspecterの数値(分に換算)は、 79,79,81,77,86,87,83,80,87,84,77,77,72,78,85,84,75,87,91,85,81,88,89,93,79,89,81,87、となった。 これを統計分析するのにどうしようか・・・と考えたが、ここは「何も考えずにChatGPTに投げてみる」という手を思い付いて実行した。
![]()
ChatGPTとのやりとりの様子が これ であり、上のように、このデータでは「明らかな傾向」しか出てこなかった。 そこで作戦を変えて、最短の「72分1秒」(クレンペラー)と最長の「91分20秒」(バーンスタイン)の「テンポ」を調べることにした(ちなみに数値で最大の「93」だったMovieを調べてみると、映像として余計な前後の入退場などが映っていたためにパスした)。
Klemperer
Bernsteinその結果として上のように、第1楽章のほんの一節でも、クレンペラーの20秒とバーンスタインの27秒、という相当な速度の違いを抽出できた。 そして時間学会プレゼンのために暫定的に作っていたMaxパッチも以下のように改訂した。 クレンペラーとバーンスタインの速度の比は「0.74倍」ないし「1.35倍」ということで、かなり幅広いことが明確に示せるので、これはいい道具になりそうだ。
![]()
あまり「心理的時間」という方向に持っていかずに伝えたいテーマをどうするか、というのはこれからも合間に考えていくために、頭の中の作業棚に置いておく感じになる。 かといって「身体的時間」・「生理的時間」というのもちょっと違うので、まぁここは悩ましいのだ。
「日記」シリーズ の記録