Téčko 2/2024
Suno AI – když se skládání hudby chopí umělá inteligence
Autor: Jakub Blažek
A nyní společně znovu zamíříme do fascinujícího a zábavného světa umělé inteligence, a zároveň také do říše hudby. V jednom z našich minulých příspěvků jsme psali o tom, jak lze AI v dnešní době využít k práci s již existující skladbou či písničkou a například oddělit od sebe instrumentální a vokální složky. Co kdybychom však neuronové síti svěřili nelehký úkol píseň přímo pro nás vytvořit?
téma propojení hudby a umělé inteligence již v minulosti otevřela společnost OpenAI, která ještě dávno před zveřejněním proslulého modelu Chat GPT vypustila na veřejnost svůj projekt OpenAI Jukebox. Ten byl vytrénován na základě rozsáhlého množství hudebních nahrávek a na základě krátkého segmentu skladby dokáže vygenerovat její pokračování. Přestože se jedná o velice zajímavý projekt, využití OpenAI Jukebox vyžaduje výkonný počítač a pro většinu lidí je dostupný jen prostřednictvím nástrojů jako Google Colab, což pochopitelně značně omezuje jeho přístupnost pro širší okruh uživatelů. Na scénu však vstupuje britský projekt Suno AI. Na rozdíl od Jukeboxu není nutné přímo vlastnit složitý hardware ani technické znalosti, stačí se jen zaregistrovat. Oproti jiným projektům Suno AI nepotřebuje žádnou ukázku, ze které by AI při tvorbě vycházela. Uživatel pouze napíše, o čem by píseň měla být (případně vloží její samotný celý text) a její kýžený žánr či styl. O zbytek se již postará Suno: vygeneruje nám melodii, nástroje i zpěv, a to i třeba v češtině.
Je přirozeně zřejmé, že spíše než praktické využití nám tento nástroj přinese především spoustu legrace z výsledných zvukových výtvorů, nad nimiž nám zůstává rozum stát. Některý z počinů však může ne jednou posloužit i jako zdroj inspirace a pokud se zadaří, může se nám zrodit poslouchatelný a téměř publikovatelný kousek, o který se můžeme podělit s přáteli či s ostatními uživateli.
Jak si tedy začít hrát
Ze všeho nejdříve je nezbytné založit si na domovské stránce projektu uživatelský účet. To by samo o sobě nemělo představovat žádné nesnáze: klikneme na tlačítko „Sign up“, otevře se nám dialog s možnostmi přihlášení a můžeme si vybrat, chceme-li použít náš existující účet na sítích Discord, Microsoft nebo Google. Nicméně tato část stránky bohužel není co do přístupnosti příliš nakloněna odečítači NVDA a v dialogu je stěží možné se efektivně pohybovat. Po chvíli experimentování se na příslušné tlačítko dostaneme, nicméně mnohem jednodušší je použít jiný odečítač obrazovky, jako např. program Předčítání, který by měl fungovat bez problému. Po kliknutí na jedno z tlačítek již bude stránka opět standardně spolupracovat se všemi čtečkami obrazovky.
Po přihlášení pak můžeme jednoduše kliknout na odkaz „Create“ a začít experimentovat. Ve výchozím režimu se nám zobrazí pouze editační políčko, do kterého napíšeme náš požadavek, např. „futuristická rocková píseň o asistivních technologiích pro nevidomé“, stiskneme enter a počkáme si pár sekund na výsledek. V dolní části stránky po chvíli najdeme dvě vygenerované písně s tematickými názvy a textem. Napíšeme-li náš prompt v češtině, výsledný text pak bude skutečně také v naší mateřštině. Jak je ale známo, rýmy zatím umělé inteligenci příliš nejdou (rozhodně o dost hůře než hudební kompozice) a i v případě Suna musíme počítat s volným veršem a často až dadaistickým textem.
Možná ještě o něco zajímavějších výtvorů se nám dostane tehdy, jestliže nad editačním políčkem zaškrtneme položku „custom mode“. V tomto režimu máme k dispozici hned tři políčka. Do prvního můžeme vložit text naší písničky, druhé slouží pro specifikaci žánru a nálady a nakonec si pro přehlednost můžeme náš výtvor svým vlastním názvem pojmenovat. Pak už jen klikneme na tlačítko „create“ a opět vyčkáme na výsledek.
Jak již bylo výše řečeno, konečnou píseň a všechny ostatní uvidíme pod těmito editačními políčky. Na tomto místě bohužel stránka také není nijak zvlášť přehledná, všechny písně prostě uvidíme naskládané pod sebou počínaje od nejstarší a nejrychleji se mezi nimi pohybujeme přecházením po tlačítkách pomocí klávesy B. U každé skladby nalezneme tlačítko pro přehrávání, like / dislike, sdílet a rozbalovací tlačítko další akce; po jeho rozkliknutí si můžeme stáhnout audio či video verzi písničky, zveřejnit skladbu pro ostatní uživatele stránky, odstranit ji do koše, vytvořit remix (vygenerovat pro stejný text jinou melodii) či pokračovat, odkud jsme přestali, což je užitečné vzhledem k tomu, že výsledné písně budou mít často jen málo přes minutu a většinou neskončí tak, jak by člověk chtěl.
Všechny vygenerované písničky se automaticky ukládají a pokud je rovnou nesmažeme, můžeme jimi později procházet v naší knihovně. Pokud skladbě dáme like, uvidíme ji poté v našich oblíbených skladbách. Pod odkazem „Explore“ můžeme rovněž poslouchat zveřejněné písničky ostatních uživatelů.
Pod odkazem „Subscription“ můžeme spravovat naše předplatné. Bezplatná verze nám dovolí vygenerovat maximálně 10 skladeb denně, zatímco plán Pro tento limit navýší na 500 skladeb měsíčně výměnou za 8 dolarů měsíčně (zhruba 186 Kč). A kdyby nám to bylo z nějakého důvodu málo, 3x dražší plán Premier nám vystačí až na 2000 skladeb.
Při vytváření skladeb je třeba mít na paměti, že v rámci dodržování autorských práv není vhodné vytvářet remaky a alternativní verze existujících písniček. Vložíme-li ke zpracování text nějakého známého kousku, téměř jistě dostaneme za odměnu chybovou hlášku. U českých písniček filtr často zaspí, nicméně jakkoliv to může být lákavé, Suno by pro tyto účely nemělo být používáno. Více informací ohledně autorských práv se můžeme dočíst na stránce Help / FAQs.
Závěr
Ať už se chceme bavit nad mnohdy obskurními leč přirozeně znějícími nápady umělé inteligence, či hledáme originální nápěv pro píseň v zárodku, Suno AI je v každém případě inovativní a zajímavý projekt, který opět posouvá hranice možností AI a rozhodně stojí za vyzkoušení. Za naši redakci přejeme mnoho zábavy.
#