Wirtualny kompozytor muzyki

Ewa Kłapcińska, Wiktor Kania i Mateusz Groblewski z Politechniki Łódzkiej zajęli pierwsze miejsce w międzynarodowym konkursie studenckim „Black Sea Science 2021″. Ich zwycięska aplikacja FriML jest wirtualnym kompozytorem muzyki opartym na uczeniu maszynowym. Laureaci są studentami informatyki na Wydziale Elektrotechniki, Elektroniki, Informatyki i Automatyki.

Organizator konkursu, Odessa National Academy of Food Technologies, zaprosił do jury ponad 100 specjalistów z 20 krajów świata. Do oceny było 239 prac w pięciu kategoriach konkursowych obejmujących nauki o żywności, ekonomię, IT, robotykę, automatykę, energetykę oraz ekologię i ochronę środowiska.

Studenci Politechniki Łódzkiej zgłosili projekt „FriML – Music generation using machine learning”. Znalazł się on w najsilniej obsadzonej kategorii „Informatyka, automatyka i robotyka”, w której do dwuetapowej oceny było 69 prac z 9 krajów.

Międzynarodowe jury złożone z przedstawicieli Polski, Angoli, USA, Beninu, Gruzji, Azerbejdżanu, Białorusi, Kazachstanu i Ukrainy najwyżej oceniło projekt trójki studentów – Ewy Kłapcińskiej, Wiktora Kani i Mateusza Groblewskiego z Politechniki Łódzkiej, przyznając mu w finale pierwsze miejsce. Nagrodzona aplikacja powstała pod opieką dr. inż. Tomasza Jaworskiego i dr. inż. Piotra Ducha z Instytutu Informatyki Stosowanej, opiekunów koła naukowego Main, w którym studenci rozwijają swoje umiejętności i wiedzę.

Krótko o projekcie

FriML jest narzędziem do generowania muzyki wykorzystującym algorytmy uczenia maszynowego, udostępnionym jako aplikacja uruchamiana w przeglądarce. Przejrzysty interfejs umożliwia użytkownikowi generowanie melodii, należących do różnych gatunków muzycznych (pop, rock, classical), z różnymi kluczami i na różne instrumenty.

Zdaniem studentów ich aplikacja ma wiele potencjalnych zastosowań. Może być wykorzystana np. przez projektantów gier wideo w udźwiękowieniu ich twórczości. Projektu jest rozwiązaniem, które pozwoli na generowanie nowych melodii za pomocą kilku kliknięć myszką.

Rozwiązanie to oparto na sieciach rekurencyjnych LSTM, wykorzystywanych do zadań, wymagających przewidywania sekwencji danych na podstawie pewnego kontekstu. Dotyczy to zarówno klasyfikacji tekstu, rozpoznawania mowy i obrazów, generowania zdań oraz właśnie muzyki.

Działanie aplikacji można sprawdzić na stronie https://friml.netlify.app/. Jest to wersja demonstracyjna – generowane melodie trwają kilka sekund i zapisać je można wyłącznie w formacie MIDI.

Źródło: Informacje Rzecznika Prasowego Politechniki Łódzkiej