Analiza preferencji muzycznych użytkowników Spotify z Polski, Wielkiej Brytanii i Szwecji.

 

English version united kingdom 640

 

Zacznę od tego, że analizowanie muzyki to dla mnie szalenie ciekawy temat, a wcale niełatwy. Zaczynąjąc od pozyskania danych, analizę parametrów, kończąc na wnioskach. Bardzo dziękuję moim kolegom Wojtkowi Szmidtowi, Ryśkowi Lateckiemu, Kubie Krukowskiemu, a i Mikołajowi Poncyliuszowi, za to ze mieli czas i cierpliwość tlumaczyć mi pojęcia dla niech nieskomplikowane :)

Dlaczego Spotify?

Zdecydowałam się na Spotify, chociaż jest mniej powszechny niż Youtube, ze względu na jakość danych ( dobrze opisane cechy utworów, albumów, artystów, itp.) i oraz ich względną dostęność ( przy użyciu API Spotify), oraz przypuszczenie, że w przypadku analizy danych z YouTube, dodatkowym czynnikiem wpływającym na popularność wyświetleń będzie sam teledysk.
Niestety i Spotify ma minusy. Nie każdy utwór się na nim pojawia, niektóre gatunki są słabiej reprezentowane w bazie Spotify- np. polski rock, czy disco polo. Mogę tylko przypuszczać, że wytwórnie nie życzą sobie, aby publikować utwory na Spotify, w obawie, przed odpływem części zysku.  Inna nie mniej ważna sprawa to wybór utworu. W przypadku bezpłatnych subskrypcji Spotify, określenie utworu możliwe jest tylko z poziomu przeglądarki desktopowej. W mobilnych urządzeniach można wybrać tylko artystę, którego chce się odsłuchać ( wyjątek stanowi subskrypcja premium )

O danych
Raporty bazują o dzienne zestawienia dotyczące 200 najczęściej odsłuchiwanych utworów w aplikacji Spotify przez użytkowników zlokalizowanych w następujących krajach: Polska, Wielka Brytania, Szwecja. Dane w raportach pochodzą z okresu od 1/1/2016 - 17/2/2017, ze strony www.spotifycharts.com.  Parametry utworów, linki do fragmentów piosenek oraz wszystkie inne dane dt. piosenek zostały pobrane w trybie developerskim dzieki udostepnionemu przez Spotify API. W zbiorze nie jest wskazane, jaka część generowana jest przez userów z płatnym pakietem premium, a jaka z werji free.

Raporty mają interaktywny charakter, poniższej zamieszczam przykładowe informacje, które dzięki nim można uzyskać.

Raport I - LISTA TOP 1  

Dowiecie się między innymi, ile utworów w ciągu ostatnich 14 miesięcy znalazło się na pierwszym miejscu. Jakie to były utwory,  ich fragment można odsłuchać, po kliknięciu na słupek, pojawia się tooltip, w którym jest link do utworu.
 
Proba określenia cechy utworu, mającej największy wpływ na popularność utworu.
Po zdefiniowaniu progu popularności (5% utwórów z największą liczbą odsłuchań), przetworzeniu zbióru danych zawierających cechy utwóru, stworzyłam kilka modeli, które poddałam w programie SAS, procedurze regresji logistycznej. Na podstawie wyników okazało się że najważniejszą zmienną jest zmienna loudness (ang.głośność, ktorą tłumaczę jako poziom ciśnienia akustycznego).
Nie kryjąc zdziwienia, dopytałam znajomych, znających się na inżynierii dźwięku. Okazało się, że jest to parametr techniczny, świadczący o jakości utworu, im wartość bliższa 0 tym liczba szumów jest mniejsza, a dźwięki b.wyraźne. Uzyskanie tego wymaga masteringu piosenki i dziś już jest standardem. Po wyeliminiowaniu ze zbioru, utworów, które byly wydane wcześniej jak 3 lata temu, zmienna przestała wykazywać istotność na rzecz zmiennej danceability (taneczność). Nie był to jednak wpływ na tyle istotny by kontynuować pogłębianie analizy w tym kierunku. Ponad 70% najpopularniejszych piosenek na Spotify, to utwory popowe, bądz pochodne ( dance pop,canadian pop, folk pop itd), które z założenia powinny być taneczne. 
Jeden z moich znajomych, mówi, że utwory są popularne bo są popularne. Proste, tak, że odpowiedzi dlaczego konkretny utwór znajduje się na pierwszym miejscu, upatrywałabym w budżecie na marketing, promocje oraz pozycjonowanie w ramach spotify'owego algorytmu.
 
Raport II   LISTA TOPOWYCH PIOSENEK  
Lista topowych piosenek w dowolnie wybranej przez siebie agregacji (dziennej, tygodniowej, miesiecznej, kwartalnej lub roczne). Po kliknieciu, mozecie sprawdzic jak piosenka wypada na tle "sredniej statystycznie piosenki z miejsca 1".
 

 

Raport III TANECZNOŚĆ A EURORYCZNOŚĆ

Zamieszczony wykres rozrzutu, powinien ulatwić znalezienie radosnej, tanecznej piosenki, badz wręcz przeciwnie- przygnębiającej.
Wartosci zmiennych - Danceability (tanecznosc) oraz Valence ( co tlumacze jako "poziom euforycznosci" ), zostaly okreslone przez Inzynierow ze Spotify, ktorzy wykorzystaujac metody nauczania maszynowego i obserwujac m.in tempo, skale, akustycznosc przypisali do kazdej piosenki wartość prawdopodobieńśtwa. 
Spośród wszystkich utworów które trafiły do polskiego rankingu w ubieglym roku, utworem najmniej tanecznym i euforycznym, był przejmujący utwor niezyjącego już Leonarda Cohena - String Repreise. Słuchając go ciężko, nie odnieść wrażenia, że artysta chciał się pożegnać ze swoimi słuchaczami.  

Jeśli temat valence was zainteresował, polecam artykuł , w którym powiązono termin z osobowością człowieka.

Raport IV CECHA PIOSENKI W CZASIE

Z raportu dowiadujemy się m.in, jaki dzień tygodnia jest najbardziej "eurofyczny"
Acousticness: Po muzykę akustyczną (czyli, taką którą wykonuje się przy użyciu instrumentów akustycznych) użytkownicy Spotify chętniej sięgają w niedziele (Jesli pod uwage wezmiemy dostepny zakres dat od 1/1/2016 - 17/2/2017)
Średni poziom "akustycznosc" dla calego badanego okresu wynosi wśród użytkowników z Polski 19,7%, dniem w którym polscy uzytkownicy Spotify, sluchali najmniej elektronicznych utworow byl 24/12/2016, co można tłumaczyć wzrostem udziału kolend, które na ogół wykonywane są na tradycyjnych, akustycznych instrumentach.

Valence: Parametr mówiący o poziomie euforyczności piosenki. Im bliższy cyfrze 1 tym bardziej radosny utwór, im bliżej 0 tym mniej pogodny. Z początkiem 2017 nastąpił spadek wartosći Valence, Z zakresu dat 2016-12-01- 2017-02-17, dniem, w którym słuchano najmniej radosnych utworów był 14/2/2017, a drugim w kolejności 16/1/2017 (który został wyznaczony na tzw. Blue Monday).

Można  przypuszczać, że na spadek "euforyczności" 14/02/2017 wpływ ma "Dzień Zakochanych", i potencjalne zwiększenie liczby streamów romantycznych utworów, które można wykorzystać przy kolacji we dwoje lub utworów dedykowanych singlom. Co do Blue Monday, to algorytm wyliczenia najbardziej depresyjnego dnia w roku dnia, uwzględnia m.in czynniki meteorologiczne (krótki dzień, niskie nasłonecznienie), psychologiczne (świadomość niedotrzymania postanowień noworocznych) i ekonomiczne (czas, który upłynął od Bożego Narodzenia powoduje, że kończą się terminy płatności kredytów związanych z zakupami świątecznymi).

 
 
Raport V POROWNANIE SLUCHACZY SPOTIFY Z GB, PL, SE

   Najmniej tanecznej muzyki w okresie od 1/1/2016 -17/2/2017, słuchali Szwedzcy użytkownicy.

 

 WYKORZYSTANE NARZEDZIA - Tableau, R, Sas E.G, Excel,Notepad++
Jeśli masz pytanie, sugestie, pisz śmiało.