Como o Spotify usa modelos de aprendizado de máquina para recomendar músicas?
Publicados: 2021-03-04O Spotify é um dos principais aplicativos de música que usa previsões e recomendações inteligentes para seus usuários. Já se foram os dias em que costumávamos pesquisar, baixar e selecionar manualmente nossas listas de reprodução para se adequar ao nosso gosto. A era atual de Machine Learning e Data Science possibilitou que aplicativos como o Spotify entendessem o gosto e os gostos dos usuários e recomendassem músicas e listas de reprodução selecionadas.
Ao final deste tutorial, você terá conhecimento do seguinte:
- Spotify e seus recursos exclusivos
- Como o Spotify faz previsões inteligentes
- O aprendizado de máquina por trás disso
Índice
Spotify – O Gênio da Música
No início dos anos 2000, a melhor e mais conveniente maneira de baixar e ouvir música era por meio de sites de terceiros ou por pirataria. Ambos exigiram tempo e esforço para primeiro pesquisar a música e depois baixá-la. Ainda mais, a dor era criar playlists contendo as músicas favoritas. E essas eram listas de reprodução estáticas. Isso significava que uma lista de reprodução permaneceria como está, a menos que o usuário adicionasse ou removesse manualmente as músicas de acordo com sua preferência. Não é tão conveniente.
Outra desvantagem foi da perspectiva do artista. Os artistas populares não enfrentaram muitos problemas para comercializar seus novos lançamentos, pois estavam em todas as paradas em todo o mundo. Mas os artistas novos e independentes enfrentaram muitos problemas para levar sua música a um público amplo que gostaria da música que estão criando. Isso significava que muitos artistas potencialmente assassinos nunca foram capazes de se dar bem ou tiveram que se render às gravadoras hostis.
Spotify mudou o jogo. Lançado em 2008 na Suécia, o Spotify tinha como objetivo transformar a indústria de streaming de música no mainstream. Hoje, o Spotify possui cerca de 345 milhões de usuários ativos mensalmente. O Spotify aproveita o aprendizado de máquina e a ciência de dados em sua essência e faz recomendações e listas de reprodução selecionadas para seus ouvintes com base nos dados que coleta de seus hábitos de escuta, localização, idade e muito mais.
Os ouvintes agora não precisam perder tempo pesquisando e baixando manualmente músicas de seu gosto. Eles agora recebem playlists feitas especialmente para eles. Além disso, eles são expostos a novas músicas e artistas toda semana que de outra forma não teriam descoberto. Isso também é feito usando Machine Learning.

Não só isso, mas os artistas também levam vantagem agora. Os artistas obtêm o público que não teriam de outra forma. A música deles é automaticamente recomendada para os ouvintes que gostam desse tipo de música. Então, é um ganha-ganha! Agora, vamos ver como os modelos de Machine Learning são aproveitados.
Participe do curso de ML online das melhores universidades do mundo - mestrados, programas de pós-graduação executiva e programa de certificação avançada em ML e IA para acelerar sua carreira.
Como o Spotify aproveita o aprendizado de máquina e a ciência de dados?
O Spotify oferece quatro recursos principais para seus usuários, aproveitando o Machine Learning. Esses incluem:
- Playlist da Home Page: É a recomendação de playlist que aparece na home page assim que o usuário abre o app.
- Discover Weekly: É uma recomendação de playlist semanal que é atualizada com novas músicas com base no gosto do ouvinte.
- Daily Mix: É uma playlist diária que consiste nas músicas mais tocadas e curtidas do ouvinte.
- Time Capsule: É uma playlist mista contendo clássicos antigos e outras músicas retrô populares.
Destes, o recurso Discover Weekly é o principal recurso que o Spotify oferece. Ele usa modelos baseados em Machine Learning e Big Data que recomendam 50 novas músicas em uma lista de reprodução selecionada todas as segundas-feiras. Isso ajudou o Spotify a chegar onde está hoje. Esse recurso não apenas vincula as pessoas ao aplicativo, mas também gera ainda mais dados e, portanto, as recomendações melhoram com o tempo.
Para o Discover Weekly, o Spotify reúne muitos dados específicos do usuário para entender o comportamento e a satisfação com a playlist selecionada. Considera dados como quanto tempo o usuário passou na playlist, o número de vezes que as músicas foram tocadas, o tempo gasto no álbum daquela música ou na página do artista, se o usuário pulou uma música ou não, se o o usuário o salvou em uma lista de reprodução pessoal ou não, e se o usuário voltou para a página Discover Weekly ou não. O Spotify usa 3 tipos de modelos que alimentam sua página Discover Weekly:

- Filtragem Colaborativa: A Filtragem Colaborativa é um componente chave em qualquer sistema de recomendação. A Netflix também usa um e usa o sistema de classificação para recomendar filmes. O Spotify, por outro lado, não usa nenhum sistema de classificação, mas depende das métricas de comportamento do usuário para ver se o ouvinte está satisfeito com a recomendação ou não.
- Processamento de linguagem natural: o Spotify aproveita a PNL para entender a linguagem que está sendo usada pelos ouvintes e revisores em todo o mundo para as músicas. Seu sistema de PNL continua rastreando a web em busca de qualquer texto disponível na forma de postagens de blog, resenhas e quaisquer outros metadados disponíveis. As palavras-chave são extraídas e então atribuídas à música como representações vetoriais para ela. Artistas semelhantes mencionados no blog também são incluídos na seção de artistas semelhantes. O sistema de PNL também atribui pesos a certos vetores que são usados várias vezes no blog para aquele artista específico. Ele também mantém um registro das palavras de tendência que estão sendo usadas e sua emoção/sentimento também. Ele também usa técnicas de incorporação de palavras como Word2Vec para agrupar músicas semelhantes com base em suas letras e tags associadas a elas.
- Modelos de áudio: Além da análise baseada em texto, o Spotify também incorpora modelos de áudio baseados em redes neurais convolucionais. Esses dados brutos ajudam o modelo a agrupar a música e ver o quão perto ela está do gosto do usuário. Os modelos da CNN analisam diferentes características das músicas, como volume, frequência, andamento, batidas por minuto, composição, gênero, etc. Portanto, músicas com ritmos, tom e composição semelhantes serão classificadas como altas nas tabelas de recomendação para o usuário.
Relacionado: modelos de aprendizado de máquina
Oportunidades futuras
Embora o Spotify tenha se saído muito bem no espaço de recomendação, ainda precisa melhorar na área de recomendação personalizada. A lacuna entre a satisfação real do usuário e o que o modelo de Machine Learning pensa que é a satisfação precisa ser fechada. Eles adquiriram uma startup francesa Niland em 2017 para melhorar sua tecnologia de personalização.

Isso melhorou significativamente o desempenho das recomendações fazendo com que os usuários pegassem as músicas de acordo com seu gosto. O Spotify também pode estar procurando convertê-lo em mais uma plataforma de mídia social para compartilhar músicas e listas de reprodução de uma maneira melhor.
Leia também: Ideias e tópicos de projetos de aprendizado de máquina
Antes de você ir
Com cada vez mais usuários se inscrevendo, os dados com os quais o Spotify lida aumentarão significativamente nos próximos anos. Isso não significa apenas uma oportunidade melhor para recomendações aprimoradas, mas também um desafio para lidar com tantos dados. Com um poder tão imenso, os dados do Spotify serão fundamentais para as gravadoras e gravadoras, bem como para tomar decisões de negócios importantes com base no que as pessoas estão ouvindo e gostando. Esta será uma estratégia de criação de música direcionada para maximizar as escutas entre os usuários.
O Spotify também pode transformar sua seção de Podcasts para torná-la muito melhor na recomendação de novos podcasts aos ouvintes. Podcasts que falam sobre temas e tópicos semelhantes podem ser agrupados e usados em recomendações. Com a crescente concorrência de aplicativos como Apple Music e YouTube Music, será interessante ver como o espaço de tecnologia da música se desenvolve ao longo dos anos.
Se você estiver interessado em saber mais sobre árvores de decisão, aprendizado de máquina, confira o Programa PG Executivo do IIIT-B e do upGrad em Machine Learning e IA , projetado para profissionais que trabalham e oferece mais de 450 horas de treinamento rigoroso, mais de 30 estudos de caso e atribuições, status de ex-alunos do IIIT-B, mais de 5 projetos práticos práticos e assistência de trabalho com as principais empresas.