Анализ данных предсказывает, кто станет поп-звездой

Распознавание музыки — приятная игрушка, которой с удовольствием пользуются меломаны со всего мира. Подобный сервис предоставляет несколько известных компаний, и некоторые извлекают из этой бесплатной услуги большую выгоду — огромное количество данных о предпочтениях людей по всему свету. Основными игроками в данной сфере являются Shazam, SoundHound и musiXmatch. Но у Shazam конкурентное преимущество — на основе своей неуклонно растущей базы данных компания предсказывает, что будет популярно в будущем году. Хотя порой в эти списки попадают певцы, которые вовсе не успели заявить о себе всему миру. 

action-bronson-shazam-970x0

С помощью приложения от Shazam можно загрузить часть песни — она может быть фрагментом теле- или радиопередачи, или быть записанной на мобильный телефон прямо на улице — и узнать ее название. Достаточно 5-15 секунд записи, чтобы определить исполнителя песни, ее название, альбом и даже получить ссылки на Youtube или iTunes. Ежедневно пользователи идентифицируют при помощи Shazam около 15 миллионов композиций, а в базе хранится более 5 миллиардов пользовательских тэгов. Эти данные и использует компания, чтобы предсказать артистов, которые станут популярными в будущем году. Shazam делает это довольно успешно — прогнозы относительно коллективных музыкальных предпочтений этого и предыдущего года действительно сбывались.

В основе такого прогноза, что неудивительно, лежит анализ данных. Само собой, подобно другим сервисам, Shazam собирает отзывы пользователей о тех или иных треках. Но этим дело не ограничивается. Вместо того, чтобы полагаться на положительную или отрицательную оценку потребителя, Shazam комбинирует отзывы с поведением тех пользователей, которые ищут музыку с помощью его сервиса. Одна из статей дохода компании — возможность слушателя перейти на iTunes или Amazon, чтобы купить найденную песню. Таким образом, цель компании — не помочь аудитории найти музыку, а помочь музыке найти аудиторию. Но это еще и ценная информация о музыкальных предпочтениях слушателя — готовность заплатить из собственного кармана добавляет еще один плюсик к популярности исполнителя. 

Как Shazam ищет песню? Говоря простым языком, приложение прослушивает композицию, разлагая ее на частоты и амплитуды, вычленяет «интересные» моменты, характеризующие трек и генерирует уникальную «цифровую подпись». 

Анализ данных предсказывает, кто станет поп-звездой

Затем этот снимок отправляется на сервер и сопостовляется с огромной базой данных. Само собой, хранить миллионы песен «целиком», да еще и осуществлять поиск по ним — задача на данном технологическом этапе нереальная. Поэтому в базе Shazam также сохранены только картины интенсивных звуков и их частот. Типичная спектрограмма проиллюстрирована на рисунке — горизонтальная ось обозначает время звучания, а вертикальная — его частоту. Интенсивность цвета каждой из точек кодирует амплитуду звука — чем темнее точка, тем громче звук. Поиск по опорным точкам дает возможность правильно обработать даже записи, на которые накладывается интершум. Кстати, мало кто знает, что на радио порой звучат песни со слегка измененной длительностью — диджеи вынуждены слегка замедлять или ускорять воспроизведение, чтобы уложиться в заданный интервал. Поэтому вычислить песню, записанную на радио, обычным сравнением довольно проблематично. Но поиск по спектрограммам Shazam решает и эту задачу.

Очень важен в работе Shazam и тот факт, что компания собирает географические метки своей аудитории. А это значит, что можно заранее определить, что будет популярно в данной конкретной области. Третьи лица, которым компания передает свою информацию, могут доработать свои предложения с учетом реальной картины, которая куда точнее любых опросов. Рекламодатели, музыкальные промоутеры и СМИ могут использовать данных Shazam, чтобы оценивать успехи своих кампаний и мероприятий.

Shazam использует различные облачные сервисы, дабы обеспечить необходимую масштабируемость, а также интеграцию своих офисов, разбросанных по всему свету. Используется Rackspace и Amazon, а также ряд других облачных провайдеров. Чтобы обеспечить анализ данных в реальном времени, планируется использовать платформу Hadoop, поскольку нарастающий темп роста требует мощных решений. Стоит отметить, что создатели и руководители компании связывают бурное развитие компании именно с активным использованием open source решений.

Итак, вместо бесплодного умствования журналистов и музыкальных критиков, будущие музыкальные тенденции будут предсказываться математическими алгоритмами и «большими данными». Например, результатами активности 400 миллионов меломанов. Самые смелые эксперты уже пророчат в этой связи смерть музыкальной журналистики. Впрочем, вряд ли мнение масс действительно будет столь же ценным и непререкаемым, сколь мнения профессиональных экспертов. Но вот любителям легких прогнозов, вероятно, придется потесниться...



Ирина Парошина, Компьютерра





Интересные новости
Українські хакери вразили російські підприємства до Дня РЕБ РФУкраїнські хакери вразили російські підприємства до Дня РЕБ РФ
Ілон Маск хоче брати гроші з нових користувачів XІлон Маск хоче брати гроші з нових користувачів X
Блок рекламы


Похожие новости

Японские ученые установили мировой рекорд скорости передачи данныхЯпонские ученые установили мировой рекорд скорости передачи данных
Киберпреступники массово рассылают опасные письма для похищения данных и пугают «химической атакой» — ГосспецсвязиКиберпреступники массово рассылают опасные письма для похищения данных и пугают «химической атакой» — Госспецсвязи
Зафиксирована новая кибератака, направленная на кражу данных украинцевЗафиксирована новая кибератака, направленная на кражу данных украинцев
У авиции РФ очередная беда: хакеры безвозвратно "убили" базу данных РосавиацииУ авиции РФ очередная беда: хакеры безвозвратно "убили" базу данных Росавиации
Хакеры Anonymous взломали базу данных NestleХакеры Anonymous взломали базу данных Nestle
Meta считает, что смешанная реальность станет широко доступной в течение нескольких летMeta считает, что смешанная реальность станет широко доступной в течение нескольких лет
Киберполиция отрицает утечку персональных данных украинцев из “Дії”Киберполиция отрицает утечку персональных данных украинцев из “Дії”
В сети продают базу данных 2 млн украинцев якобы из "Дии". Минцифры выясняет ситуациюВ сети продают базу данных 2 млн украинцев якобы из "Дии". Минцифры выясняет ситуацию
Информация о продаже данных украинцев из "Дии" является элементом гибридной войны, – МинцифрыИнформация о продаже данных украинцев из "Дии" является элементом гибридной войны, – Минцифры
Во время хакерской атаки на правительственные сайты утечки персональных данных не было, - СБУВо время хакерской атаки на правительственные сайты утечки персональных данных не было, - СБУ
Последние новости

Подгружаем последние новости