MusicCaps - это большой набор данных, включающий 5 500 музыкальных фрагментов, каждый длительностью 10 секунд и сопровождающихся списком описаний звуков и свободным текстом, написанным музыкантами. Набор данных лицензируется в соответствии с Creative Commons BY-SA 4.0 и поставляется из AudioSet, с метаданными для каждого фрагмента, включая YT ID, ID автора и другие. Он идеально подходит для задач описания музыки и разделен на обучающий и проверочный наборы данных.