{rfName}
Ly

Indexado en

Licencia y uso

Citaciones

1

Altmetrics

Análisis de autorías institucional

Fresno V.Autor o Coautor

Compartir

13 de febrero de 2025
Publicaciones
>
Otro tipo de publicación en revista
No

LyricSIM: A novel dataset and benchmark for similarity detection in Spanish song lyrics

Publicado en:Procesamiento De Lenguaje Natural. (71): 149-163 - 2023-09-01 (71), DOI: 10.26342/2023-71-12

Autores: Benito-Santos A; Ghajari A; Hernández P; Fresno V; Ros S; González-Blanco E

Afiliaciones

IE Universidad - Autor o Coautor
Universidad de Salamanca - Autor o Coautor
Universidad Nacional de Educación a Distancia - Autor o Coautor

Resumen

In this paper, we present a new dataset and benchmark tailored to the task of semantic similarity in song lyrics. Our dataset, originally consisting of 2775 pairs of Spanish songs, was annotated in a collective annotation experiment by 63 native annotators. After collecting and refining the data to ensure a high degree of consensus and data integrity, we obtained 676 high-quality annotated pairs that were used to evaluate the performance of various state-of-the-art monolingual and multilingual language models. Consequently, we established baseline results that we hope will be useful to the community in all future academic and industrial applications conducted in this context.

Palabras clave

Annotation taskBenchmarkCultural heritageDatasetSemantic textual similaritySong lyrics

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista Procesamiento De Lenguaje Natural debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia Scopus (SJR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2023, se encontraba en la posición , consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Linguistics and Language.

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2025-08-02:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 7 (PlumX).