{rfName}
Ne

Indexado en

Licencia y uso

Icono OpenAccess

Citaciones

Altmetrics

Análisis de autorías institucional

Reyes Salgado, GerardoAutor o Coautor

Compartir

14 de junio de 2024
Publicaciones
>
Artículo

Neural Architecture Comparison for Bibliographic Reference Segmentation: An Empirical Study

Publicado en:Data. 9 (5): 71- - 2024-05-01 9(5), DOI: 10.3390/data9050071

Autores: Hidalgo, RC; Elias, RP; Torres-Moreno, JM; Villegas, OOV; Salgado, GR; Salazar, AM

Afiliaciones

Biblioteca Daniel Cosio Villegas, Colegio Mexico, Carretera Picacho Ajusco 20, Mexico City 14110, Mexico - Autor o Coautor
Tecnol Nacl Mexico CENIDET, Cuernavaca 62490, Mexico - Autor o Coautor
Univ Autonoma Ciudad Juarez, Ind & Mfg Engn Dept, Ciudad Juarez 32310, Mexico - Autor o Coautor
Univ Avignon, Lab Informat Avignon, 339 Chemin Meinajaries, F-84911 Avignon 9, France - Autor o Coautor
Univ Rey Juan Carlos, Dept Informat & Estadist, Ave Alcalde de Mostoles, Madrid 28933, Spain - Autor o Coautor
Ver más

Resumen

In the realm of digital libraries, efficiently managing and accessing scientific publications necessitates automated bibliographic reference segmentation. This study addresses the challenge of accurately segmenting bibliographic references, a task complicated by the varied formats and styles of references. Focusing on the empirical evaluation of Conditional Random Fields (CRF), Bidirectional Long Short-Term Memory with CRF (BiLSTM + CRF), and Transformer Encoder with CRF (Transformer + CRF) architectures, this research employs Byte Pair Encoding and Character Embeddings for vector representation. The models underwent training on the extensive Giant corpus and subsequent evaluation on the Cora Corpus to ensure a balanced and rigorous comparison, maintaining uniformity across embedding layers, normalization techniques, and Dropout strategies. Results indicate that the BiLSTM + CRF architecture outperforms its counterparts by adeptly handling the syntactic structures prevalent in bibliographic data, achieving an F1-Score of 0.96. This outcome highlights the necessity of aligning model architecture with the specific syntactic demands of bibliographic reference segmentation tasks. Consequently, the study establishes the BiLSTM + CRF model as a superior approach within the current state-of-the-art, offering a robust solution for the challenges faced in digital library management and scholarly communication.

Palabras clave

BilstmByte-pair encodingConditional random fieldConditional random fieldsReference miningTransformers

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista Data debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2024 aún no existen indicios calculados, pero en 2023, se encontraba en la posición 59/135, consiguiendo con ello situarse como revista Q2 (Segundo Cuartil), en la categoría Multidisciplinary Sciences. Destacable, igualmente, el hecho de que la Revista está posicionada en el Cuartil Q2 para la agencia Scopus (SJR) en la categoría Information Systems and Management.

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2025-10-03:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 5 (PlumX).

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

    Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

    • El trabajo se ha enviado a una revista cuya política editorial permite la publicación en abierto Open Access.

    Análisis de liderazgo de los autores institucionales

    Este trabajo se ha realizado con colaboración internacional, concretamente con investigadores de: France; Mexico.