{rfName}
CS

Licencia y uso

Altmetrics

Análisis de autorías institucional

Cuesta MAutor (correspondencia)Lancho C.Autor o CoautorFernandez-Isabel A.Autor o CoautorCano E.l.Autor o CoautorMartín de diego I.Autor o Coautor

Compartir

8 de enero de 2024
Publicaciones
>
Artículo
No

CSViz: Class Separability Visualization for high-dimensional datasets

Publicado en:Applied Intelligence. 54 (1): 924-946 - 2024-01-01 54(1), DOI: 10.1007/s10489-023-05149-4

Autores: Cuesta, Marina; Lancho, Carmen; Fernandez-Isabel, Alberto; Cano, Emilio L; De Diego, Isaac Martin

Afiliaciones

Data Science Laboratory, Rey Juan Carlos University, c/ Tulipán, s/n, Móstoles, 28933, Spain - Autor o Coautor
Rey Juan Carlos Univ, Data Sci Lab, C Tulipan S-N, Mostoles 28933, Spain - Autor o Coautor

Resumen

Abstract: Data visualization is an essential task during the lifecycle of any Data Science (DS) project, particularly during the Exploratory Data Analysis (EDA) for a correct data preparation and understanding. In classification problems, data visualization is useful for revealing the existence of class separability patterns within the dataset. This information is very valuable and can be later used during the process of building a Machine Learning (ML) model. High-Dimensional Data (HDD) arise as one of the biggest challenges in DS. HDD require special treatment since traditional visualization techniques, such as the scatterplot matrix (SPLOM), have limitations when dealing with them due to space restrictions. Other visualization methods involve dimensionality reduction techniques, which can lead to losing important information and reducing the interpretability of the data. In this paper, the Class Separability Visualization (CSViz) method is introduced as a new Visual Analytics (VA) approach to address the challenge of visualizing labeled HDD through subspaces. The proposed method enables an overview of the class separability offering a series of 2-Dimensional subspaces visualizations containing exclusive subsets of points of the original variables that encompass the most valuable and significant separable patterns. The proposed method is tested over 50 datasets with different characteristics providing promising results. In all cases, more than 90% of the data observations are shown with three plots or less. Hence, the presented CSViz significantly eases the EDA by reducing the number of plots to be inspected in a SPLOM and thus, the amount of time invested in it. Graphical Abstract: CSViz graphical abstract[Figure not available: see fulltext.]. © 2023, The Author(s), under exclusive licence to Springer Science+Business Media, LLC, part of Springer Nature.

Palabras clave

analyticsclass separabilityclassificationhigh-dimensional datasub-dimensional spacevisual analyticsClass separabilityData visualizationHigh-dimensional dataSub-dimensional spaceVisual analyticsVisual exploration

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista Applied Intelligence debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2024 aún no existen indicios calculados, pero en 2023, se encontraba en la posición 84/204, consiguiendo con ello situarse como revista Q2 (Segundo Cuartil), en la categoría Computer Science, Artificial Intelligence. Destacable, igualmente, el hecho de que la Revista está posicionada en el Cuartil Q2 para la agencia Scopus (SJR) en la categoría Artificial Intelligence.

2025-08-06:

  • WoS: 1
  • Scopus: 1

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2025-08-06:

  • El uso, desde el ámbito académico evidenciado por el indicador de la agencia Altmetric referido como agregaciones realizadas por el gestor bibliográfico personal Mendeley, nos da un total de: 4.
  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 8 (PlumX).

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

  • El Score total de Altmetric: 8.45.
  • El número de menciones en la red social X (antes Twitter): 10 (Altmetric).

Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (Cuesta Santa Teresa, Marina) y Último Autor (Martín de Diego, Isaac).

el autor responsable de establecer las labores de correspondencia ha sido Cuesta Santa Teresa, Marina.