{rfName}
Sa

Indexado en

Licencia y uso

Altmetrics

Análisis de autorías institucional

Cuesta-Infante AAutor o Coautor

Compartir

10 de octubre de 2022
Publicaciones
>
Conferencia Publicada
No

Sample, estimate, tune: Scaling Bayesian auto-tuning of data science pipelines

Publicado en:Proceedings - 2017 International Conference On Data Science And Advanced Analytics, Dsaa 2017. 2018-January 361-372 - 2017-01-01 2018-January(), DOI: 10.1109/DSAA.2017.82

Autores: Anderson, Alec; Dubois, Sebastien; Cuesta-Infante, Alfredo; Veeramachaneni, Kalyan

Afiliaciones

MIT, LIDS, 77 Massachusetts Ave, Cambridge, MA 02139 USA - Autor o Coautor
MIT, LIDS, Cambridge, MA, United States - Autor o Coautor
Stanford Univ, Palo Alto, CA 94304 USA - Autor o Coautor
Stanford University, Palo Alto, CA, United States - Autor o Coautor
Univ Ray Juan Carlos, Madrid, Spain - Autor o Coautor
Universidad Ray Juan Carlos, Madrid, Spain - Autor o Coautor
Ver más

Resumen

In this paper, we describe a system for sequential hyperparameter optimization that scales to work with complex pipelines and large datasets. Currently, the state-of-the-art in hyperparameter optimization improves on randomized and grid search by using sequential Bayesian optimization to explore the space of hyperparameters in a more informed way. These methods, however, are not scalable, as the entire data science pipeline still must be evaluated on all the data. By designing a sub sampling based approach to estimate pipeline performance, along with a distributed evaluation system, we provide a scalable solution, which we illustrate using complex image and text data pipelines. For three pipelines, we show that we are able to gain similar performance improvements, but by computing on substantially less data. © 2017 IEEE.

Palabras clave

Advanced analyticsBayesian optimizationDistributed evaluationHyper-parameter optimizationsHyperparametersLarge datasetLarge datasetsOptimizationPipeline performancePipelinesScalable solutionState of the art

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

2025-08-02:

  • WoS: 4
  • Scopus: 7

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2025-08-02:

  • El uso, desde el ámbito académico evidenciado por el indicador de la agencia Altmetric referido como agregaciones realizadas por el gestor bibliográfico personal Mendeley, nos da un total de: 18.
  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 19 (PlumX).

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

  • El Score total de Altmetric: 3.

Análisis de liderazgo de los autores institucionales

Este trabajo se ha realizado con colaboración internacional, concretamente con investigadores de: United States of America.