Doorgaan naar hoofdnavigatie Doorgaan naar zoeken Ga verder naar hoofdinhoud

Impact of Dataset Characteristics on Optimal Model Selection: A Comparative Analysis of Simulated and Real-World Data

Vertaalde titel van de bijdrage: Impact van datasetkenmerken op optimale modelkeuze: een vergelijkende analyse van gesimuleerde en echte gegevens

Harald H. Rietdijk, Olayemi Shola Alabi, Patricia Conde-Cespedes, Talko B. Dijkhuis, Hilbrand K.E. Oldenhuis, Maria Trocan

Onderzoeksoutput: ChapterAcademicpeer review

Samenvatting

In het snel evoluerende domein van machine learning is het cruciaal om het meest geschikte model voor een bepaalde dataset te selecteren. Inzicht in de kenmerken van een dataset kan een aanzienlijke invloed hebben op de resultaten van voorspellende modellen, waardoor de studie van de eigenschappen van de dataset een essentieel onderdeel van datawetenschap is. Deze studie onderzoekt de mogelijkheden van het gebruik van gesimuleerde menselijke gegevens voor gepersonaliseerde toepassingen, met name voor het testen van clusteringbenaderingen. De studie richt zich in het bijzonder op de relatie tussen de kenmerken van datasets en de selectie van het optimale classificatiemodel voor clusters van datasets. De resultaten van deze studie bieden cruciale inzichten voor onderzoekers en praktijkmensen op het gebied van machine learning, waarbij het belang van datasetkenmerken en variabiliteit bij het bouwen en selecteren van robuuste modellen voor diverse gegevensomstandigheden wordt benadrukt. Het gebruik van menselijke simulatiegegevens biedt waardevolle inzichten, maar moet verder worden verfijnd om de volledige variabiliteit van de werkelijke omstandigheden weer te geven.

Vertaald met DeepL.com (gratis versie)
Vertaalde titel van de bijdrageImpact van datasetkenmerken op optimale modelkeuze: een vergelijkende analyse van gesimuleerde en echte gegevens
Originele taal-2English
TitelProceedings - IEEE International Symposium on Circuits and Systems
UitgeverijInstitute of Electrical and Electronics Engineers
Pagina's1-5
Aantal pagina's5
ISBN van elektronische versie979-8-3503-5683-0
ISBN van geprinte versie979-8-3503-5684-7
DOI's
StatusPublished - 25 mei 2025

Publicatie series

ReeksProceedings - IEEE International Symposium on Circuits and Systems

Duurzame ontwikkelingsdoelstellingen van de VN

Deze output draagt bij aan de volgende duurzame ontwikkelingsdoelstelling(en)

  1. SDG 03 – Goede gezondheid en welzijn
    SDG 03 – Goede gezondheid en welzijn

Keywords

  • machinaal leren
  • gesimuleerde data
  • model selectie
  • gegevenskarakteristieken

Research Focus Areas Hanze University of Applied Sciences

  • Healthy Ageing
  • Ondernemerschap

Research Focus Areas Research Centre or Centre of Expertise

  • Technologie en digitalisering

Publinova thema's

  • Techniek
  • ICT & Media
  • Gezondheid

Vingerafdruk

Duik in de onderzoeksthema's van 'Impact van datasetkenmerken op optimale modelkeuze: een vergelijkende analyse van gesimuleerde en echte gegevens: A Comparative Analysis of Simulated and Real-World Data'. Samen vormen ze een unieke vingerafdruk.

Citeer dit