Synteettinen data

Wikipediasta
Siirry navigaatioon Siirry hakuun

Synteettinen data on aineistoa, joka on keinotekoisesti luotu, eikä sitä ole tuotettu todellisista ilmiöistä tai havainnoista.[1]. Synteettistä dataa luodaan tyypillisesti algoritmien avulla, ja sitä voidaan käyttää matemaattisten mallien toimivuuden varmistamiseen ja koneoppimismallien kouluttamiseen[1] Synteettistä dataa käytetään monilla eri aloilla tietojen suojaamiseen. Tämä on tarpeen, koska muutoin tietojen luottamuksellisuus vaarantuisi. Vaikka arkaluonteisia tietokokonaisuuksia on olemassa, niitä ei voida luovuttaa suurelle yleisölle tietosuojasyistä[2]. Tämänkaltaisia tietoja ovat mm. potilasrekisterit, pankkitiedot ja sotilastiedustelutiedot[2].

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. a b Yasar, Kinza & Laskowski, Nicole: What is synthetic data? - Definition SearchCIO. Viimeksi päivitetty maaliskuussa 2023.. TechTarget. Arkistoitu 3.12.2023. Viitattu 27.2.2024. (englanniksi)
  2. a b Nikolenko, Sergey I.: Synthetic Data for Deep Learning. Osa kirjasarjaa: Springer Optimization and Its Applications (SOIA), osa: 174. Springer, 2021. ISBN 978-3-030-75177-7. Kustantajan verkkosivut (viitattu 27.2.2023). doi:10.1007/978-3-030-75178-4. (englanniksi)