MOKSLINIŲ TYRIMŲ AR SKLAIDOS PROJEKTAI

Lietuvos mokslo tarybos gautų paraiškų, vykdytų ir vykdomų projektų sąvadas

 

Projekto anotacija
Geometrinis metodas daugiamačių skalių uždaviniui spręsti

Tyrimo tikslas - sukurti naują daugiamačių duomenų vizualizavimo metodą, grindžiamą MDS (daugiamatės skalės) stress funkcijos optimizavimu pradinėje daugiamatėje erdvėje, leisiantį sumažinti MDS optimizavimo uždavinio daugiaektremiškumą. Šiuolaikinės technologijos generuoja milžiniškus duomenų kiekius. siekiant geriau suvokti šiuos duomenis būtina juos vizualizuoti. Vieną tokių metodų grupę sudaro duomenų dimensijos mažinimu pagrįsti metodai. Daugiamačių duomenų vizualizavimas tyrėjui leidžia lengviau suvokti duomenis, aprašančius sudėtingus objektus ar reiškinius, ir priimti tinkamus sprendimus. Galimi įvairūs duomenų vizualizavimo būdai. Jie leidžia stebėti duomenų panašumus, jų grupavimosi tendencijas bei išskirtis. Projekto metu numatoma įgyvendinti dimensijos mažinimu pagrįsto vizualizavimo metodo idėją, kai ieškoma daugiamačių taškų projekcijos plokštumoje, esančioje tos pačios dimensijos erdvėje, kaip ir patys daugiamačiai taškai. Nors duomenų dimensijos mažinimo problema sprendžiama kone du dešimtmečius, ji iki šiol nebuvo sėkmingai išspręsta. Šio projekto idėja grindžiama visiškai kitu požiūriu į duomenų dimensijos mažinimą taikant MDS, kuomet MDS streso funkcija minimizuojama. Naujojo metodo idėja: pasirinktų plokštumoje taškų "judinimas". Pradiniai tyrimai parodė, kad pasirinkus plokštumos tašką analitiškai galima surasti jo naują vietą  streso funkcijai mažėjant. Analogiškai bus galima surasti sritis plokštumoje, kurios judės globalaus streso funkcijos minimumo link.


Geometric method for the solving of a problem of multidimensional scaling

This research aims to create a new method for multidimensional data visualization based on the geometric optimization of the MDS stress function. Modern technology generates enormous amounts of data. In order to use human cognitive capabilities for the perception of these data, it is necessary to visualize these data. One such way of visualization is to reduce the data dimensionality to two and to represent the projection points in a two-coordinate system (on a plane). The methods of multidimensional data visualization are intensively developed to increase the efficiency of data mining in order to better understand them and to more objectively evaluate the results of data mining and analysis, also through the use of human cognitive abilities. Multidimensional scaling (MDS) is the most popular dimensionality reduction- based method for data visualization, the aim of which is to find such coordinates of the projection points on the plane that the distances between these points would remain as similar as possible to the distances between their corresponding points on the initial multidimensional space. Even though the multidimensional scaling problem was addressed by a few decades ago, this problem remains relevant nowadays. The idea of the project is based on a completely different approach to the classic multidimensional data visualization task using Multidimensional scaling (MDS), when a certain MDS stress function is minimized. The idea of a new method is based on a consistent "moving" of individual points on the plane. Initial studies have shown that one single point taken from a plane can be used to analytically find a new position where the stress function decreases. To minimize the stress function, it is not necessary to calculate its values, derivatives, as well as the steps necessary for the other classical optimization algorithms. Initial studies are promising to be able to localize also areas on the plane, from which there is a possible movement towards a global minimum of stress function. This would be a breakthrough in the field of nonlinear visualization of multidimensional data.