Eksploracja danych – na pograniczu nauki i inżynierii
Eksploracja danych (ang. data mining) polega na odkrywaniu wiedzy i reguł z danych, które z pozoru nie niosą w sobie żadnych informacji. Narzędziami eksploracji danych są metody statystyczne oraz bardzo ogólnie rozumiane metody sztucznej inteligencji. Dzięki ich wykorzystaniu – można w relatywnie łatwy sposób przekopywać duże zbiory danych, których analiza byłaby niemożliwa dla człowieka. Zbiory te nazywane są strukturami Big Data, które bardzo często określa się po prostu hurtowniami danych. Eksploracja danych wykorzystywana jest powszechnie w nauce, medycynie, biznesie oraz analizach związanych z rynkiem finansowym. Okazuje się, że nawet zupełnie nieświadomi, jesteśmy obiektami generującymi setki gigabajtów danych, które poddać można analizie metodami eksploracji danych i znaleźć w nich ciekawe zależności, które mogą być wykorzystane chociażby do profilowania naszych preferencji i przedstawiania nam produktów i usług, które najlepiej trafią w nasze gusta.
W ramach wykładu przedstawione zostaną dwa przykładowe zastosowania metod eksploracji danych we wspomaganiu rozwiązywania problemów na pograniczu nauki i inżynierii. Pierwszym z nich będzie znajdowanie parametrów opisujących transfer ciepła pomiędzy elementami układu doświadczalnego, służącego do wyznaczania zdolności emisyjnych materiałów kompatybilnych próżniowo w zakresie temperatur pokojowych. Zaprezentowane zostaną wstępne wyniki otrzymane z wykorzystaniem sieci neuronowych oraz omówione zostaną potencjalne szanse na zastosowanie tej metody w rozwiązywaniu praktycznych problemów na styku nauki i inżynierii. Wstępne wyniki porównane zostaną one z wynikami otrzymanymi konwencjonalnymi metodami – z wykorzystaniem symulacji numerycznych oraz analitycznego modelu, dobrze opisującego rzeczywisty układ. Jako drugi przykład zastosowania metod eksploracji danych w nauce, przedstawiony zostanie problem szybkiej klasyfikacji próbek na podstawie zsekwencjonowanego metagenomu bakterii w nich występujących. Dane bardzo słabej jakości poddane zostały obróbce z wykorzystaniem narzędzi do sekwencjonowania, następnie bakterie zostały zidentyfikowane na podstawie porównania sekwencji DNA z wzorcowymi bazami danych i przystąpiono do analizy wyników z wykorzystaniem metod eksploracji danych. Przedstawione zostaną rezultaty prób znalezienia korelacji pomiędzy bakteriami występującymi w próbkach oraz wytypowania bakterii, na podstawie których dokonać można klasyfikacji próbek bez bezpośredniej ingerencji czynnika ludzkiego. Badania te są wciąż w fazie początkowej, tak więc obecne rezultaty nie są jeszcze optymalne, ale ich zamysł świetnie obrazuje praktyczne zastosowanie metod eksploracji danych w zagadnieniach biologicznych, na styku nauki i inżynierii.
mgr inż. Piotr Ablewski – notka biograficzna
Absolwent kierunku informatyka stosowana o specjalizacji sieci komputerowe i inteligencja obliczeniowa na Wydziale Fizyki, Astronomii i Informatyki Stosowanej Uniwersytetu Mikołaja Kopernika w Toruniu. Nauczyciel akademicki, nauczyciel, doktorant w Katedrze Fizyki Atomowej, Molekularnej i Optycznej WFAiIS UMK oraz programista. Obecnie asystent badawczo-dydaktyczny w Katedrze Informatyki Stosowanej Instytutu Nauk Technicznych WFAiIS UMK. Naukowo zajmuje się wykorzystaniem metod numerycznych i eksploracji danych w zagadnieniach na pograniczu informatyki i fizyki, a ostatnimi czasy zainteresowany zagadnieniami związanymi z bioinformatyką, głównie metodami eksploracji danych biologicznych. Prowadzi zajęcia dydaktyczne dla kierunków technicznych, słuchaczy Podyplomowego Studium Programowania i Zastosowań Komputerów przy WFAiIS UMK oraz dla uczniów technikum na kierunku technik informatyk i technik programista. Zawodowo przez wiele lat współpracujący z lokalnymi firmami i Fundacją Aleksandra Jabłońskiego w charakterze programisty i opiekuna projektów, a ostatnimi czasy głównie konsultant technologiczny i programista webowy. W trakcie studiów ściśle współpracujący z firmą Microsoft Polska (udział w projektach: Szkoła Nowych Technologii, Windows Student Trainer oraz Microsoft Student Partner). Od 2015 roku – członek Oddziału Kujawsko-Pomorskiego Polskiego Towarzystwa Informatycznego. Po godzinach wielki pasjonat Gwiezdnych Wojen, kotów, fantastyki naukowej, filozofii nauki oraz pogłębiania swojej wiedzy z zakresu aplikacji webowych, rozwoju systemów operacyjnych, głównie z rodziny GNU/Linux oraz wykorzystania metod eksploracji danych w coraz to bardziej cyfrowym świecie.