Specjalność studiów I i II stopnia
Oferta dydaktyczna IAiR

Odkrywanie wiedzy

fakultatywny ograniczonego wyboru

Cel

Zapoznanie z podstawowymi pojęciami, metodami odkrywania wiedzy, algorytmami i technologią eksploracji danych.

Opis

Wprowadzenie do tematu eksploracji danych. Problematyka związana z odkrywaniem asocjacji. Odkrywanie wzorców sekwencji.
Grupowanie. Eksploracja tekstu. Eksploracja sieci Web. Laboratoria:
Głównym zadaniem laboratorium jest ilustracja zagadnień przedstawianych podczas wykładu.
Laboratorium 1.
Proces przygotowaniu danych, które mają zostać poddane procesowi eksploracji. (2 godz.) Omówienie zagadnień związanych z wstępnym przetwarzaniem danych, takie jak dyskretyzacja, normalizac
Laboratorium 2.
Eksploracja danych tekstowych. (2 godz.)

Zaliczenie (1 godz.).

Wymagania

Podstawowe wiadomości z zakresu:
- systemów baz danych,
- magazynów danych,
- analizy danych.

Bibliografia

  1. Systemy uczące się, P. Cichosz, WNT, 2000
  2. Odkrywanie asocjacji: Algorytmy i struktury danych, T. Morzy, OWN, 2004
  3. Data Mining: Concepts and Techniques, J. Han, M. Kamber, Morgan Kaufman, 2000
  4. Pricinciples of Data Mining, J. Hand, H. Mannila, P. Smyth, MIT Press, 2001

Metody oceny

Zaliczenie treści wykładów: test (40%) + referat (20%)
Zaliczenie laboratoriów: 40%

Szczegółowy rozkład zajęć

Nr Temat Opis Wymiar
1 Wprowadzenie Podstawowe zagadnienia związane z dziedziną eksploracji danych, główne kierunki rozwoju oraz metody eksploracji danych. Możliwości zastosowań w świecie rzeczywistym.

W 2
2 Odkrywanie asocjacji Wprowadzenie do problematyki odkrywania asocjacji, sformułowanie problemu, typy reguł asocjacyjnych, korelacje vs asocjacje.
W 4
3 Sekwencje Sformułowanie problemu odkrywania wzorców sekwencji, uogólnione wzorce sekwencji.
W 2
4 Klasyfikacja Problematyka klasyfikacji. sformułowanie problemu klasyfikacji, metody klasyfikacji, kryteria oceny metod klasyfikaji,  kryteria podziału. Indeks Gini oraz zysk Informacyjny. Dokładność klasyfikacji.

W 2
5 Grupowanie Wprowadzenie do problemu grupowania, klasyfikacja metod grupowania, metody grupowania hierarchicznego,  metody grupowania iteracyjno-optymalizacyjne
W 2
6 Eksploracja tekstu Wprowadzenie do problemu eksploracji tekstu, wyszukiwanie dokumentów, reprezentacje tekstu, ukryte indeksowanie semantyczne SVD, struktury danych.
W 2
7 Eksploracja sieci Web Eksploracja sieci Web. Podstawowe algorytmy rankingu stron. Eksploracja logów.
W 1
1 Laboratorium Proces przygotowaniu danych, które mają zostać poddane procesowi eksploracji. Omówienie zagadnień związanych z wstępnym przetwarzaniem danych, takie jak dyskretyzacja, normalizacja. Przykład klasyfikacji.  Przykład grupowania.  Eksploracja danych tekstowych.
L 15
Instytut Automatyki i Robotyki
Politechnika Warszawska