Data mining io
Plan ćwiczeń:
Zajęcia 1: Analiza i wizualizacja danych, korelacje, wykonywanie podzbiorów (powtórzenie: statystyka, programowanie w R i wizualizacja danych).
Zajęcia 2: Preprocessing danych tabelarycznych oraz szeregów czasowych.
Zajęcia 3: Regresja liniowa i wieloraka, wraz z oceną jakości modeli i prognoz.
Zajęcia 4. Regresja i klasyfikacja: model kNN, wraz z oceną jakości modeli i prognoz (może być także model Naiwnego Klasyfikatora Bayesa).
Zajęcia 5. Drzewa klasyfikacyjne i regresyjne: model C&RT oraz losowy las lub ChAID.
Zajęcia 6. Analiza skupień: model aglomeracyjny oraz k-średnich lub model EM, sieć neuronowa Kohonena.
Zajęcia 7-8. Warsztaty regresyjne dla rzeczywistych danych- praca w grupach.
Zajęcia 9-10. Warsztaty regresyjne/ klasyfikacyjne dla rzeczywistych danych- praca w grupach.
Zadanie w grupach: tutorial do wykonania w grupach 4 osobowych- tematy zostaną podane na 3 zajęciach.
Podstawowe informacje:
- Wykład:
- Udział w wykładach jest nieobowiązkowy- wykład odbywa się on-line na platformie MS Teams.
- Nagrywanie wykładu wyłącznie za zgodą prowadzącego.
- Wiedza z wykładu jest niezbędna do rozwiązywania zadań na ćwiczeniach (w przypadku nieprzygotowania do ćwiczeń- mogą się odbywać na ćwiczeniach kartkówki z wykładu.
- Treść wykładu- prezentacja w języku angielskim.
- Ćwiczenia:
- Zajęcia odbywają się hybrydowo- 6 lub 7 spotkań on-line na platformie MS Teams, 1 lub 2 spotkania po 4-6h lekcyjnych- warsztaty data miningowe (liczba warsztatów oraz termin spotkania zostanie ustalony ze starostą lub reprezentantem grup).
- Ćwiczenia odbywają się z wykorzystaniem języka R i RStudio (wyłącznie).
- Student może mieć 1 nieobecność nieusprawiedliwioną (3h lekcyjne!!!).
- W przypadku większej liczby nieobecności (ale niższej niż 50%), zaległości muszą zostać odrobione- wykonanie sprawozdania wraz z interpretacją- oddanie sprawozdania najpóźniej na 1 zajęciach po ustaniu nieobecności.
- Na ocenę końcową z ćwiczeń składa się: Case Study (80%), Tutorial lub Zadanie domowe z preprocessingu (15%), kartkówki (5%). Aby uzyskać ocenę pozytywną należy uzyskać minimum 50% z Case Study i minimum 50% punktów możliwych do uzyskania w trakcie semestru.
- Ocena końcowa z ćwiczeń- jej termin zależy od terminu spełnienia wszystkich wymagań odnośnie zaliczenia przedmiotu (I termin- do końca zajęć, II termin- do końca podstawowej sesji, III termin- do końca sesji poprawkowej).
- Nie ma możliwości logowania się na zajęcia nie swojej grupy (brak obecności z zajęć).
- Przeszkadzanie na zajęciach skutkuje obniżeniem oceny końcowej z ćwiczeń o 10% za każde upomnienie.
- Nieaktywność na zajęciach, brak odpowiedzi na wywołanie do odpowiedzi jest równoważne z brakiem obecności na ćwiczeniach!!!
- Aktywność na ćwiczeniach może być nagrodzona dodatkowymi punktami do oceny końcowej z ćwiczeń.
- Ważne:
- W przypadku gdy według sylabusa i planu zajęć część metod lub algorytmów się powtarza z innymi zajęciami proszę o informację (możliwość dopasowania tematów zajęć).
- Materiały do ćwiczeń, wykładów, ciekawe tutoriale, dokumentacje techniczne będą dostępne na kanale zajęć na MS Teams.