Program

Kurs programowania R i analizy danych

Każdy może rozpocząć swoją karierę jako analityk - Data Scientist!
Dedykujemy go osobom, które chcą nauczyć się programowania w R i podstaw analizy danych.
Język programowania oraz środowisko R świetnie nadają się do analizy danych, obliczeń statystycznych oraz wizualizacji wyników. Jest to język oferujący dostęp do olbrzymich zasobów darmowego oprogramowania analitycznego i jest on niekwestionowanym liderem w Data Science, a w szczególności bioinformatyce.

Opis bloków kursu

BLOK 1 - Hello woRld!

Nauczymy podstaw programowania, korzystania z R za pomocą edytora RStudio. Dowiesz się co to są zmienne, jakie są ich rodzaje i jak ich używać. Każdy napisze swój pierwszy program.

Kluczowa nabyta wiedza:

  • podstawy programowania:
    ◦ co to jest język programowania, omówienie funkcjonalności RStudio
  • pakiety:
    ◦ co to są pakiety, jak się je instaluje i używa
  • pomoc
    ◦ skąd samodzielnie brać informacje na temat działania poszczególnych pakietów i programów
  • podstawowe typy zmiennych
    ◦ typy danych, tworzenie zmiennych i operacje na nich,

BLOK 2 - Co to są stringi dla programisty?

Nauczymy o typach danych w R. Jak je tworzyć, modyfikować, wywoływać i przeprowadzać operacje. Użyjemy języka programowania R jako kalkulatora.

Kluczowa nabyta wiedza:

  • jakie są typy danych:
    ◦ numeryczne, tekstowe, wektory, ramki danych, tabele zliczeń, listy, faktory
    ◦ jak je tworzyć, modyfikować i wykonywać na nich operacje
  • obliczenia:
    ◦ podstawowe funkcje matematyczne w R

BLOK 3 - Co R ma wspólnego z rodeo?

Nauczymy jak napisać własną funkcję w R. Wyjaśnimy co to jest pętla i dlaczego ona jest bardzo przydatna.

Kluczowa nabyta wiedza:

  • instrukcje warunkowe:
    ◦ rodzaje instrukcji warunkowych, ich składnia w R i zastosowanie
  • pętle
    ◦ co to jest pętla, jaka jest jej składnia w R i do czego jej używać
    ◦ rodzaje pętli: for(), while()
    ◦ rodzina funkcji apply()
  • pisanie funkcji:
    ◦ jak napisać i korzystać z funkcji

BLOK 4 - Big Data

Nauczymy jak wczytywać pliki do środowiska R. Jak wybierać z danych to co nas interesuje i przeprowadzać obliczenia na zbiorach danych.

Kluczowa nabyta wiedza:

  • wczytywanie danych:
    ◦ wczytywanie plików płaskich (.csv) i plików Excela
  • operacje na ramkach danych:
    ◦ wybieranie odpowiednich rzędów i kolumn
    ◦ łączenie ramek danych ( data.frame() )
  • korzystanie z funkcji pakietu dplyr

BLOK 5 - Słupki, pudełka czy skrzypce

Nauczymy jakie są podstawowe statystyki opisowe pozwalające się zorientować z jakimi danymi mamy do czynienia. Pokażemy jakie są najczęściej stosowane rodzaje wykresów. Nauczymy jak stworzyć wykresy i przedstawić graficznie wyniki naszych analiz.

Kluczowa nabyta wiedza:

  • statystyki opisowe:
    ◦ jak policzyć z danych: średnie, mediany, kwartyle, odchylenia standardowe, wartości maksymalne, minimalne, wariancje, sumy, itp.
  • popularne rodzaje wykresów:
    ◦ wykresy punktowe, słupkowe, pudełkowe, skrzypcowe i histogramy
  • tworzenie wykresów w R (z użyciem pakietu base)

BLOK 6 - Wizualizacja danych z użyciem pakietu ggplot2

Nauczymy jak tworzyć piękne wykresy, z użyciem pakietu ggplot2.

Kluczowa nabyta wiedza:

  • Tworzenie różnych rodzajów wykresów z pakietem ggplot2
  • Oznaczanie wielu zmiennych na wykresie
  • Jak zrobić dobry i czytelny wykres.

BLOK 7 - Testy statystyczne

Wyjaśnimy po co stosować testy statystyczne, jakie są podstawowe testy statystyczne oraz które się stosuje do różnych typów danych.

Kluczowa nabyta wiedza:

  • podstawowe rozkłady statystyczne danych
  • czym się różni rozkład dwumodalny od jedno i co wtedy?
  • rodzaje testów i ich zastosowanie

BLOK 8 - Tworzenie raportów i wprowadzenie do Machine Learning

W pierwszej części zajęć nauczymy jak wydajnie tworzyć estetyczne raporty z użyciem języka RMarkdown w środowisku R. W drugiej części wprowadzimy kilka podstawowych zagadnień z Machine Learning.

Kluczowa nabyta wiedza:

  • RMarkdown:
  • jak tworzyć raporty, prezentacje i dokumenty w automatyczny sposób
  • Machine Learning:
    ◦ grupowanie danych
    ◦ model liniowy
    ◦ selekcja cech (filtry)

Kontakt

Napisz do nas na: Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.
lub zadzwoń! tel. 22 38 00 569

Instytut Podstaw Informatyki
Polskiej Akademii Nauk
ul. Jana Kazimierza 5
01-248 Warszawa
ipipan.waw.pl