- przydatne procedury:
- R:
rnorm
,plogis
,density
, ... - Python:
np.random...
,gaussian_kde
, ...
- R:
- kody do generowania braków danych
- R:
NA
,NA_integer_
,NA_character_
,is.na
,Inf
,NaN
- Python:
np.nan
,pd.np.nan
,pd.NA
,pd.NaT
,is.null
- Zbiory danych na potrzeby zajęć:
csv
sav
-- Bilans Kapitału Ludzkiego -- zbiór, kwestionariusz
- narzędzia:
- R:
VIM
,naniar
,panelView
- Python:
missingno
,upsetty
- R:
- Kody generujące przykłady: R, Python
- Zbiory danych na zajęcia: dane przekrojowe, dane panelowe (long), dane panelowe (wide)
- Zbiór danych na ćwiczenia data2-zajecia-przyklad1.csv
- Notatnik na zajęcia: Wizualizacja braków danych
- Notatnik z rozwiązaniem zadania z zajęć.
-
Imputacja dedukcyjna:
- R:
zoo::na.locf
,tidyr::fill
,data.table::nafill
,deducorrect
- Python:
fillna
zpandas
- Zbiór danych na ćwiczenia data3-zajecia-przyklad1.csv
- Notatnik
- R:
-
Imputacja metodą najbliższego sąsiada:
- R:
simputation
,VIM
- Python:
KNNImputer
zsklearn.impute
- Zbiór danych na ćwiczenia data4-czytelnictwo.csv
- Notatnik
- R:
-
Imputacja metodą predykcyjnego dopasowania średnich (ang. predictive mean matching)
- R:
simputation
,FNN
- Python:
sklearn.linear_model
,sklearn.neighbors
- Zbiór danych na ćwiczenia data4-czytelnictwo.csv
- Notatnik
- R:
-
Imputacja wielokrotna
-
Imputacja regresyjna