Pokaż uproszczony rekord

dc.contributor.authorMisztal, Małgorzata
dc.date.accessioned2015-06-23T12:40:07Z
dc.date.available2015-06-23T12:40:07Z
dc.date.issued2013
dc.identifier.issn0208-6018
dc.identifier.urihttp://hdl.handle.net/11089/10081
dc.description.abstractMissing data are quite common in practical applications of statistical methods and imputation is a general statistical method for the analysis of incomplete data sets. Stekhoven and Bühlmann (2012) proposed an iterative imputation method (called “missForest”) based on Random Forests (Breiman 2001) to cope with missing values. In the paper a short description of “missForest” is presented and some selected missing data techniques are compared with “missForest” by artificially simulating different proportions and mechanisms of missing data using complete data sets from the UCI repository of machine learning databases.pl_PL
dc.description.abstractW pracy Stekhovena i Bühlmanna (2012) zaproponowano nową iteracyjną metodę imputacji (nazwaną „missForest”) opartą na metodzie Random Forests Breimana (2001). W niniejszym artykule omówiono metodę „missForest” i porównano kilka wybranych technik postępowania w sytuacji występowania braków danych z metodą „missForest”. W tym celu wykorzystano podejście symulacyjne generując różne proporcje i mechanizmy powstawania braków danych w zbiorach danych pochodzących głównie z repozytorium baz danych na Uniwersytecie Kalifornijskim w Irvine.pl_PL
dc.language.isoenpl_PL
dc.publisherWydawnictwo Uniwersytetu Łódzkiegopl_PL
dc.relation.ispartofseriesActa Universitatis Lodziensis, Folia Oeconomica;285
dc.subjectmissing valuespl_PL
dc.subjectsingle and multiple imputationpl_PL
dc.subjectrandom forestspl_PL
dc.subjectmissForestpl_PL
dc.titleSome Remarks on the Data Imputation Using “missForest” Methodpl_PL
dc.title.alternativeKilka uwag o imputacji danych z wykorzystaniem metody "missforest"pl_PL
dc.typeArticlepl_PL
dc.page.number[169]-179pl_PL
dc.contributor.authorAffiliationUniversity of Lodz, Department of Statistical Methodspl_PL
dc.referencesAllison P. D. (2002), Missing data, Series: Quantitative Applications in the Social Sciences 07–136, SAGE Publications, Thousand Oaks, London, New Delhipl_PL
dc.referencesBlake C., Keogh E., Merz C. J. (1988), UCI Repository of Machine Learning Datasets, Department of Information and Computer Science, University of California, Irvinepl_PL
dc.referencesBreiman, L. (2001), Random Forests, “Machine learning” 45(1): 5–32pl_PL
dc.referencesLittle R. J. A., Rubin D. B. (2002), Statistical Analysis with Missing Data, Second Edition, Wiley, New Jerseypl_PL
dc.referencesOba S., Sato M., Takemasa I., Monden M., Matsubara K., Ishii S. (2003), A Bayesian Missing Value Estimation Method for Gene Expression Profile Data, “Bioinformatics” 19(16): 2088–2096pl_PL
dc.referencesStädler N., Bühlmann P. (2010), Pattern Alternating Maximization Algorithm for High- Dimensional Missing Data, Arxiv preprint arXiv:1005.0366pl_PL
dc.referencesStekhoven D. J., Bühlmann P. (2012), MissForest – Nonparametric Missing Value Imputation for Mixed-Type Data, “Bioinformatics” 28(1): 112–118pl_PL
dc.referencesTroyanskaya O., Cantor M., Sherlock G., Brown P., Hastie T., Tibshirani R., Botstein D., Altman R. (2001), Missing Value Estimation Methods for DNA Microarrays, “Bioinformatics” 17(6): 520–525pl_PL
dc.referencesvan Buuren S., Groothuis-Oudshoorn K. (2011), MICE: Multivariate Imputation by Chained Equations in R, „Journal of Statistical Software”, 45(3): 1–67pl_PL


Pliki tej pozycji

Thumbnail

Pozycja umieszczona jest w następujących kolekcjach

Pokaż uproszczony rekord