dc.contributor.author | Witek, Ewa | |
dc.date.accessioned | 2015-03-09T06:49:02Z | |
dc.date.available | 2015-03-09T06:49:02Z | |
dc.date.issued | 2009 | |
dc.identifier.issn | 0208-6018 | |
dc.identifier.uri | http://hdl.handle.net/11089/7116 | |
dc.description.abstract | W artykule przedstawiona została modyfikacja metody taksonomii opartej na modelach
mieszanych, w przypadku gdy niemożliwym staje się oszacowanie parametrów
modelu za pomocą algorytmu EM. Gdy liczba obiektów przypisanych do klasy jest
mniejsza niż liczba zmiennych opisujących te obiekty, niemożliwym staje się oszacowanie
parametrów modelu. By uniknąć tej sytuacji estymatory największej wiarygodności
zastępowane są estymatorami o największym prawdopodobieństwie a posteriori. Wybór
modelu o najlepszej parametryzacji i stosownej liczbie klas dokonywany jest wówczas
za pomocą zmodyfikowanej statystyki BIC. | pl_PL |
dc.description.abstract | An improvement o f the model-based clustering (MBC) method in the
case when EM algorithm fails as a result o f singularities is the basic aim o f this paper.
Replacement o f the maximum likelihood (MLE) estimator by a maximum a posteriori
(MAP) estimator, also found by the EM algorithm is proposed. Models with different
number o f components are compared using a modified version o f BIC, where the likelihood
is evaluated at the MAP instead o f MLE. A highly dispersed proper conjugate prior
is shown to avoid singularities, but when these are not present it gives similar results to
the standard method o f MBC. | pl_PL |
dc.description.sponsorship | Zadanie pt. „Digitalizacja i udostępnienie w Cyfrowym Repozytorium Uniwersytetu Łódzkiego kolekcji czasopism naukowych wydawanych przez Uniwersytet Łódzki” nr 885/P-DUN/2014 dofinansowane zostało ze środków MNiSW w ramach działalności upowszechniającej naukę. | pl_PL |
dc.language.iso | en | pl_PL |
dc.publisher | Wydawnictwo Uniwersytetu Łódzkiego | pl_PL |
dc.relation.ispartofseries | Acta Universitatis Lodziensis. Folia Oeconomica;228 | |
dc.subject | Model-based clustering (MBC) | pl_PL |
dc.subject | Gaussian mixture models | pl_PL |
dc.subject | EM algorithm | pl_PL |
dc.subject | MLE | pl_PL |
dc.subject | MAP | pl_PL |
dc.subject | BIC | pl_PL |
dc.subject | conjugate prior | pl_PL |
dc.title | On an Improvement of the Model-Based Clustering Method | pl_PL |
dc.title.alternative | O pewnej modyfikacji w metodzie taksonomii opartej na modelach mieszanych | pl_PL |
dc.type | Article | pl_PL |
dc.page.number | 229-235 | pl_PL |
dc.contributor.authorAffiliation | ent. Department of Statistics, The Karol Adamiecki University of Economics, Katowice | pl_PL |
dc.references | Banfield J.D., Raftery A.E. (1993), Model-based Gaussian and non-Gaussian clustering, „Biometrics”, 49, 803-821. | |
dc.references | Biernacki С, Celeux G., Govaert G., Langrognet F. (2006), Model-based cluster and disriminant analysis with the MIXMOD software, „Computational Statistics and Data Analysis”, 51, 587-600. | |
dc.references | Dasgupta A., Raftery A.E. (1998), Detecting features in spatial point processes with clutter via model-based clustering, „Journal of the American Statistical Association”, 93, 294-302. | |
dc.references | Dempster A.P., Laird N.M., Rubin D.B. (1977), Maximum likelihood for incomplete data via the EM algorithm (with discussion), „Journal of the Royal Statistical Society”, ser. B, 39, 1-38. | |
dc.references | Fraley C., Raftery A.E. (1998), How many clusters? Which clustering method? Answers via model-based cluster analysis, „The Computer Journal”, 41, 577-588. | |
dc.references | Fraley C., Raftery A.E. (2002), Model-based clustering, discriminant analysis, and density estimation,
„Journal of the American Statistical Association”, 97, 611-631. | |
dc.references | Fraley C., Raftery A.E. (2005),
Bayesian regularization for normal mixture estimation
and model-based clustering, Technical Report 486, Department of Statistics, University of Washington. | |
dc.references | Fraley C., Raftery A.E. (2006), MCLUST Version 3: An R package for normal mixture modeling and model- based clustering, 1-50. | |
dc.references | Gelman A., Carlin J.B., Stem H.S., Rubin D.B. (1995),
Bayesian data analysis, Chapman and Hall, London. | |
dc.references | McLachlan G.J., Peel D. (2000), Finite mixture models, Wiley, New York. | |
dc.references | Schafer J.L. (1997), Analysis of incomplete multivariate data by simulation, Chapman and Hall, London. | |
dc.references | Schwarz G. (1978), Estimating the dimension of a model, „The Annals of Statistics”, 6, 461-464. | |