ABSTRACT

Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 16.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 16.2 Example Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339

16.2.1 Sampson’s Monk Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 16.2.2 Zachary’s Karate Club . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340

16.3 Stochastic Block Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341 16.3.1 Inference . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342

16.3.1.1 Sampson’s Monks Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343 16.3.1.2 Zachary’s Karate Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343

16.4 Mixed Membership Stochastic Block Model . . . . . . . . . . . . . . . . . . . . . . . . . . . 344 16.4.1 Inference . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 16.4.2 Zachary Karate Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345

16.5 Latent Position Cluster Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347 16.5.1 Latent Space Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347

16.5.1.1 The Latent Position Cluster Model . . . . . . . . . . . . . . . . . . . . . 349 16.5.1.2 The Sender and Receiver Random Effects . . . . . . . . . . . . . . . . 349 16.5.1.3 The Mixture of Experts Latent Position Cluster Model . . . . . . . 351 16.5.1.4 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351

16.5.2 Zachary’s Karate Data Set . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352 16.6 Modeling Issues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354 16.7 Other Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354 Acknowledgments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355 References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355

This chapter reviews some of the most popular statistical model-based methods for clustering network datasets. In particular, the stochastic block model, the mixed membership stochastic block model and the latent position cluster model are described and illustrated using well-known social network data.