# Mean shift clustering with mop-up

ms.mop<-function (X, h, subset, thr = 0.001, scaled = 1, iter=200, mop.mult=1, plot =TRUE, ...) 
{
   if (is.null(dim(X))) {
     X <- as.vector(X)
   }
   if (is.vector(X)) {
     X <- matrix(X, nrow = length(X))
   }
    n <- dim(X)[1]
    d <- dim(X)[2]
    if (missing(subset)) {
        subset <- 1:n
    }
   s1<-rep(1,d)
   if (scaled==1){
      s1       <- apply(X, 2, function(dat){ diff(range(dat))})  # range 
    } else if (scaled > 0){
      s1<- apply(X, 2, sd)
    } else if (scaled <0){
      stop("Negative values for scaled not allowed.")
   }
   if (missing(h)){
        if (!scaled){
          h<- apply(X, 2, function(dat){ diff(range(dat))})/20
        }  else if (scaled==1) { 
          h<- 0.05
        } else if (scaled >0) {
          h<-0.2
        }
   } # bandwidth by default: 5% of range or 20% of standard deviation 
  
      
   if (length(h)==1){h <- rep(h,d)}
    
   if (scaled >0){        # scales the data to lie by its range
       X <- sweep(X, 2, s1, "/")
   } 
   Xm<-colMeans(X)
 
   if (plot && d == 2) {
           plot(X, col = "grey80", ...)
   }
    finals <- matrix(NA, n, d)
    ncluster <- 0
    savecluster <- matrix(0, 0, d)
    cluster.label <- closest.label <- rep(-1, n)
    
    visited.set <- NULL
    active.set  <- subset
    
    all.ms<-list()  
    while(length(active.set)>0){
     
        print(length(active.set))
        if (length(active.set)>1){ 
           i<-sample(active.set,1)
        } else { i<-active.set}   
    
       
     
        all.ms[[i]] <- ms.rep(X, X[i, ], h,  thresh = thr^2, iter)
      
        finals[i, ] <- all.ms[[i]]$final
         
        active.set<-setdiff(active.set, i)
       
        mop <- mopup(X=X, traj.points=all.ms[[i]]$Meanshift.points, active.set, h, mop.mult)
        #print(mop)
          
        active.set<-mop$active.set
      
        removed.set<-mop$removed.set
       
        cluster.dist <- rep(0, ncluster)
        if (ncluster >= 1) {
            for (j in 1:ncluster) {
                cluster.dist[j] <- sqrt(enorm(savecluster[j, ] - finals[i, 
                  ]))/sqrt(enorm(savecluster[j, ]-Xm))
            }
        }
       
       
        if (ncluster == 0 || min(cluster.dist) > thr) {
            ncluster <- ncluster + 1
            savecluster <- rbind(savecluster, finals[i, ])
            cluster.label[i] <- ncluster
            cluster.label[removed.set]<-ncluster
        } else {
            cluster.label[i] <- which(cluster.dist == min(cluster.dist))
            cluster.label[removed.set]<- which(cluster.dist == min(cluster.dist))
        }
        
      
       if (plot && d == 2){
                lines(rbind(all.ms[[i]]$start, all.ms[[i]]$Meanshift.points), col = cluster.label[i]+1)
         }  
       }
   
    
    lcol<- ifelse(cluster.label==-1, "grey80", cluster.label+1)  
    if (plot && d == 2){
               points(finals, pch = 15)
               points(X[subset,], col=lcol[subset])
    } else if (plot && d > 2 && d<=16) {
        pairs(rbind(as.matrix(X), savecluster), col = c(lcol, rep(1, dim(savecluster)[1])), pch = c(rep(20, 
            dim(X)[1]), rep(24, dim(savecluster)[1])), ...)
    } else if (plot && d>16){
      cat("Data set has inadequate dimension to be plotted in a pairs plot.\n\n")
    }

    
   for (i in subset){
         closest.label[i] <- mindist(savecluster, X[i,])$closest.item
         #closest.coords[i,]<- object$cluster.center[closest.center,]
       }
    
    dimnames(savecluster) <- list(1:ncluster, NULL)
    
    #print(cluster.label)
    #points(X, col = cluster.label+1, ...)
    
    fit <- list(
                cluster.center = savecluster,
                cluster.label = cluster.label,
                closest.label = closest.label,
                h=h,
                data = X,              
                scaled= scaled, 
                scaled.by =  s1,
                all.trajectories=all.ms
                )
    class(fit) <- "ms"
    return(fit)
}


mopup<- function(X, traj.points, active.set, h, mop.mult){
  if(!is.matrix(traj.points)){ 
    if (dim(X)[2]>1){   
      traj.points<-matrix(traj.points, 1, length(traj.points))
    } else {
      traj.points<- matrix(traj.points, length(traj.points),1)
    }
  }  
  d<-dim(traj.points)[2]
  l<-dim(traj.points)[1]
  h<-mean(h)
  #print(h)
  Active.set<- active.set
  for (j in 1:l){
    Xa<- X[active.set,]
    if (is.vector(Xa)){
      Xa<- as.matrix(Xa, nrow=length(Xa))
    }  
   
    D<- sqrt(d)*distancevector(Xa, traj.points[j,])
   
    active.set<- setdiff(active.set, active.set[which(D<mop.mult*h)])
   
  }
  
  removed.set<-setdiff(Active.set, active.set)
  return(list("active.set"=active.set, "removed.set"=removed.set))
}