nsaunier/traffic-intelligence: trafficintelligence/ml.py comparison

comparison trafficintelligence/ml.py @ 1054:d13f9bfbf3ff

Retry

author	Wendlasida
date	Fri, 06 Jul 2018 18:42:58 -0400
parents	75a6ad604cc5
children	ab4c72b9475c

comparison

equal deleted inserted replaced

-:60cc87e824c4
+:d13f9bfbf3ff
 features = whiten(features)
 centroids,distortion = kmeans(features,k, iter)
 code,distance = vq(features,centroids) # code starting from 0 (represent first cluster) to k-1 (last cluster)
 return code,sigma
-def assignToPrototypeClusters(instances, prototypeIndices, similarities, minSimilarity, similarityFunc = None, minClusterSize = 0):
+def assignToPrototypeClusters(instances, initialPrototypeIndices, similarities, minSimilarity, similarityFunc, minClusterSize = 0):
 '''Assigns instances to prototypes
 if minClusterSize is not 0, the clusters will be refined by removing iteratively the smallest clusters
 and reassigning all elements in the cluster until no cluster is smaller than minClusterSize
 labels are indices in the prototypeIndices'''
-if similarityFunc is None:
+prototypeIndices = copy(initialPrototypeIndices)
-print('similarityFunc is None')
-return None
 indices = [i for i in range(len(instances)) if i not in prototypeIndices]
 labels = [-1]*len(instances)
 assign = True
 while assign:
 for i in prototypeIndices:
 if assign:
 prototypeIndices.remove(smallestClusterIndex)
 indices = [i for i in range(similarities.shape[0]) if labels[i] == smallestClusterIndex]
 return prototypeIndices, labels
-def prototypeCluster(instances, similarities, minSimilarity, similarityFunc = None, optimizeCentroid = False, randomInitialization = False, initialPrototypeIndices = None):
+def prototypeCluster(instances, similarities, minSimilarity, similarityFunc, optimizeCentroid = False, randomInitialization = False, initialPrototypeIndices = None):
 '''Finds exemplar (prototype) instance that represent each cluster
 Returns the prototype indices (in the instances list)
 the elements in the instances list must have a length (method __len__), or one can use the optimizeCentroid
 the positions in the instances list corresponds to the similarities
 initialPrototypeIndices are indices in instances
 TODO: check how similarity evolves in clusters'''
 if len(instances) == 0:
 print('no instances to cluster (empty list)')
-return None
-if similarityFunc is None:
-print('similarityFunc is None')
 return None
 # sort instances based on length
 indices = list(range(len(instances)))
 if randomInitialization or optimizeCentroid:
 indices = np.random.permutation(indices).tolist()
 else:
-def compare(i, j):
-if len(instances[i]) > len(instances[j]):
-return -1
-elif len(instances[i]) == len(instances[j]):
-return 0
-else:
-return 1
 indices.sort(key=lambda i: len(instances[i]))
 # initialize clusters
 clusters = []
 if initialPrototypeIndices is None:
 prototypeIndices = [indices[0]]

Mercurial > hg > nsaunier > traffic-intelligence

comparison trafficintelligence/ml.py @ 1054:d13f9bfbf3ff