为什么 numpy.unique 函数总是返回升序排序的唯一值?
numpy.unique 唯一值自动排序的原因
python 中,numpy.unique 函数用于查找数组中唯一的值。但是,有些人可能注意到,返回的唯一值总是按升序排序,即使原始数组没有排序。
这种行为并非偶然。numpy.unique 函数的文档明确指出,它会返回按升序排序的唯一值。这是因为 numpy.unique 实现了一个称为排序排序的算法。该算法将数组排序,然后从排序后的数组中查找唯一值。
之所以使用排序排序算法,是因为它比其他算法更高效。例如,哈希表法虽然可以查找唯一值,但它需要更多的内存和时间。
即便不指定 dtype,numpy.unique 也会按升序返回唯一值。这是因为 numpy 将数组转换为默认数据类型 (float64),然后对其进行排序。
例如:
arr34 = np.array([3, 4, 5, 3, 2, 4, 3], dtype='<U6')arr34a = np.unique(arr34)print(arr34a) # 输出:['2' '3' '4' '5']
无论是否指定 dtype,arr34a 中的唯一值始终按升序排序。这种排序行为是 numpy.unique 函数的一个关键特性,需要在使用该函数时加以考虑。