两个二维数组之间的关联(默认为“有效”情况):
您可以简单地使用矩阵乘法^{},就像这样-out = np.dot(arr_one,arr_two.T)
与两个输入数组的每个成对行组合(row1,row2)之间的默认"valid"大小写相关将对应于每个(row1,row2)位置的乘法结果。
两个二维阵列的行相关系数计算:def corr2_coeff(A,B):
# Rowwise mean of input arrays & subtract from input arrays themeselves
A_mA = A - A.mean(1)[:,None]
B_mB = B - B.mean(1)[:,None]
# Sum of squares across rows
ssA = (A_mA**2).sum(1);
ssB = (B_mB**2).sum(1);
# Finally get corr coeff
return np.dot(A_mA,B_mB.T)/np.sqrt(np.dot(ssA[:,None],ssB[None]))
这是基于^{}的这个解决方案
基准测试
本节将运行时性能与建议的方法与other answer.中列出的基于generate_correlation_map&loopypearsonr的方法进行比较(取自函数test_generate_correlation_map(),其末尾没有值正确性验证代码)。请注意,所提议的方法的计时还包括在开始时检查两个输入数组中是否有相同数量的列,另一个答案也是如此。下面列出运行时。
案例1:In [106]: A = np.random.rand(1000,100)
In [107]: B = np.random.rand(1000,100)
In [108]: %timeit corr2_coeff(A,B)
100 loops, best of 3: 15 ms per loop
In [109]: %timeit generate_correlation_map(A, B)
100 loops, best of 3: 19.6 ms per loop
案例2:In [110]: A = np.random.rand(5000,100)
In [111]: B = np.random.rand(5000,100)
In [112]: %timeit corr2_coeff(A,B)
1 loops, best of 3: 368 ms per loop
In [113]: %timeit generate_correlation_map(A, B)
1 loops, best of 3: 493 ms per loop
案例3:In [114]: A = np.random.rand(10000,10)
In [115]: B = np.random.rand(10000,10)
In [116]: %timeit corr2_coeff(A,B)
1 loops, best of 3: 1.29 s per loop
In [117]: %timeit generate_correlation_map(A, B)
1 loops, best of 3: 1.83 s per loop
另一个循环的pearsonr based方法似乎太慢了,但是下面是一个小数据量的运行时-In [118]: A = np.random.rand(1000,100)
In [119]: B = np.random.rand(1000,100)
In [120]: %timeit corr2_coeff(A,B)
100 loops, best of 3: 15.3 ms per loop
In [121]: %timeit generate_correlation_map(A, B)
100 loops, best of 3: 19.7 ms per loop
In [122]: %timeit pearsonr_based(A,B)
1 loops, best of 3: 33 s per loop