二维阵列的峰值检测

我在帮助一家兽医诊所测量狗爪下的压力。我使用Python进行数据分析，现在我正试图将爪子划分为(解剖学上的)子区域。

我为每个爪子制作了一个2D数组，其中包括爪子随时间加载的每个传感器的最大值。这里有一个单爪的例子，我使用Excel绘制我想要“检测”的区域。传感器周围是2 * 2的方框带有局部最大值，它们加起来的和最大。

所以我尝试了一些实验，并决定简单地寻找每一列和每一行的最大值(由于爪子的形状，不能只看一个方向)。这似乎能很好地“检测”到不同脚趾的位置，但也能标记出相邻的传感器。

那么告诉Python哪些最大值是我想要的最好方法是什么呢?

注意:2x2的方块不能重叠，因为它们必须是分开的脚趾!

此外，我选择了2x2作为方便，任何更高级的解决方案都是受欢迎的，但我只是一个人类运动科学家，所以我既不是真正的程序员也不是数学家，所以请保持“简单”。

下面是一个可以用np.loadtxt加载的版本

结果

所以我尝试了@jextee的解决方案(见下面的结果)。正如你所看到的，它对前爪很有效，但对后腿就不那么有效了。

更具体地说，它无法识别第四个脚趾的小峰。这显然是固有的事实，即循环从上向下看最低值，而不考虑它在哪里。

有没有人知道如何调整@jextee的算法，让它也能找到第四个脚趾?

因为我还没有处理其他的试验，所以我无法提供其他的样品。但我之前给出的数据是每个爪子的平均值。这个文件是一个数组，其中包含9只爪子的最大数据，按照它们与盘子接触的顺序排列。

这张照片显示了它们在空间上是如何分布在板块上的。

更新:

我已经为任何感兴趣的人建立了一个博客，我已经设置了一个OneDrive与所有的原始测量。因此，对于任何要求更多数据的人:给你更多力量!

新更新:

所以在我得到关于爪子检测和爪子分类的问题的帮助后，我终于能够检查每个爪子的脚趾检测!事实证明，除了像我自己例子中那样大的爪子，它在其他地方都不太管用。当然，事后看来，是我自己的错，我这么武断地选择了2x2。

这里有一个很好的例子，它错在哪里:指甲被识别为脚趾，而“脚跟”太宽了，它被识别了两次!

爪子太大了，所以采用没有重叠的2x2尺寸，会导致一些脚趾被检测两次。反过来，在小型犬中，它经常找不到第5个脚趾，我怀疑这是由于2x2面积太大造成的。

在对我所有的测量都尝试了当前的解决方案后，我得出了一个惊人的结论，几乎所有的小狗都没有发现第5个脚趾，而在超过50%的大型狗的冲击中，它会发现更多!

显然我需要改变它。我自己的想法是改变社区的大小，让小狗住的地方更小，大狗住的地方更大。但是generate_binary_structure不允许我改变数组的大小。

因此，我希望其他人有更好的建议来定位脚趾，也许是脚趾面积与爪子大小的比例?

当前回答

这是一个图像配准问题。总的策略是:

有一个已知的例子，或者有一些先验的数据。将数据与示例相匹配，或将示例与数据相匹配。如果您的数据在一开始就大致对齐，这是有帮助的。

这里有一个粗略而现成的方法，“可能起作用的最愚蠢的方法”:

从五个脚趾坐标开始，大致在你期望的位置。使用每一个，迭代地爬到山顶。即给定当前位置，移动到最大邻近像素，如果它的值大于当前像素。当你的脚趾坐标停止移动时停止。

为了解决方向问题，你可以为基本方向设置8个左右的初始设置(北，东北等)。单独运行每一个，并丢弃任何两个或多个脚趾最终位于同一像素的结果。我会再思考一下这个问题，但这种事情在图像处理中还在研究中——没有正确的答案!

稍微复杂一点的想法:(加权)k -均值聚类。没那么糟。

从五个脚趾坐标开始，但现在这些是“集群中心”。

然后迭代直到收敛:

将每个像素分配到最近的集群(只需为每个集群制作一个列表)。计算每个簇的质心。对于每个聚类，这是:Sum(坐标*强度值)/Sum(坐标) 移动每个星团到新的质心。

这种方法几乎肯定会得到更好的结果，你可以得到每个簇的质量，这可能有助于识别脚趾。

(同样，您已经预先指定了集群的数量。对于聚类，您必须以一种或另一种方式指定密度:要么选择集群的数量，在这种情况下合适，要么选择集群半径，看看最终有多少。后者的一个例子是mean-shift。)

很抱歉缺少实现细节或其他细节。我可以把它写出来，但我有最后期限了。如果到下周还没有效果，请告诉我，我会试试的。

2010-09-10 14:54:44

其他回答

这是我在大型望远镜上做类似事情时使用的另一种方法:

1)搜索最高像素。一旦你有了这个，在周围搜索2x2的最佳拟合(可能是最大化2x2的和)，或者在4x4的子区域内做一个2d高斯拟合，以最高像素为中心。

然后在峰值中心周围将那些2x2像素设置为0(或者3x3)

回到1)，重复直到峰值低于噪声阈值，或者你有所有你需要的脚趾

2010-09-10 18:21:33

这里有一个想法:你计算图像的(离散)拉普拉斯量。我希望它在最大值处是(负的)大的，以一种比原始图像更引人注目的方式。因此，极大值更容易找到。

这里有另一个想法:如果你知道高压点的典型大小，你可以首先通过用相同大小的高斯函数卷积来平滑你的图像。这可能会让你更容易处理图像。

2010-09-10 13:05:10

只是想告诉你们，有一个很好的选项可以用python在图像中找到局部最大值:

from skimage.feature import peak_local_max

或者对于skimage 0.8.0:

from skimage.feature.peak import peak_local_max

http://scikit-image.org/docs/0.8.0/api/skimage.feature.peak.html

2018-04-04 21:52:53

大概的轮廓……

你可能想要使用连接组件算法来隔离每个爪子区域。wiki对此有一个很好的描述(有一些代码):http://en.wikipedia.org/wiki/Connected_Component_Labeling

你必须决定是使用4连通性还是8连通性。就我个人而言，对于大多数问题，我更喜欢6连通性。无论如何，一旦你将每个“爪印”分离为一个连通区域，就很容易遍历该区域并找到最大值。一旦你找到了最大值，你就可以迭代地扩大区域，直到达到预定的阈值，以确定它是给定的“脚趾”。

这里有一个微妙的问题是，一旦你开始使用计算机视觉技术来识别某个东西是右/左/前/后爪，你开始观察单个脚趾，你就必须开始考虑旋转、倾斜和平移。这是通过分析所谓的“矩”来完成的。在视觉应用中有几个不同的时刻需要考虑:

中心矩:平移不变量归一化矩:缩放和平移不变量胡矩:平移、尺度和旋转不变量

更多关于moments的信息可以在wiki上搜索“image moments”。

2010-09-10 19:05:25

如果你能够创建一些训练数据，那么使用神经网络可能是值得尝试的……但这需要手工标注许多样本。

2010-09-10 18:33:32

二维阵列的峰值检测

推荐文章

最新文章

标签