3D点云目标跟踪中常见的评价指标和代码详解

I3963697382 2023-08-02 3946

编程语言及工具

106人已加入

描述

作者：大森林

3D点云目标跟踪的评价指标，可以根据跟踪的目标是单个还是多个，分为单目标跟踪（SOT）和多目标跟踪（MOT）两种。一般来说，SOT的评价指标主要关注跟踪的准确性和鲁棒性，而MOT的评价指标则需要考虑跟踪的完整性和一致性。

SOT的常用评价指标有：

平均重叠率（Average Overlap Rate, AOR）：表示预测的3D边界框与真实的3D边界框之间的重叠比例的平均值。

平均中心误差（Average Center Error, ACE）：表示预测的3D边界框与真实的3D边界框之间的中心点距离的平均值。

成功率（Success Rate, SR）：表示预测的3D边界框与真实的3D边界框之间的重叠比例超过某个阈值（如0.5）的帧数占总帧数的比例。

精确率（Precision Rate, PR）：表示预测的3D边界框与真实的3D边界框之间的中心点距离小于某个阈值（如1米）的帧数占总帧数的比例。

MOT的常用评价指标有：

多目标跟踪精度（Multiple Object Tracking Accuracy, MOTA）：综合考虑了漏检率、误检率和ID切换率对跟踪精度的影响。

多目标跟踪精确度（Multiple Object Tracking Precision, MOTP）：表示预测的3D边界框与真实的3D边界框之间的重叠比例或中心点距离的平均值。

跟踪长度（Track Length, TL）：表示每个目标被成功跟踪的帧数。

跟踪片段（Track Fragment, TF）：表示每个目标被中断跟踪的次数。

ID切换率（ID Switch Rate, ISR）：表示每个目标被错误地分配给另一个ID或从另一个ID切换过来的次数。

评价指标详细代码：

首先，我们需要导入一些必要的库，如numpy, scipy和sklearn。然后，我们需要定义一些辅助函数，如计算两个3D边界框之间的重叠比例（IoU），计算两个3D点之间的欧氏距离，以及使用匈牙利算法进行数据关联。

import numpy as np
from scipy.spatial.transform import Rotation as R
from scipy.optimize import linear_sum_assignment
from sklearn.metrics import pairwise_distances

# 计算两个3D边界框之间的重叠比例（IoU）
def iou_3d(box1, box2):
    # box1和box2都是7维向量，表示(x, y, z, w, l, h, yaw)
    # 其中(x, y, z)是中心点坐标，(w, l, h)是宽度、长度和高度，yaw是偏航角
    # 返回两个边界框之间的IoU值，范围在[0, 1]

    # 将边界框转换为8个顶点的矩阵
    box1_corners = box_to_corners(box1)
    box2_corners = box_to_corners(box2)

    # 计算两个边界框在每个轴上的投影区间
    box1_xmin = np.min(box1_corners[:, 0])
    box1_xmax = np.max(box1_corners[:, 0])
    box1_ymin = np.min(box1_corners[:, 1])
    box1_ymax = np.max(box1_corners[:, 1])
    box1_zmin = np.min(box1_corners[:, 2])
    box1_zmax = np.max(box1_corners[:, 2])

    box2_xmin = np.min(box2_corners[:, 0])
    box2_xmax = np.max(box2_corners[:, 0])
    box2_ymin = np.min(box2_corners[:, 1])
    box2_ymax = np.max(box2_corners[:, 1])
    box2_zmin = np.min(box2_corners[:, 2])
    box2_zmax = np.max(box2_corners[:, 2])

    # 计算两个边界框在每个轴上的交集区间
    inter_xmin = max(box1_xmin, box2_xmin)
    inter_xmax = min(box1_xmax, box2_xmax)
    inter_ymin = max(box1_ymin, box2_ymin)
    inter_ymax = min(box1_ymax, box2_ymax)
    inter_zmin = max(box1_zmin, box2_zmin)
    inter_zmax = min(box1_zmax, box2_zmax)

    # 如果没有交集，返回0
    if inter_xmax < inter_xmin or inter_ymax < inter_ymin or inter_zmax < inter_zmin:
        return 0.0

    # 计算交集区域的体积
    inter_vol = (inter_xmax - inter_xmin) * (inter_ymax - inter_ymin) * (inter_zmax - inter_zmin)

    # 计算两个边界框的体积
    box1_vol = (box1_xmax - box1_xmin) * (box1_ymax - box1_ymin) * (box1_zmax - box1_zmin)
    box2_vol = (box2_xmax - box2_xmin) * (box2_ymax - box2_ymin) * (box2_zmax - box2_zmin)

    # 计算并返回IoU值
    iou = inter_vol / (box1_vol + box2_vol - inter_vol)
    return iou

# 将7维向量表示的边界框转换为8个顶点的矩阵表示
def box_to_corners(box):
    # 输入是一个7维向量，表示(x, y, z, w, l, h, yaw)
    # 输出是一个8x3的矩阵，表示8个顶点的坐标

    # 提取边界框的参数
    x, y, z, w, l, h, yaw = box

    # 计算旋转矩阵
    rot = R.from_euler('z', yaw).as_matrix()

    # 计算边界框的中心点
    center = np.array([x, y, z])

    # 计算边界框的8个顶点的相对坐标
    x_corners = np.array([w, w, -w, -w, w, w, -w, -w]) / 2
    y_corners = np.array([l, -l, -l, l, l, -l, -l, l]) / 2
    z_corners = np.array([h, h, h, h, -h, -h, -h, -h]) / 2
    corners = np.vstack((x_corners, y_corners, z_corners))

    # 通过旋转和平移，将相对坐标转换为绝对坐标
    corners = np.dot(rot, corners).T + center

    return corners

# 计算两个3D点之间的欧氏距离
def euclidean_distance(point1, point2):
    # point1和point2都是3维向量，表示(x, y, z)
    # 返回两个点之间的欧氏距离

    # 计算两个点之间的差异向量
    diff = point1 - point2

    # 计算并返回欧氏距离
    dist = np.sqrt(np.sum(diff ** 2))
    return dist

# 使用匈牙利算法进行数据关联
def data_association(cost_matrix):
    # cost_matrix是一个m x n的矩阵，表示m个预测和n个观测之间的代价（如距离或者负IoU）
    # 返回一个长度为m的向量，表示每个预测匹配的观测的索引，如果没有匹配，则为-1

    # 使用scipy库中的linear_sum_assignment函数，求解最小化总代价的匹配方案
    row_ind, col_ind = linear_sum_assignment(cost_matrix)

    # 初始化匹配结果为-1
    matches = np.full(cost_matrix.shape[0], -1)

    # 将匹配方案赋值给匹配结果
    matches[row_ind] = col_ind

    return matches

接下来，我们需要定义一些评价指标的计算函数，如AOR，ACE，SR，PR，MOTA，MOTP，TL，TF，ISR等。我们已经有了预测的3D边界框和真实的3D边界框的列表，以及每个边界框的置信度得分。我们还需要定义一些阈值，如重叠比例阈值（iou_threshold），中心点距离阈值（dist_threshold），置信度得分阈值（score_threshold）等，这些阈值将在代码中具体给出。

# 计算平均重叠率（AOR）
def average_overlap_rate(pred_boxes, gt_boxes):
    # pred_boxes是一个p x 7的矩阵，表示p个预测的3D边界框
    # gt_boxes是一个g x 7的矩阵，表示g个真实的3D边界框
    # 返回平均重叠率（AOR）值

    # 如果没有预测或真实边界框，返回0
    if pred_boxes.shape[0] == 0 or gt_boxes.shape[0] == 0:
        return 0.0

    # 计算预测和真实边界框之间的重叠比例矩阵，大小为p x g
    iou_matrix = np.zeros((pred_boxes.shape[0], gt_boxes.shape[0]))
    for i in range(pred_boxes.shape[0]):
        for j in range(gt_boxes.shape[0]):
            iou_matrix[i][j] = iou_3d(pred_boxes[i], gt_boxes[j])

    # 使用匈牙利算法进行数据关联，得到匹配结果
    matches = data_association(-iou_matrix)

    # 计算并返回平均重叠率（AOR）值
 ace = np.mean(dist_matrix[matches != -1])
    return ace

# 计算成功率（SR）
def success_rate(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个p x 7的矩阵，表示p个预测的3D边界框
    # gt_boxes是一个g x 7的矩阵，表示g个真实的3D边界框
    # iou_threshold是一个浮点数，表示重叠比例的阈值，默认为0.5
    # 返回成功率（SR）值

    # 如果没有预测或真实边界框，返回0
    if pred_boxes.shape[0] == 0 or gt_boxes.shape[0] == 0:
        return 0.0

    # 计算预测和真实边界框之间的重叠比例矩阵，大小为p x g
    iou_matrix = np.zeros((pred_boxes.shape[0], gt_boxes.shape[0]))
    for i in range(pred_boxes.shape[0]):
        for j in range(gt_boxes.shape[0]):
            iou_matrix[i][j] = iou_3d(pred_boxes[i], gt_boxes[j])

    # 使用匈牙利算法进行数据关联，得到匹配结果
    matches = data_association(-iou_matrix)

    # 计算并返回成功率（SR）值
    sr = np.sum(iou_matrix[matches != -1] >= iou_threshold) / pred_boxes.shape[0]
    return sr

# 计算精确率（PR）
def precision_rate(pred_boxes, gt_boxes, dist_threshold=1.0):
    # pred_boxes是一个p x 7的矩阵，表示p个预测的3D边界框
    # gt_boxes是一个g x 7的矩阵，表示g个真实的3D边界框
    # dist_threshold是一个浮点数，表示中心点距离的阈值，默认为1.0
    # 返回精确率（PR）值

    # 如果没有预测或真实边界框，返回0
    if pred_boxes.shape[0] == 0 or gt_boxes.shape[0] == 0:
        return 0.0

    # 提取预测和真实边界框的中心点坐标
    pred_centers = pred_boxes[:, :3]
    gt_centers = gt_boxes[:, :3]

    # 计算预测和真实边界框之间的中心点距离矩阵，大小为p x g
    dist_matrix = pairwise_distances(pred_centers, gt_centers)

    # 使用匈牙利算法进行数据关联，得到匹配结果
    matches = data_association(dist_matrix)

    # 计算并返回精确率（PR）值
    pr = np.sum(dist_matrix[matches != -1] <= dist_threshold) / pred_boxes.shape[0]
    return pr

# 计算多目标跟踪精度（MOTA）
def multiple_object_tracking_accuracy(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个列表，长度为t，表示t个时间步的预测的3D边界框
    # gt_boxes是一个列表，长度为t，表示t个时间步的真实的3D边界框
    # iou_threshold是一个浮点数，表示重叠比例的阈值，默认为0.5
    # 返回多目标跟踪精度（MOTA）值

    # 如果没有预测或真实边界框，返回0
    if len(pred_boxes) == 0 or len(gt_boxes) == 0:
        return 0.0

    # 初始化漏检数、误检数、ID切换数和总真实数为0
    miss_count = 0
    false_count = 0
    switch_count = 0
    total_count = 0

    # 初始化上一时间步的匹配结果为空字典
    prev_matches = {}

    # 遍历每个时间步
    for t in range(len(pred_boxes)):
        # 获取当前时间步的预测和真实边界框
        pred_box = pred_boxes[t]
        gt_box = gt_boxes[t]

        # 计算当前时间步的真实边界框的数量，并累加到总真实数中
        total_count += gt_box.shape[0]

        # 如果当前时间步没有预测或真实边界框，跳过该时间步
        if pred_box.shape[0] == 0 or gt_box.shape[0] == 0:
            continue

        # 计算当前时间步的预测和真实边界框之间的重叠比例矩阵，大小为p x g
        iou_matrix = np.zeros((pred_box.shape[0], gt_box.shape[0]))
        for i in range(pred_box.shape[0]):
            for j in range(gt_box.shape[0]):
                iou_matrix[i][j] = iou_3d(pred_box[i], gt_box[j])

        # 使用匈牙利算法进行数据关联，得到匹配结果
        matches = data_association(-iou_matrix)

        # 初始化当前时间步的匹配结果为空字典
        curr_matches = {}

        # 遍历每个预测边界框
        for i in range(pred_box.shape[0]):
            # 如果没有匹配的真实边界框，或者重叠比例低于阈值，累加误检数，并跳过该预测边界框
            if matches[i] == -1 or iou_matrix[i][matches[i]] < iou_threshold:
                false_count += 1
                continue

            # 获取匹配的真实边界框的索引
            j = matches[i]

            # 如果上一时间步有匹配的真实边界框，并且ID不同，累加ID切换数
            if j in prev_matches and prev_matches[j] != i:
                switch_count += 1

            # 将当前的匹配结果保存到字典中
            curr_matches[j] = i

        # 遍历每个真实边界框
        for j in range(gt_box.shape[0]):
            # 如果没有匹配的预测边界框，累加漏检数
            if j not in curr_matches:
                miss_count += 1

        # 更新上一时间步的匹配结果为当前的匹配结果
        prev_matches = curr_matches

    # 计算并返回多目标跟踪精度（MOTA）值
    mota = 1 - (miss_count + false_count + switch_count) / total_count
    return mota

# 计算多目标跟踪精确度（MOTP）
def multiple_object_tracking_precision(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个列表，长度为t，表示t个时间步的预测的3D边界框
    # gt_boxes是一个列表，长度为t，表示t个时间步的真实的3D边界框
    # iou_threshold是一个浮点数，表示重叠比例的阈值，默认为0.5
    # 返回多目标跟踪精确度（MOTP）值

    # 如果没有预测或真实边界框，返回0
    if len(pred_boxes) == 0 or len(gt_boxes) == 0:
        return 0.0

    # 初始化总匹配数和总重叠率为0
    match_count = 0
    sum_iou = 0.0

    # 遍历每个时间步
    for t in range(len(pred_boxes)):
        # 获取当前时间步的预测和真实边界框
        pred_box = pred_boxes[t]
        gt_box = gt_boxes[t]

        # 如果当前时间步没有预测或真实边界框，跳过该时间步
        if pred_box.shape[0] == 0 or gt_box.shape[0] == 0:
            continue

        # 计算当前时间步的预测和真实边界框之间的重叠比例矩阵，大小为p x g
        iou_matrix = np.zeros((pred_box.shape[0], gt_box.shape[0]))
        for i in range(pred_box.shape[0]):
            for j in range(gt_box.shape[0]):
                iou_matrix[i][j] = iou_3d(pred_box[i], gt_box[j])

        # 使用匈牙利算法进行数据关联，得到匹配结果
        matches = data_association(-iou_matrix)

        # 遍历每个预测边界框
        for i in range(pred_box.shape[0]):
            # 如果没有匹配的真实边界框，或者重叠比例低于阈值，跳过该预测边界框
            if matches[i] == -1 or iou_matrix[i][matches[i]] < iou_threshold:
                continue

            # 获取匹配的真实边界框的索引
            j = matches[i]

            # 累加匹配数和重叠率
            match_count += 1
            sum_iou += iou_matrix[i][j]

    # 计算并返回多目标跟踪精确度（MOTP）值
    motp = sum_iou / match_count
    return motp


# 计算跟踪长度（TL）
def track_length(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个列表，长度为t，表示t个时间步的预测的3D边界框
    # gt_boxes是一个列表，长度为t，表示t个时间步的真实的3D边界框
    # iou_threshold是一个浮点数，表示重叠比例的阈值，默认为0.5
    # 返回一个字典，键为真实目标的ID，值为对应的跟踪长度

    # 如果没有预测或真实边界框，返回空字典
    if len(pred_boxes) == 0 or len(gt_boxes) == 0:
        return {}

    # 初始化跟踪长度字典为空字典
    tl_dict = {}

    # 遍历每个时间步
    for t in range(len(pred_boxes)):
        # 获取当前时间步的预测和真实边界框
        pred_box = pred_boxes[t]
        gt_box = gt_boxes[t]

        # 如果当前时间步没有预测或真实边界框，跳过该时间步
        if pred_box.shape[0] == 0 or gt_box.shape[0] == 0:
            continue

        # 计算当前时间步的预测和真实边界框之间的重叠比例矩阵，大小为p x g
        iou_matrix = np.zeros((pred_box.shape[0], gt_box.shape[0]))
        for i in range(pred_box.shape[0]):
            for j in range(gt_box.shape[0]):
                iou_matrix[i][j] = iou_3d(pred_box[i], gt_box[j])

        # 使用匈牙利算法进行数据关联，得到匹配结果
        matches = data_association(-iou_matrix)

        # 遍历每个预测边界框
        for i in range(pred_box.shape[0]):
            # 如果没有匹配的真实边界框，或者重叠比例低于阈值，跳过该预测边界框
            if matches[i] == -1 or iou_matrix[i][matches[i]] < iou_threshold:
                continue

            # 获取匹配的真实边界框的索引
            j = matches[i]

            # 如果真实目标的ID已经在跟踪长度字典中，累加1
            if j in tl_dict:
                tl_dict[j] += 1
            # 否则，初始化为1
            else:
                tl_dict[j] = 1

    # 返回跟踪长度字典
    return tl_dict

# 计算跟踪片段（TF）
def track_fragment(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个列表，长度为t，表示t个时间步的预测的3D边界框
    # gt_boxes是一个列表，长度为t，表示t个时间步的真实的3D边界框
    # iou_threshold是一个浮点数，表示重叠比例的阈值，默认为0.5
    # 返回一个字典，键为真实目标的ID，值为对应的跟踪片段数

    # 如果没有预测或真实边界框，返回空字典
    if len(pred_boxes) == 0 or len(gt_boxes) == 0:
        return {}

    # 初始化跟踪片段字典为空字典
    tf_dict = {}

    # 初始化上一时间步的匹配结果为空字典
    prev_matches = {}

    # 遍历每个时间步
    for t in range(len(pred_boxes)):
        # 获取当前时间步的预测和真实边界框
        pred_box = pred_boxes[t]
        gt_box = gt_boxes[t]

        # 如果当前时间步没有预测或真实边界框，跳过该时间步
        if pred_box.shape[0] == 0 or gt_box.shape[0] == 0:
            continue

        # 计算当前时间步的预测和真实边界框之间的重叠比例矩阵，大小为p x g
        iou_matrix = np.zeros((pred_box.shape[0], gt_box.shape[0]))
        for i in range(pred_box.shape[0]):
            for j in range(gt_box.shape[0]):
                iou_matrix[i][j] = iou_3d(pred_box[i], gt_box[j])

        # 使用匈牙利算法进行数据关联，得到匹配结果
        matches = data_association(-iou_matrix)

        # 初始化当前时间步的匹配结果为空字典
        curr_matches = {}

        # 遍历每个预测边界框
        for i in range(pred_box.shape[0]):
            # 如果没有匹配的真实边界框，或者重叠比例低于阈值，跳过该预测边界框
            if matches[i] == -1 or iou_matrix[i][matches[i]] < iou_threshold:
                continue

            # 获取匹配的真实边界框的索引
            j = matches[i]

            # 将当前的匹配结果保存到字典中
            curr_matches[j] = i

            # 如果真实目标的ID已经在跟踪片段字典中，且上一时间步没有匹配该目标，累加1
            if j in tf_dict and j not in prev_matches:
                tf_dict[j] += 1
            # 否则，初始化为1
            elif j not in tf_dict:
                tf_dict[j] = 1

        # 更新上一时间步的匹配结果为当前的匹配结果
        prev_matches = curr_matches

    # 返回跟踪片段字典
    return tf_dict

# 计算ID切换率（ISR）
def id_switch_rate(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个列表，长度为t，表示t个时间步的预测的3D边界框
    # gt_boxes是一个列表，长度为t，表示t个时间步的真实的3D边界框
    # iou_threshold是一个浮点数，表示重叠比例的阈值，默认为0.5
    # 返回一个字典，键为真实目标的ID，值为对应的ID切换次数

    # 如果没有预测或真实边界框，返回空字典
    if len(pred_boxes) == 0 or len(gt_boxes) == 0:
        return {}

    # 初始化ID切换率字典为空字典
    isr_dict = {}

    # 初始化上一时间步的匹配结果为空字典
    prev_matches = {}

    # 遍历每个时间步
    for t in range(len(pred_boxes)):
        # 获取当前时间步的预测和真实边界框
        pred_box = pred_boxes[t]
        gt_box = gt_boxes[t]

        # 如果当前时间步没有预测或真实边界框，跳过该时间步
        if pred_box.shape[0] == 0 or gt_box.shape[0] == 0:
            continue

        # 计算当前时间步的预测和真实边界框之间的重叠比例矩阵，大小为p x g
        iou_matrix = np.zeros((pred_box.shape[0], gt_box.shape[0]))
        for i in range(pred_box.shape[0]):
            for j in range(gt_box.shape[0]):
                iou_matrix[i][j] = iou_3d(pred_box[i], gt_box[j])

        # 使用匈牙利算法进行数据关联，得到匹配结果
        matches = data_association(-iou_matrix)

        # 初始化当前时间步的匹配结果为空字典
        curr_matches = {}

        # 遍历每个预测边界框
        for i in range(pred_box.shape[0]):
            # 如果没有匹配的真实边界框，或者重叠比例低于阈值，跳过该预测边界框
            if matches[i] == -1 or iou_matrix[i][matches[i]] < iou_threshold:
                continue

            # 获取匹配的真实边界框的索引
            j = matches[i]

            # 将当前的匹配结果保存到字典中
            curr_matches[j] = i

            # 如果上一时间步有匹配的真实边界框，并且ID不同，累加1
            if j in prev_matches and prev_matches[j] != i:
                # 如果真实目标的ID已经在ID切换率字典中，累加1
                if j in isr_dict:
                    isr_dict[j] += 1
                # 否则，初始化为1
                else:
                    isr_dict[j] = 1

        # 更新上一时间步的匹配结果为当前的匹配结果
        prev_matches = curr_matches

    # 返回ID切换率字典
    return isr_dict

以上就是我帮大家总结的3D点云目标跟踪中常见的评价指标和代码详解，希望可以帮助到大家。

编辑：黄飞

打开APP阅读更多精彩内容