3D点云目标跟踪中常见的评价指标和代码详解

编程语言及工具

105人已加入

描述

  作者:大森林 

3D点云目标跟踪的评价指标,可以根据跟踪的目标是单个还是多个,分为单目标跟踪(SOT)和多目标跟踪(MOT)两种。一般来说,SOT的评价指标主要关注跟踪的准确性和鲁棒性,而MOT的评价指标则需要考虑跟踪的完整性和一致性。

SOT的常用评价指标有:

平均重叠率(Average Overlap Rate, AOR):表示预测的3D边界框与真实的3D边界框之间的重叠比例的平均值。

平均中心误差(Average Center Error, ACE):表示预测的3D边界框与真实的3D边界框之间的中心点距离的平均值。

成功率(Success Rate, SR):表示预测的3D边界框与真实的3D边界框之间的重叠比例超过某个阈值(如0.5)的帧数占总帧数的比例。

精确率(Precision Rate, PR):表示预测的3D边界框与真实的3D边界框之间的中心点距离小于某个阈值(如1米)的帧数占总帧数的比例。

MOT的常用评价指标有:

多目标跟踪精度(Multiple Object Tracking Accuracy, MOTA):综合考虑了漏检率、误检率和ID切换率对跟踪精度的影响。

多目标跟踪精确度(Multiple Object Tracking Precision, MOTP):表示预测的3D边界框与真实的3D边界框之间的重叠比例或中心点距离的平均值。

跟踪长度(Track Length, TL):表示每个目标被成功跟踪的帧数。

跟踪片段(Track Fragment, TF):表示每个目标被中断跟踪的次数。

ID切换率(ID Switch Rate, ISR):表示每个目标被错误地分配给另一个ID或从另一个ID切换过来的次数。

评价指标详细代码:

首先,我们需要导入一些必要的库,如numpy, scipy和sklearn。然后,我们需要定义一些辅助函数,如计算两个3D边界框之间的重叠比例(IoU),计算两个3D点之间的欧氏距离,以及使用匈牙利算法进行数据关联。

import numpy as np
from scipy.spatial.transform import Rotation as R
from scipy.optimize import linear_sum_assignment
from sklearn.metrics import pairwise_distances

# 计算两个3D边界框之间的重叠比例(IoU)
def iou_3d(box1, box2):
    # box1和box2都是7维向量,表示(x, y, z, w, l, h, yaw)
    # 其中(x, y, z)是中心点坐标,(w, l, h)是宽度、长度和高度,yaw是偏航角
    # 返回两个边界框之间的IoU值,范围在[0, 1]

    # 将边界框转换为8个顶点的矩阵
    box1_corners = box_to_corners(box1)
    box2_corners = box_to_corners(box2)

    # 计算两个边界框在每个轴上的投影区间
    box1_xmin = np.min(box1_corners[:, 0])
    box1_xmax = np.max(box1_corners[:, 0])
    box1_ymin = np.min(box1_corners[:, 1])
    box1_ymax = np.max(box1_corners[:, 1])
    box1_zmin = np.min(box1_corners[:, 2])
    box1_zmax = np.max(box1_corners[:, 2])

    box2_xmin = np.min(box2_corners[:, 0])
    box2_xmax = np.max(box2_corners[:, 0])
    box2_ymin = np.min(box2_corners[:, 1])
    box2_ymax = np.max(box2_corners[:, 1])
    box2_zmin = np.min(box2_corners[:, 2])
    box2_zmax = np.max(box2_corners[:, 2])

    # 计算两个边界框在每个轴上的交集区间
    inter_xmin = max(box1_xmin, box2_xmin)
    inter_xmax = min(box1_xmax, box2_xmax)
    inter_ymin = max(box1_ymin, box2_ymin)
    inter_ymax = min(box1_ymax, box2_ymax)
    inter_zmin = max(box1_zmin, box2_zmin)
    inter_zmax = min(box1_zmax, box2_zmax)

    # 如果没有交集,返回0
    if inter_xmax < inter_xmin or inter_ymax < inter_ymin or inter_zmax < inter_zmin:
        return 0.0

    # 计算交集区域的体积
    inter_vol = (inter_xmax - inter_xmin) * (inter_ymax - inter_ymin) * (inter_zmax - inter_zmin)

    # 计算两个边界框的体积
    box1_vol = (box1_xmax - box1_xmin) * (box1_ymax - box1_ymin) * (box1_zmax - box1_zmin)
    box2_vol = (box2_xmax - box2_xmin) * (box2_ymax - box2_ymin) * (box2_zmax - box2_zmin)

    # 计算并返回IoU值
    iou = inter_vol / (box1_vol + box2_vol - inter_vol)
    return iou

# 将7维向量表示的边界框转换为8个顶点的矩阵表示
def box_to_corners(box):
    # 输入是一个7维向量,表示(x, y, z, w, l, h, yaw)
    # 输出是一个8x3的矩阵,表示8个顶点的坐标

    # 提取边界框的参数
    x, y, z, w, l, h, yaw = box

    # 计算旋转矩阵
    rot = R.from_euler('z', yaw).as_matrix()

    # 计算边界框的中心点
    center = np.array([x, y, z])

    # 计算边界框的8个顶点的相对坐标
    x_corners = np.array([w, w, -w, -w, w, w, -w, -w]) / 2
    y_corners = np.array([l, -l, -l, l, l, -l, -l, l]) / 2
    z_corners = np.array([h, h, h, h, -h, -h, -h, -h]) / 2
    corners = np.vstack((x_corners, y_corners, z_corners))

    # 通过旋转和平移,将相对坐标转换为绝对坐标
    corners = np.dot(rot, corners).T + center

    return corners

# 计算两个3D点之间的欧氏距离
def euclidean_distance(point1, point2):
    # point1和point2都是3维向量,表示(x, y, z)
    # 返回两个点之间的欧氏距离

    # 计算两个点之间的差异向量
    diff = point1 - point2

    # 计算并返回欧氏距离
    dist = np.sqrt(np.sum(diff ** 2))
    return dist

# 使用匈牙利算法进行数据关联
def data_association(cost_matrix):
    # cost_matrix是一个m x n的矩阵,表示m个预测和n个观测之间的代价(如距离或者负IoU)
    # 返回一个长度为m的向量,表示每个预测匹配的观测的索引,如果没有匹配,则为-1

    # 使用scipy库中的linear_sum_assignment函数,求解最小化总代价的匹配方案
    row_ind, col_ind = linear_sum_assignment(cost_matrix)

    # 初始化匹配结果为-1
    matches = np.full(cost_matrix.shape[0], -1)

    # 将匹配方案赋值给匹配结果
    matches[row_ind] = col_ind

    return matches

 

接下来,我们需要定义一些评价指标的计算函数,如AOR,ACE,SR,PR,MOTA,MOTP,TL,TF,ISR等。我们已经有了预测的3D边界框和真实的3D边界框的列表,以及每个边界框的置信度得分。我们还需要定义一些阈值,如重叠比例阈值(iou_threshold),中心点距离阈值(dist_threshold),置信度得分阈值(score_threshold)等,这些阈值将在代码中具体给出。

# 计算平均重叠率(AOR)
def average_overlap_rate(pred_boxes, gt_boxes):
    # pred_boxes是一个p x 7的矩阵,表示p个预测的3D边界框
    # gt_boxes是一个g x 7的矩阵,表示g个真实的3D边界框
    # 返回平均重叠率(AOR)值

    # 如果没有预测或真实边界框,返回0
    if pred_boxes.shape[0] == 0 or gt_boxes.shape[0] == 0:
        return 0.0

    # 计算预测和真实边界框之间的重叠比例矩阵,大小为p x g
    iou_matrix = np.zeros((pred_boxes.shape[0], gt_boxes.shape[0]))
    for i in range(pred_boxes.shape[0]):
        for j in range(gt_boxes.shape[0]):
            iou_matrix[i][j] = iou_3d(pred_boxes[i], gt_boxes[j])

    # 使用匈牙利算法进行数据关联,得到匹配结果
    matches = data_association(-iou_matrix)

    # 计算并返回平均重叠率(AOR)值
 ace = np.mean(dist_matrix[matches != -1])
    return ace

# 计算成功率(SR)
def success_rate(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个p x 7的矩阵,表示p个预测的3D边界框
    # gt_boxes是一个g x 7的矩阵,表示g个真实的3D边界框
    # iou_threshold是一个浮点数,表示重叠比例的阈值,默认为0.5
    # 返回成功率(SR)值

    # 如果没有预测或真实边界框,返回0
    if pred_boxes.shape[0] == 0 or gt_boxes.shape[0] == 0:
        return 0.0

    # 计算预测和真实边界框之间的重叠比例矩阵,大小为p x g
    iou_matrix = np.zeros((pred_boxes.shape[0], gt_boxes.shape[0]))
    for i in range(pred_boxes.shape[0]):
        for j in range(gt_boxes.shape[0]):
            iou_matrix[i][j] = iou_3d(pred_boxes[i], gt_boxes[j])

    # 使用匈牙利算法进行数据关联,得到匹配结果
    matches = data_association(-iou_matrix)

    # 计算并返回成功率(SR)值
    sr = np.sum(iou_matrix[matches != -1] >= iou_threshold) / pred_boxes.shape[0]
    return sr

# 计算精确率(PR)
def precision_rate(pred_boxes, gt_boxes, dist_threshold=1.0):
    # pred_boxes是一个p x 7的矩阵,表示p个预测的3D边界框
    # gt_boxes是一个g x 7的矩阵,表示g个真实的3D边界框
    # dist_threshold是一个浮点数,表示中心点距离的阈值,默认为1.0
    # 返回精确率(PR)值

    # 如果没有预测或真实边界框,返回0
    if pred_boxes.shape[0] == 0 or gt_boxes.shape[0] == 0:
        return 0.0

    # 提取预测和真实边界框的中心点坐标
    pred_centers = pred_boxes[:, :3]
    gt_centers = gt_boxes[:, :3]

    # 计算预测和真实边界框之间的中心点距离矩阵,大小为p x g
    dist_matrix = pairwise_distances(pred_centers, gt_centers)

    # 使用匈牙利算法进行数据关联,得到匹配结果
    matches = data_association(dist_matrix)

    # 计算并返回精确率(PR)值
    pr = np.sum(dist_matrix[matches != -1] <= dist_threshold) / pred_boxes.shape[0]
    return pr

# 计算多目标跟踪精度(MOTA)
def multiple_object_tracking_accuracy(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个列表,长度为t,表示t个时间步的预测的3D边界框
    # gt_boxes是一个列表,长度为t,表示t个时间步的真实的3D边界框
    # iou_threshold是一个浮点数,表示重叠比例的阈值,默认为0.5
    # 返回多目标跟踪精度(MOTA)值

    # 如果没有预测或真实边界框,返回0
    if len(pred_boxes) == 0 or len(gt_boxes) == 0:
        return 0.0

    # 初始化漏检数、误检数、ID切换数和总真实数为0
    miss_count = 0
    false_count = 0
    switch_count = 0
    total_count = 0

    # 初始化上一时间步的匹配结果为空字典
    prev_matches = {}

    # 遍历每个时间步
    for t in range(len(pred_boxes)):
        # 获取当前时间步的预测和真实边界框
        pred_box = pred_boxes[t]
        gt_box = gt_boxes[t]

        # 计算当前时间步的真实边界框的数量,并累加到总真实数中
        total_count += gt_box.shape[0]

        # 如果当前时间步没有预测或真实边界框,跳过该时间步
        if pred_box.shape[0] == 0 or gt_box.shape[0] == 0:
            continue

        # 计算当前时间步的预测和真实边界框之间的重叠比例矩阵,大小为p x g
        iou_matrix = np.zeros((pred_box.shape[0], gt_box.shape[0]))
        for i in range(pred_box.shape[0]):
            for j in range(gt_box.shape[0]):
                iou_matrix[i][j] = iou_3d(pred_box[i], gt_box[j])

        # 使用匈牙利算法进行数据关联,得到匹配结果
        matches = data_association(-iou_matrix)

        # 初始化当前时间步的匹配结果为空字典
        curr_matches = {}

        # 遍历每个预测边界框
        for i in range(pred_box.shape[0]):
            # 如果没有匹配的真实边界框,或者重叠比例低于阈值,累加误检数,并跳过该预测边界框
            if matches[i] == -1 or iou_matrix[i][matches[i]] < iou_threshold:
                false_count += 1
                continue

            # 获取匹配的真实边界框的索引
            j = matches[i]

            # 如果上一时间步有匹配的真实边界框,并且ID不同,累加ID切换数
            if j in prev_matches and prev_matches[j] != i:
                switch_count += 1

            # 将当前的匹配结果保存到字典中
            curr_matches[j] = i

        # 遍历每个真实边界框
        for j in range(gt_box.shape[0]):
            # 如果没有匹配的预测边界框,累加漏检数
            if j not in curr_matches:
                miss_count += 1

        # 更新上一时间步的匹配结果为当前的匹配结果
        prev_matches = curr_matches

    # 计算并返回多目标跟踪精度(MOTA)值
    mota = 1 - (miss_count + false_count + switch_count) / total_count
    return mota

# 计算多目标跟踪精确度(MOTP)
def multiple_object_tracking_precision(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个列表,长度为t,表示t个时间步的预测的3D边界框
    # gt_boxes是一个列表,长度为t,表示t个时间步的真实的3D边界框
    # iou_threshold是一个浮点数,表示重叠比例的阈值,默认为0.5
    # 返回多目标跟踪精确度(MOTP)值

    # 如果没有预测或真实边界框,返回0
    if len(pred_boxes) == 0 or len(gt_boxes) == 0:
        return 0.0

    # 初始化总匹配数和总重叠率为0
    match_count = 0
    sum_iou = 0.0

    # 遍历每个时间步
    for t in range(len(pred_boxes)):
        # 获取当前时间步的预测和真实边界框
        pred_box = pred_boxes[t]
        gt_box = gt_boxes[t]

        # 如果当前时间步没有预测或真实边界框,跳过该时间步
        if pred_box.shape[0] == 0 or gt_box.shape[0] == 0:
            continue

        # 计算当前时间步的预测和真实边界框之间的重叠比例矩阵,大小为p x g
        iou_matrix = np.zeros((pred_box.shape[0], gt_box.shape[0]))
        for i in range(pred_box.shape[0]):
            for j in range(gt_box.shape[0]):
                iou_matrix[i][j] = iou_3d(pred_box[i], gt_box[j])

        # 使用匈牙利算法进行数据关联,得到匹配结果
        matches = data_association(-iou_matrix)

        # 遍历每个预测边界框
        for i in range(pred_box.shape[0]):
            # 如果没有匹配的真实边界框,或者重叠比例低于阈值,跳过该预测边界框
            if matches[i] == -1 or iou_matrix[i][matches[i]] < iou_threshold:
                continue

            # 获取匹配的真实边界框的索引
            j = matches[i]

            # 累加匹配数和重叠率
            match_count += 1
            sum_iou += iou_matrix[i][j]

    # 计算并返回多目标跟踪精确度(MOTP)值
    motp = sum_iou / match_count
    return motp


# 计算跟踪长度(TL)
def track_length(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个列表,长度为t,表示t个时间步的预测的3D边界框
    # gt_boxes是一个列表,长度为t,表示t个时间步的真实的3D边界框
    # iou_threshold是一个浮点数,表示重叠比例的阈值,默认为0.5
    # 返回一个字典,键为真实目标的ID,值为对应的跟踪长度

    # 如果没有预测或真实边界框,返回空字典
    if len(pred_boxes) == 0 or len(gt_boxes) == 0:
        return {}

    # 初始化跟踪长度字典为空字典
    tl_dict = {}

    # 遍历每个时间步
    for t in range(len(pred_boxes)):
        # 获取当前时间步的预测和真实边界框
        pred_box = pred_boxes[t]
        gt_box = gt_boxes[t]

        # 如果当前时间步没有预测或真实边界框,跳过该时间步
        if pred_box.shape[0] == 0 or gt_box.shape[0] == 0:
            continue

        # 计算当前时间步的预测和真实边界框之间的重叠比例矩阵,大小为p x g
        iou_matrix = np.zeros((pred_box.shape[0], gt_box.shape[0]))
        for i in range(pred_box.shape[0]):
            for j in range(gt_box.shape[0]):
                iou_matrix[i][j] = iou_3d(pred_box[i], gt_box[j])

        # 使用匈牙利算法进行数据关联,得到匹配结果
        matches = data_association(-iou_matrix)

        # 遍历每个预测边界框
        for i in range(pred_box.shape[0]):
            # 如果没有匹配的真实边界框,或者重叠比例低于阈值,跳过该预测边界框
            if matches[i] == -1 or iou_matrix[i][matches[i]] < iou_threshold:
                continue

            # 获取匹配的真实边界框的索引
            j = matches[i]

            # 如果真实目标的ID已经在跟踪长度字典中,累加1
            if j in tl_dict:
                tl_dict[j] += 1
            # 否则,初始化为1
            else:
                tl_dict[j] = 1

    # 返回跟踪长度字典
    return tl_dict

# 计算跟踪片段(TF)
def track_fragment(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个列表,长度为t,表示t个时间步的预测的3D边界框
    # gt_boxes是一个列表,长度为t,表示t个时间步的真实的3D边界框
    # iou_threshold是一个浮点数,表示重叠比例的阈值,默认为0.5
    # 返回一个字典,键为真实目标的ID,值为对应的跟踪片段数

    # 如果没有预测或真实边界框,返回空字典
    if len(pred_boxes) == 0 or len(gt_boxes) == 0:
        return {}

    # 初始化跟踪片段字典为空字典
    tf_dict = {}

    # 初始化上一时间步的匹配结果为空字典
    prev_matches = {}

    # 遍历每个时间步
    for t in range(len(pred_boxes)):
        # 获取当前时间步的预测和真实边界框
        pred_box = pred_boxes[t]
        gt_box = gt_boxes[t]

        # 如果当前时间步没有预测或真实边界框,跳过该时间步
        if pred_box.shape[0] == 0 or gt_box.shape[0] == 0:
            continue

        # 计算当前时间步的预测和真实边界框之间的重叠比例矩阵,大小为p x g
        iou_matrix = np.zeros((pred_box.shape[0], gt_box.shape[0]))
        for i in range(pred_box.shape[0]):
            for j in range(gt_box.shape[0]):
                iou_matrix[i][j] = iou_3d(pred_box[i], gt_box[j])

        # 使用匈牙利算法进行数据关联,得到匹配结果
        matches = data_association(-iou_matrix)

        # 初始化当前时间步的匹配结果为空字典
        curr_matches = {}

        # 遍历每个预测边界框
        for i in range(pred_box.shape[0]):
            # 如果没有匹配的真实边界框,或者重叠比例低于阈值,跳过该预测边界框
            if matches[i] == -1 or iou_matrix[i][matches[i]] < iou_threshold:
                continue

            # 获取匹配的真实边界框的索引
            j = matches[i]

            # 将当前的匹配结果保存到字典中
            curr_matches[j] = i

            # 如果真实目标的ID已经在跟踪片段字典中,且上一时间步没有匹配该目标,累加1
            if j in tf_dict and j not in prev_matches:
                tf_dict[j] += 1
            # 否则,初始化为1
            elif j not in tf_dict:
                tf_dict[j] = 1

        # 更新上一时间步的匹配结果为当前的匹配结果
        prev_matches = curr_matches

    # 返回跟踪片段字典
    return tf_dict

# 计算ID切换率(ISR)
def id_switch_rate(pred_boxes, gt_boxes, iou_threshold=0.5):
    # pred_boxes是一个列表,长度为t,表示t个时间步的预测的3D边界框
    # gt_boxes是一个列表,长度为t,表示t个时间步的真实的3D边界框
    # iou_threshold是一个浮点数,表示重叠比例的阈值,默认为0.5
    # 返回一个字典,键为真实目标的ID,值为对应的ID切换次数

    # 如果没有预测或真实边界框,返回空字典
    if len(pred_boxes) == 0 or len(gt_boxes) == 0:
        return {}

    # 初始化ID切换率字典为空字典
    isr_dict = {}

    # 初始化上一时间步的匹配结果为空字典
    prev_matches = {}

    # 遍历每个时间步
    for t in range(len(pred_boxes)):
        # 获取当前时间步的预测和真实边界框
        pred_box = pred_boxes[t]
        gt_box = gt_boxes[t]

        # 如果当前时间步没有预测或真实边界框,跳过该时间步
        if pred_box.shape[0] == 0 or gt_box.shape[0] == 0:
            continue

        # 计算当前时间步的预测和真实边界框之间的重叠比例矩阵,大小为p x g
        iou_matrix = np.zeros((pred_box.shape[0], gt_box.shape[0]))
        for i in range(pred_box.shape[0]):
            for j in range(gt_box.shape[0]):
                iou_matrix[i][j] = iou_3d(pred_box[i], gt_box[j])

        # 使用匈牙利算法进行数据关联,得到匹配结果
        matches = data_association(-iou_matrix)

        # 初始化当前时间步的匹配结果为空字典
        curr_matches = {}

        # 遍历每个预测边界框
        for i in range(pred_box.shape[0]):
            # 如果没有匹配的真实边界框,或者重叠比例低于阈值,跳过该预测边界框
            if matches[i] == -1 or iou_matrix[i][matches[i]] < iou_threshold:
                continue

            # 获取匹配的真实边界框的索引
            j = matches[i]

            # 将当前的匹配结果保存到字典中
            curr_matches[j] = i

            # 如果上一时间步有匹配的真实边界框,并且ID不同,累加1
            if j in prev_matches and prev_matches[j] != i:
                # 如果真实目标的ID已经在ID切换率字典中,累加1
                if j in isr_dict:
                    isr_dict[j] += 1
                # 否则,初始化为1
                else:
                    isr_dict[j] = 1

        # 更新上一时间步的匹配结果为当前的匹配结果
        prev_matches = curr_matches

    # 返回ID切换率字典
    return isr_dict

以上就是我帮大家总结的3D点云目标跟踪中常见的评价指标和代码详解,希望可以帮助到大家。

编辑:黄飞

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分