Python 在嵌入式应用程序开发中变得越来越普遍,特别是对于在网络边缘运行的机器学习框架。但是,这种高级通用编程语言抽象出代码中的许多细节,这些细节可能会以开发人员可能不知道的方式影响实现的性能。
让我们举一个明显的例子:计算 斐波那契数列。至少有两种不同的方法可以执行此操作,递归算法和标准迭代算法,性能水平差异很大。
可以使用称为 Tracealyzer 的工具评估不同实现或算法的性能。这是来自 Percepio 的可视化跟踪诊断工具,可让嵌入式软件开发人员在运行时深入了解代码,以便更轻松地调试系统级问题,并帮助他们改进软件的设计和性能。
Tracealyzer 可以与传统调试器(如开源 Eclipse 工具)并排使用,并通过系统级别的几个附加视图补充详细的调试器视图。这有助于理解经典调试器不足以解决的实时问题。
结合Linux 操作系统发行版中的LTTng开源跟踪包,Tracealyzer 可以展示不同级别的性能。这与处理器无关,并且是所选算法的结果。
对于评估,斐波那契数列的每个实现都在一个模块中执行:
def recur_fibo(n):
if n 《=1 n:
return n
else:
return(recur_fibo(n-1) + recur_fibo(n-2))
def non_recur_fibo(n):
result = []
a,b = 0,1
while a 《 n:
result.append(a)
a,b = b, a+b
return result
有单独的 Python 源文件调用上面的两个函数:
import lttngust
import logging
import fib
def example():
logging.basicConfig()
logger = logging.getLogger(‘my-logger’)
logger.info(‘Start’)
fib.recur_fibo(10)
logger.info(‘Stop’)
logger.info(‘Start’)
fib.non_recur_fibo(10)
logger.info(‘Stop’)
if __name__ == ‘__main__’:
example()
以下命令捕获 LTTng 中的跟踪,然后可以在 Tracealyzer 中检查:
$》 lttng 创建
$》 lttng 启用事件--kernel sched_switch
$》 lttng 启用事件--python my-logger
$》 lttng 开始
$》 蟒蛇3.py
$》 lttng 停止
$》 lttng 销毁
将标准 Python 记录器替换为名为“my-logger”的记录器允许 Tracealyzer 在工具的跟踪视图中显示事件。由于 Tracealyzer 在此特定示例中未捕获任何应用程序数据,因此无需将软件配置为读取数据值。相反,只需要一个自定义间隔来标记两个函数的进入和退出。
虽然在上面的跟踪视图中可以看到显着的性能差异,但 Tracealyzer 还可以提供更具体的性能指标。这可以通过转到视图并单击间隔和状态机来完成,并使用代码中的 logger.info() 调用插入的“开始”和“停止”字符串创建自定义间隔,并标记条目和候选函数的退出。
区间图显示递归算法(首先执行)和迭代算法(其次执行)之间存在 20 倍的差异。
在此示例中,我们仅使用每种算法计算 10 个斐波那契数。如果没有 Tracealyzer,可能需要更多的迭代才能获得一些有意义的见解,但这有两个问题。首先,当递归 Fibonacci 算法运行到 1000(甚至 100)时,Python 会简单地坐在那里。这将是令人担忧的,因为不清楚这种不响应是由于实现中的错误还是其他原因。在这种情况下,我们可能会猜到为什么会发生这种情况,但是对于更复杂的问题,需要大量的日志记录来了解瓶颈在哪里。
其次,如果在嵌入式系统上运行多个应用程序,这些其他应用程序可能会破坏目标应用程序,这也会增加算法或函数完成执行的时间。没有踪迹,就没有简单的方法来确定是否是这种情况。
相反,Python 中的 LTTng 和 Tracealyzer 的结合突出表明,问题在于所选算法的基本特征。这在开发更复杂的算法时非常宝贵。此示例实现可作为如何评估未来算法实现的性能的参考。在单独的 Python 模块中实现核心功能通常是一种很好的编程习惯,这也简化了对特定功能的跟踪。
由于跟踪开销几乎可以忽略不计,跟踪点可以保留在应用程序中,因为它在目标嵌入式系统甚至生产中进行测试,从而允许 Tracealyzer 工具在生产代码库中生成性能指标。这对于常规系统测试非常有用,并且允许使用相同的代码库来确保应用程序在功能上正确且高性能,而只需进行最少的更改。
结论
使用 Tracealyzer 和 LTTng 捕获 Python 应用程序中的性能指标提供了对算法实现的宝贵分析。
这种方法的最小开销意味着可以保留代码的检测以在目标嵌入式系统上使用。这可以对目标应用程序进行更多监控,并促进对与其他应用程序和操作系统交互的分析。例如,可能有另一个进程或线程抢占目标应用程序并影响性能。Tracealyzer 和 LTTng 的组合可以识别此类异常的原因,这允许开发人员改进实现以防止进一步的问题。
虽然斐波那契数列的示例实现相对无害,但它突出了 Python 语言的一个关键特征,可以为更复杂实现的开发提供信息。
此示例还显示了在设计中使用单独模块的价值。使用跟踪,开发人员可以在扩展到完整的系统实现之前测量和验证这些模块中关键核心功能的性能,而无需大量开销。这有助于证明应用程序在功能上正确且性能良好,且目标环境中的更改最少。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !