代码逻辑比较简单:
1、确定就绪队列的当前执行的调度实体
/* 确定就绪队列的当前执行进程curr */
struct sched_entity *curr = cfs_rq- >curr;
2、根据获取的当前执行进程,计算当前和上一次更新负荷权重时两次的时间的差值
u64 now = rq_clock_task(rq_of(cfs_rq));
u64 delta_exec;
if (unlikely(!curr))
return;
delta_exec = now - curr- >exec_start;
if (unlikely((s64)delta_exec <= 0))
return;
3、重新更新启动时间exec_start为now,以备下次计算时使用,最后将计算出的时间差加到先前的统计时间上。
/* 重新更新启动时间exec_start为now */
curr- >exec_start = now;
schedstat_set(curr- >statistics.exec_max,
max(delta_exec, curr- >statistics.exec_max));
/* 将时间差加到先前统计的时间即可 */
curr- >sum_exec_runtime += delta_exec;
schedstat_add(cfs_rq, exec_clock, delta_exec);
这也是通过cat /proc/$pid/sched看到的一些统计信息
4、开始计算虚拟时间
curr- >vruntime += calc_delta_fair(delta_exec, curr);
5、计算虚拟时间函数calc_delta_fair如下,忽略舍入和溢出检查,calc_delta_fair函数所做的计算如下:
/*
* delta /= w
*/
static inline u64 calc_delta_fair(u64 delta, struct sched_entity *se)
{
if (unlikely(se- >load.weight != NICE_0_LOAD))
delta = __calc_delta(delta, NICE_0_LOAD, &se- >load);
return delta;
}
其中NICE_0_LOAD的值为:1024,当进程的nice=0时,不需要进行加权处理,其虚拟时间就等于其实际运行时间。
# define SCHED_FIXEDPOINT_SHIFT 10
#define NICE_0_LOAD_SHIFT (SCHED_FIXEDPOINT_SHIFT)
#define NICE_0_LOAD (1L < < NICE_0_LOAD_SHIFT)
1024也就是Nice值为0对应的权重值,权重值在内核中是预先定义好的,如下所示:
const int sched_prio_to_weight[40] = {
/* -20 */ 88761, 71755, 56483, 46273, 36291,
/* -15 */ 29154, 23254, 18705, 14949, 11916,
/* -10 */ 9548, 7620, 6100, 4904, 3906,
/* -5 */ 3121, 2501, 1991, 1586, 1277,
/* 0 */ 1024, 820, 655, 526, 423,
/* 5 */ 335, 272, 215, 172, 137,
/* 10 */ 110, 87, 70, 56, 45,
/* 15 */ 36, 29, 23, 18, 15,
};
通过公式和内核预先设定的权重表,可以看出来:
Nice值越高(对应的优先级越低),权重越小,虚拟时间累加的越快(虚拟时间过得越快),Nice值越低(对应的优先级越高),权值越高,虚拟时间累加的越慢(虚拟时间过得越慢)。CFS的思想核心也就是这样,让每个调度实体的虚拟时间增加速度不同,使用虚拟时间来衡量调度实体在CPU上已经执行的时间。
总结:
不同优先级的进程以各自对应的速度推进虚拟时间,只要保证在一个调度延迟内虚拟时间的推进进展相同,就实现了完成公平,公平指的是相对公平,即按进程的权重给予不同的运行时间,虚拟时间越小,代表着受到了"不公平"对待,因此下一个参与调度的调度实体就是红黑树中的最左边(虚拟时间最小)的节点,如此一来既能公平选择进程,又能保证高权重进程获得较多的运行时间。
全部0条评论
快来发表一下你的评论吧 !