在rt-smart操作系统中elf加载运行要经过哪些步骤

描述

在用户态应用程序处理的任务中,elf 加载运行是一个比较重要的步骤,下面就分析一下在 rt-smart 操作系统中,想要将一个应用程序运行起来要经过哪些步骤。

ELF 格式介绍

ELF 代表 Executable and Linkable Format。它是一种对可执行文件、目标文件和库使用的文件格式。它在 Linux 下成为标准格式已经很长时间,ELF 一个特别的优点在于,同一文件格式可以用于内核支持的几乎所有体系结构上。

RT-SMART 同样也使用 ELF 作为可执行文件的格式,下面简单介绍一下 ELF 文件格式。

ELF 文件布局和结构

下图为 ELF 文件的基本布局:

LINUX内核

上图展示了 elf 文件的重要组成部分:

elf 文件头,除了用于标识ELF文件的几个字节之外,ELF头还包含了有关文件类型和大小的有关信息,

及文件加载后程序执行的入口点信息。

程序头表(program header table)向系统提供了可执行文件的数据在进程虚拟地址空间中组织

方式的相关信息。它还表示了文件可能包含的段数目、段的位置和用途。

各个段保存了与文件相关的各种形式的数据。例如,符号表、实际的二进制码、固定值(如字

符串)或程序使用的数值常数。

节头表(section header table)包含了与各段相关的附加信息。

使用 readelf 工具可以读取该类型文件中的各种数据结构。

关键数据结构

想要理解应用程序的加载运行过程,就必须要先了解 ELF 文件中的关键数据结构,知道可以通过 ELF 文件获取那些程序加载所必须的关键信息,例如文件类型、目标体系架构、版本号、程序入口点以及程序运行所需要的数据段存储在什么位置等等信息。这些信息都存放在 ELF 的相关数据结构中,那么现在就先了解一下 ELF 文件的相关数据结构吧。

下面是在 ELF 加载过程上下文数据结构,这个结构中包括了 eheader、pheader 和 sheader 三个 elf 的关键数据结构。

elf 头表

 

 1typedef struct
 2{
 3    unsigned char e_ident[EI_NIDENT]; /* 前四个字节为 0x7f E L F,其他的字节位置都有特定的语义 */
 4    Elf64_Half    e_type;             /* 用于区分 ELF 的文件类型,例如可重定位、可执行、动态库、core dump 文件 */
 5    Elf64_Half    e_machine;          /* 指定了文件所需的体系结构 */
 6    Elf64_Word    e_version;          /* 保存了版本信息,用于区分不同的 ELF 变体,目前该规范只定义了版本 1 */
 7    Elf64_Addr    e_entry;            /* 程序入口点 */
 8    Elf64_Off     e_phoff;            /* 程序头表在二进制文件中的偏移量 */
 9    Elf64_Off     e_shoff;            /* 节头表所在的偏移量 */
10    Elf64_Word    e_flags;            /* 特定于处理器的标志 */
11    Elf64_Half    e_ehsize;           /* 指定了ELF头的长度,单位为字节 */
12    Elf64_Half    e_phentsize;        /* 指定了程序头表中一项的长度,单位为字节(所有项的长度都相同) */
13    Elf64_Half    e_phnum;            /* 指定了程序头表中项的数目 */
14    Elf64_Half    e_shentsize;        /* 指定节头表中一项的长度,单位为字节(所有项的长度都相同) */
15    Elf64_Half    e_shnum;            /* 指定节头表中项的数目 */
16    Elf64_Half    e_shstrndx;         /* 包含各节名称的字符串表在节头表中的索引位置 */
17} Elf64_Ehdr;

 

程序头表

 

 1typedef struct
 2{
 3    Elf64_Word    p_type;             /* 当前项描述的段的种类,例如可装载段、动态链接、程序解释等段类型 */
 4    Elf64_Word    p_flags;            /* 保存了标志信息,定义了该段的访问权限,RWX */
 5    Elf64_Off     p_offset;           /* 给出了所描述段在文件中的偏移量(从二进制文件起始处开始计算,单位为字节) */
 6    Elf64_Addr    p_vaddr;            /* 给出了段的数据映射到虚拟地址空间中的位置(对于可装载段类型) */
 7    Elf64_Addr    p_paddr;            /* 只支持物理寻址,不支持虚拟寻址的系统,将使用 p_paddr 保存信息 */
 8    Elf64_Xword   p_filesz;           /* 指定了段在二进制文件中的长度 */
 9    Elf64_Xword   p_memsz;            /* 制定了段在虚拟地址空间中的长度(单位为字节),与文件中物理的长度差值可通过阶段数据或者填充 0 字节来补偿 */
10    Elf64_Xword   p_align;            /* 指定了段在内存和二进制文件中对其的方式(p_vaddr 和 p_offset 地址必须是模 p_align 的,也就是 p_align 的倍数),例如 p_align 的值为 0x1000 = 4096,这意味着段必须对其到 4KB 页 */
11} Elf64_Phdr;

 

节头表

 

 1typedef struct
 2{
 3    Elf64_Word    sh_name;            /* 指定了节的名称,其值不是字符串本身,而是字符串表的一个索引 */
 4    Elf64_Word    sh_type;            /* 指定了节的类型,例如不可用、保存程序相关信息、符号表、包含字符串表的节、重定位信息、散列表、动态链接信息等类型 */
 5    Elf64_Xword   sh_flags;           /* 节是否可写(SHF_WRITE),是否将为其分配虚拟内存(SHF_ALLOC),节是否包含可执行的机器代码(SHF_EXECINSTR) */
 6    Elf64_Addr    sh_addr;            /* 指定节映射到虚拟地址空间中的位置 */
 7    Elf64_Off     sh_offset;          /* 指定了节在文件中的开始位置 */
 8    Elf64_Xword   sh_size;            /* 指定了节的长度,单位为字节 */
 9    Elf64_Word    sh_link;            /* 引用另一个节头表项,可能根据节类型而进行不同的解释 */
10    Elf64_Word    sh_info;            /* 与上一项联用 */
11    Elf64_Xword   sh_addralign;       /* 指定了节数据在内存中对齐的方式 */
12    Elf64_Xword   sh_entsize;         /* 指定了节中各数据项的长度,前提是这些数据项的长度都相同,例如字符串表 */
13} Elf64_Shdr;

 

在 rt-smart 实际编码实现的过程中,为了方便数据传递,设计了一个包含上述三种数据类型的结构,利用该数据结构可以使加载过程实现更加简洁易懂,如下所示:

 

 1struct elf_load_context
 2{
 3    int fd;                     /* 应用程序文件 fd */
 4    int len;                    /* 用于临时使用的 len */
 5    uint8_t *load_addr;         /* 用于临时使用的加载地址 */
 6    struct rt_lwp *lwp;         /* 进程句柄 */
 7    struct process_aux *aux;    /* 进程辅助信息句柄*/
 8    rt_mmu_info *m_info;        /* 进程 mmu 信息 */
 9    Elf_Ehdr eheader;           /* elf 头表 */
10    Elf_Phdr pheader;           /* 程序头表 */
11    Elf_Shdr sheader;           /* 节头表   */
12    struct map_range user_area[2]; /* 在用户空间需要映射的地址空间,0 用于代码段,1 用于数据段 */
13};

 

ELF 标准节

ELF 标准定义了若干固定名称的节。这些用于执行大多数目标文件所需的标准任务。所有名称都从点开始,以便与用户定义节或非标准节相区分,最重要的标准节如下所示:

LINUX内核

有了以上基础概念,就可以来探索真正的代码实现了。

探索程序加载代码实现

执行一个新的应用程序功能由 lwp_execve 函数来实现,该函数会初始化好一个进程所需要的运行环境,然后在该环境中启动第一个线程,也就是 main 线程。

暂且先不关注进程 PID 申请以及的 mmu 表初始化等准备工作,将注意力集中在 lwp_load 函数上。该函数将执行如下操作:

打开 elf 文件,返回文件 fd

调用 load_elf 函数开始执行应用程序加载

在 load_elf 函数中,将执行如下操作:

检查 elf 头,判断其魔数、架构类型、版本号等是否符合要求

判断是静态加载还是动态加载

检查程序入口地址是否为有效的用户态地址

遍历读取程序头表以及程序复制信息,将其加载到进程的用户空间里

遍历读取节头表,根据节头表中的信息,计算在用户态需要需要分配多大的地址空间用于存放 text 段以及 data 段

根据上一步骤的计算,修改进程的映射表,真正为数据段分配用户态地址空间

遍历节头表,程序运行所需要数据段加载到用户地址空间中

通过上面的操作,ELF 文件中所有关于程序启动运行所需的数据就都准备好了,接下来就可以在此基础上启动第一个线程,也就是 main 线程了。相关的代码细节在这里就不做赘述了,源代码中都添加了详尽的注释,可以自行查看。

总结

用户态进程代码量较大,同时由于复杂度过高也不容易理解,现在代码经过完善,复杂度降低以后,可读性方面有了巨大提升。想要深入了解用户态的相关实现,还需要至少了解另外三个主题:

进程切换过程中底层架构级别的汇编代码

进程资源管理相关内容,例如 pid、tid 的分配,用户态内存空间映射等

SMP 多核调度原理与实现






审核编辑:刘清

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分