周立功来讲解哈希表的实现

电子说

1.2w人已加入

描述

近日周立功教授公开了数年的心血之作《程序设计与数据结构》,电子版已无偿性分享到电子工程师与高校群体下载,经周立功教授授权,特对本书内容进行连载。

>>>> 1.1.1 哈希表的实现

1. 初始化

hash_db_init()接口用于哈希表实例的初始化在定义哈希表结构体类型时,哈希表数组大小、记录长度、关键字长度和哈希函数都需要由用户根据实际情况确定,其函数原型定义如下(hash_db.h):

int hash_db_init (

           hash_db_t       *p_hash,                          // 指向哈希表实例的指针

         unsigned int     size,                              // 哈希表大小

         unsigned int     key_len,                         // 关键字长度

         unsigned int     value_len,                            // 记录长度

         hash_func_t     pfn_hash);                            // 哈希函数

在这里以学生记录为例创建一个大小为250组的哈希表

      hash_db_t  hash_students;

      hash_db_init(

           &hash_students,

           250,                                                 // 大小为250

           6,                                                // 关键字长度为6字节

           sizeof(student_t),                                   // 记录的长度

           (hash_func_t)db_id_to_idx);                          // 哈希函数 

在初始化函数的实现中需要按照size指定的大小分配内存用于存储哈希表的各个表项链表头),接着需要完成各个链表头和结构体成员的初始化初始化函数的实现范例详见程序清单3.63

程序清单3.63  初始化函数范例程序

1    int hash_db_init (hash_db_t   *p_hash, unsigned int size, unsigned int key_len,

2                     unsigned int value_len, hash_func_t pfn_hash)

3    {

4        int i;

5        if ((p_hash == NULL) || (pfn_hash == NULL)){ 

6            return NULL;

7        }

8        p_hash -> p_head = (slist_head_t *)malloc(size * sizeof(slist_head_t));

9        if (p_hash -> p_head == NULL) {

10          return -1;

11      }

12      for (i = 0; i < size; i++){

13          slist_init(&p_hash -> p_head[i]);

14      }

15      p_hash -> size           = size;

16      p_hash -> key_len         = key_len;

17      p_hash -> value_len  = value_len;

18      p_hash -> pfn_hash       = pfn_hash;

19      return 0;

20  } 

2. 添加记录

hash_db_add()接口用于向已经初始化的哈希表中添加一条记录,添加一条记录时,需要指定关键字信息和记录值信息,其函数原型定义(hash_db.h):

int hash_db_add (hash_db_t *p_hash, void *key, const void *value); 

其中,p_hash为指向哈希表实例的指针,key为指向关键字的指针,value为指向记录值的指针。特别地,由于在添加记录时,程序不会修改key和value指针所指向的值,因此,指针都加了const修饰符。以添加一条学生记录为例,使用范例如下:

    student_t stu = {

               "zhangsan",

            'M',

            173.3,

            60

    };

    unsigned char id[6] = {0x20, 0x14, 0x44, 0x70, 0x02, 0x39};

    hash_db_add(&hash_students, id, &stu);

在添加记录函数的实现中,首先需要使用哈希函数找到关键字对应的记录在哈希表中的索引,以确定该条记录所在链表的表头,然后分配一个存储记录的结点空间,将关键字、记录等信息存储在该空间中,然后将结点添加到对应链表的头部(由于记录在链表中的具体位置不重要,因此直接添加在链表头部,效率更高)。函数实现的范例详见程序清单3.64

程序清单3.64  添加记录函数范例程序

1    int hash_db_add (hash_db_t *p_hash, const void *key, const void *value)

2    {

3        int idx = p_hash -> pfn_hash(key);                  // 使用哈希函数通过关键字得到哈希值

4        // 分配内存,存储链表结点+关键字+记录

5        char *p_mem = (char *)malloc(sizeof(slist_node_t) + p_hash -> key_len + p_hash -> value_len);

6        if (p_mem == NULL) {

7            return -1;

8        }

9        memcpy(p_mem + sizeof(slist_node_t), key, p_hash -> key_len);                  // 存储关键字

10      memcpy(p_mem + sizeof(slist_node_t) + p_hash->key_len, value, p_hash->value_len); // 存储记录

11      return slist_add_head(&p_hash -> p_head[idx], (slist_node_t *)p_mem);      // 将结点加入链表

12  } 

程序分配了一个结点的空间该结点的空间需要存储一个slist_node_t类型链表结点,便于添加结点到链表中,存储长度为p_hash->key_len的关键字,存储长度为p_hash->value_len的记录值,详见图3.26,其内存的大小为

sizeof(slist_node_t) + p_hash -> key_len + p_hash -> value_len

大数据

图3.26  结点存储空间

由于结点空间的首部用于存储结点slist_node_t的值以组织链表。因此需要将结点添加到链表中时,直接将p_mem转换为slist_node_t*类型使用即可,通用链式哈希表的结构示意图详见图3.27

大数据

图3.27  通用的链式哈希表结构示意图

图3.25中管理学生记录的链式哈希表结构示意图对比发现,它们表达的含义是完全一致的,仅仅是具体类型变为了更加通用的void *类型。

3. 查找记录

hash_db_search()接口通过关键字查找与之对应的记录,查找记录时,需要指定关键字信息,同时还需要使用一个指向记录的指针获取查找到的记录值,其函数原型(hash_db.h)如下:

int hash_db_search(hash_db_t *p_hash,const void *key, void *value); 

虽然参数与添加记录是完全一样的,但value表示的含义却不一样,此处的value是输出参数,用于得到查找到的记录值。而添加记录函数中的value是输入参数,提供需要存储的记录值。由于此处的value指向指向的值是需要被改变的(改变为查找到的记录值),因此,其不能增加const修饰符。以查找ID为201444700239的学生记录为例,使用范例如下:

student_t  stu;

unsigned char id[6] = {0x20, 0x14, 0x44, 0x70, 0x02, 0x39};

if (hash_db_search(&hash_students, id, &stu) == 0) {

         // 查找到该学号的学生记录

} else {

         // 查找失败,未找到该学号的学生记录

}

在该函数的实现中,首先需要使用哈希函数找到关键字对应的记录在哈希表中的索引,以确定该条记录所在链表的表头,然后遍历链表的各个结点,将提供的关键字与结点中存储的关键字比对,直到找到关键字完全一致的记录(查找成功)或链表遍历结束(查找失败)。找到该记录对应的结点后,将结点中存储的value值拷贝到参数value指针指向的空间中即可。函数实现的范例详见程序清单3.65

程序清单3.65  查找记录函数范例程序

1    // 寻找结点的上下文(仅内部使用)

2    struct _node_find_ctx {

3        void        *key;                                 // 查找关键字

4        unsigned int  key_len;                            // 关键字长度

5        slist_node_t  *p_result;                            // 用于存储查找到的结点

6    };

7

8    // 遍历链表的回调函数,查找指定结点

9    static int __hash_db_node_find (void *p_arg, slist_node_t *p_node)

10  { 

11      struct _node_find_ctx *p_info = (struct _node_find_ctx *)p_arg;   // 用户参数为寻找结点的上下文

12      char              *p_mem = (char *)p_node + sizeof(slist_node_t); // 关键字存储在结点之后

13

14      if (memcmp(p_mem, p_info->key, p_info->key_len) == 0) {

15          p_info->p_result = p_node;

16          return -1;                                               // 找到该结点,终止遍历

17      }

18      return 0;

19  }

20 

21  int hash_db_search(hash_db_t *p_hash, const void *key, void *value)

22  {

23      int idx = p_hash->pfn_hash(key);                       // 得到关键字对应的哈希表的索引

24      struct _node_find_ctx info = {key, p_hash->key_len, NULL};     // 设置遍历链表的上下文信息

25      slist_foreach(&p_hash->p_head[idx], __hash_db_node_find, &info);  // 遍历,寻找关键字对应结点

26 

27      if (info.p_result != NULL) {     // 找到对应结点, 将存储的记录值拷贝到用户提供的空间中

28          memcpy(value, (char *)info.p_result+sizeof(slist_node_t)+p_hash->key_len+p_hash->value_len);

29          return 0;

30      }

31      return -1;

32  } 

程序中,由于查找结点时需要遍历链表,关键字比对的操作需要在遍历函数的回调函数中完成,因此,需要将用户查找记录使用的关键字信息(关键字及其长度)提供给回调函数,同时,当查找到记录时,需要将查找到的结点反馈给调用遍历函数的主程序。为此,定义了一个内部使用的用于寻找一个结点的上下文结构体:

struct _node_find_ctx {

           const void    *key;                           // 查找关键字

           unsigned int  key_len;                               // 关键字长度

          slist_node_t   *p_result;                             // 用于存储查找到的结点

      }; 

调用遍历函数时,需要提供一个设置好关键字信息的结构体作为回调函数的用户参数。遍历函数结束时,可以通过该结构体中的p_result成员获取遍历结果。

4. 删除记录

该接口用于删除指定关键字对应的记录,可以定义其函数名为:hash_db_del()。删除记录时,需要指定关键字信息。可以定义函数的原型为:

int hash_db_del(hash_db_t *p_hash, const void *key); 

以删除学号为201444700239的学生记录为例,使用范例如下:

unsigned char id[6] = {0x20, 0x14, 0x44, 0x70, 0x02, 0x39};

hash_db_del(&hash_students, id);

在该函数的实现中,绝大部分操作与查找记录是相同的,唯一的不同是,当找到关键字对应的结点时,不再需要将记录值提取出来,直接将该结点删除即可。函数实现的范例详见程序清单3.66

程序清单3.66  删除记录函数范例程序

1    int hash_db_del (hash_db_t *p_hash, const void *key)

2    {

3        int idx = p_hash->pfn_hash(key);                        // 得到关键字对应的哈希表的索引

4        struct _node_find_ctx info = {key, p_hash->key_len, NULL};         // 设置遍历链表的上下文信息

5        slist_foreach(&p_hash->p_head[idx], __hash_db_node_find, &info);     // 遍历,寻找关键字对应结点 

6        if (info.p_result != NULL) {

7            slist_del(&p_hash->p_head[idx], info.p_result);                 // 从链表中删除该结点

8            free(info.p_result);                                                // 释放结点空间

9            return 0;

10      }

11      return -1;

12  } 

5. 解初始化

对应于哈希表的初始化,用于当不再使用哈希表时,释放相关的空间。可以定义其函数名为:hash_db_deinit()。需要通过参数指定需要解初始化的哈希表实例,可以定义函数的原型为(hash_db.h):

int hash_db_deinit (hash_db_t *p_hash); 

如不再使用学生信息管理系统,则需使用解初始化函数释放哈希表的相关资源,使用范例如下:

hash_db_deinit(&hash_students); 

在该函数的实现中,需要释放程序中分配的所有空间,主要包括添加记录时分配的结点空间,链表头结点数组空间。函数实现详见程序清单3.67

程序清单3.67  解初始化函数范例程序

1    int hash_db_deinit (hash_db_t *p_hash)

2    {

3        int i;

4        slist_node_t *p_node;

5        for (i = 0; i < p_hash->size; i++) {                   // 释放哈希表中各个表项中存储的所有结点

7            while (slist_begin_get(&p_hash->p_head[i]) != slist_end_get(&p_hash->p_head[i])) {

8                p_node = slist_begin_get(&p_hash->p_head[i]);

9                slist_del(&p_hash->p_head[i], p_node);            // 删除第一个结点

10              free(p_node);

11          }

12      }

13      free(p_hash->p_head);                                     // 释放链表头结点数组空间

15      return 0;

16  } 

为便于查阅,如程序清单3.29所示展示了hash_db.h文件的内容。

程序清单3.68  hash_db.h文件内容

1    #pragma once; 

2    #include "slist.h"

3

4    typedef unsigned int (*hash_func_t) (const void *key);  // 哈希函数类型,返回值为整数,参数为关键字

5    struct _hash_db{

6        slist_head_t  *p_head;                            // 指向数组首地址

7        unsigned int  size;                                // 数组成员数

8        unsigned int  value_len;                           // 一条记录的长度

9        unsigned int  key_len;                            // 关键字的长度

10      hash_func_t  pfn_hash;                           // 哈希函数

11  };

12  typedef struct _hash_db *hash_db_t;                // 指向哈希表对象的指针类型

13

14  int hash_db_init (hash_db_t    *p_hash,             // 哈希表初始化

15                unsigned int    size,

16                unsigned int    key_len,

17                unsigned int    value_len,

18                hash_func_t    pfn_hash);

19

20  int hash_db_add (hash_db_t *p_hash, const void *key,const void *value);   // 添加记录

21  int hash_db_del (hash_db_t *p_hash, const void *key);                    // 删除记录

22  int hash_db_search(hash_db_t *p_hash, const void *key, void *value);   // 查找记录

23  int hash_db_deinit (hash_db_t *p_hash);                                    // 解初始化 

以使用该链式哈希表管理系统来管理学生记录为例综合范例程序详见程序清单3.30

程序清单3.69  哈希表综合范例程序

1     #include

2     #include

3     #include "hash_db.h"

4

5     typedef struct _student{

6         char  name[10];                               // 姓名

7         char  sex;                                   // 性别

8         float  height, weight;                         // 身高、体重

9     } student_t;

10

11    int db_id_to_idx (unsigned char id[6])               // 通过ID得到数组索引

12    { 

13        int i;

14        int sum = 0;

15        for (i = 0; i < 6; i++){

16            sum += id[0];

17        }

18        return sum % 250;

19    }

20

21    int student_info_generate (unsigned char *p_id, student_t *p_student)   // 随机产生一条学生记录

22    { 

23        int i;

24        for (i = 0; i < 6; i++) {                              // 随机产生一个学号

25            p_id[i] = rand();

26        }

27        for (i = 0; i < 9; i++) {                               // 随机名字,由 'a' ~ 'z' 组成

28            p_student->name[i] = (rand() % ('z' - 'a')) + 'a';

29        }

30        p_student->name[i]= '\0';                              // 字符串结束符 

31        p_student->sex    = (rand() & 0x01) ? 'F' : 'M';            // 随机性别

32        p_student->height = (float)rand() / rand();

33        p_student->weight = (float)rand() / rand();

34        return 0;

35    }

36

37    int main ()

38    { 

39        student_t      stu;

40        unsigned char      id[6];

41        int            i;

42      hash_db_t     hash_students;

43

44        hash_db_init(&hash_students, 250, 6, sizeof(student_t), (hash_func_t)db_id_to_idx);

45

46        for (i = 0; i < 100; i++) {                        // 添加100个学生的信息

47            student_info_generate(id, &stu);               //  设置学生的信息,当前一随机数作为测试

48            if (hash_db_search(&hash_students, id, &stu) == 0) {    // 查找到已经存在该ID的学生记录

49                printf("该ID的记录已经存在!\n");

50                continue;

51            } 

52            printf("增加记录:ID : %02x%02x%02x%02x%02x%02x",id[0],id[1],id[2],id[3],id[4],id[5]);

53            printf("信息: %s  %c %.2f %.2f\n", stu.name, stu.sex, stu.height, stu.weight);

54            if (hash_db_add(&hash_students, id, &stu) != 0) {

55                printf("添加失败");

56            }

57        }

58

59        printf("查找ID为:%02x%02x%02x%02x%02x%02x的信息\n",id[0],id[1],id[2],id[3],id[4],id[5]);

60        if (hash_db_search(&hash_students, id, &stu) == 0) {

61            printf("学生信息: %s  %c %.2f %.2f\n", stu.name, stu.sex, stu.height, stu.weight);

62        } else {

63            printf("未找到该ID的记录!\r\n");

64        }

65        hash_db_deinit(&hash_students);

66        return 0;

67    }

在这里,首先创建了一个哈希表,然后向其中添加了100个学生信息(随机数的方式产生的),接着查找了ID对应的学生信息(这里的ID没有特别设置,即查找最后添加的学生记录),最后释放哈希表。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分