电子说
本次我要讲的是4G模组LuatOS开发的iconv字符集转换,已整理成文,今天便分享供大家。
一、字符编码介绍
1.1 字符编码的定义与作用
字符编码(Character encoding)是指将字符集中的字符编码为指定集合中的某一对象(例如:比特模式、自然数序列、8 位组或者电脉冲),以便文本在计算机中存储或通过通信网络传递。常见的例子包括将拉丁字母表编码成摩斯电码和 ASCII,其中 ASCII 使用 7 个或 8 个二进制位进行编码,最多可以给 256 个字符分配数值。
1.2 常见字符编码格式
ASCII:使用 7 个或 8 个二进制位进行编码,最多可以给 256 个字符分配数值,包括字母、数字和符号。
Unicode:一种国际标准字符集,支持世界上几乎所有的书写系统,包括汉字、日文假名等。
UTF-8:Unicode 的一种变长字符编码,由 Ken Thompson 于 1992 年创建,现已标准化为 RFC 3629。UTF-8 用 1 到 6 个字节编码 Unicode 字符。
GB2312:中国国家标准字符集,用于简体中文。
GBK:在 GB2312 基础上扩展的字符集,支持更多的中文字符。
Big5:用于繁体中文的字符集。
1.3 字符编码格式的使用场景和注意事项
在使用不同的字符编码格式时,需要注意以下几点:
兼容性:确保发送端和接收端使用相同的字符编码,避免乱码问题。
转换规则:了解 Unicode 和 UTF-8 之间的转换规则,确保正确编码和解码。
应用场景:根据具体应用场景选择合适的字符编码格式,例如 Web 开发中常用 UTF-8。
二、演示功能概述
本文演示主要展示了在不同编码格式之间进行转换的工具和方法,包括 Unicode(小端和大端)、GB2312 和 UTF-8 等常见编码格式。通过使用 Lua 语言和 Air780E 核心板,实现了以下功能:
Unicode 小端编码与 GB2312 编码之间的转换。
Unicode 大端编码与 GB2312 编码之间的转换。
Unicode 小端编码与 UTF-8 编码之间的转换。
Unicode 大端编码与 UTF-8 编码之间的转换。
GB2312 编码与 UTF-8 编码之间的转换。
此外,还提供了一个简单的 Lua 脚本,用于在不同编码之间进行转换测试,并打印出转换后的编码数据。通过这个演示,大家可以了解不同编码格式之间的转换规则,并在实际应用中进行编码转换。
三、演示硬件环境
3.1 开发板
本文以 Air780E 核心板 为例,如下图所示:
详细使用说明参考:
https://docs.openluat.com/air780e/product/
Air780E 产品手册 中的 《开发板Core_Air780E使用说明VX.X.X.pdf》,写这篇文章时最新版本的使用说明为:《开发板Core_Air780E使用说明V1.0.5.pdf》 ;若在使用过程中遇到任何问题,可以直接参考这份使用说明 PDF 文档。
3.2 SIM 卡
在中国大陆环境下,使用移动,电信,联通的物联网卡或者手机卡都可以。
3.3 PC 电脑
WIN7以及以上版本的WINDOWS系统。
3.4 数据通信线
1. USB 转 Type-C 数据线
它的一端是 USB 接口,另一端是 Type-C 接口。
四、演示软件环境
4.1 Luatools 下载调试工具
Luatools 工具支持最新固件获取、固件打包、trace 打印及单机烧录等功能。
工具使用说明参考:
Luatools下载和详细使用
https://docs.openluat.com/Luatools/
4.2 源码及固件
1. 底层 core下载地址:
https://docs.openluat.com/air780e/luatos/firmware/
由于 Air780E 默认固件不支持 iconv 库,所以此处只放一个默认固件下载位置。要想使用 iconv 库,则需要进行云编译。使用指南参考:☁️ 云编译 - LuatOS 文档 本文使用的支持 iconv 库的底层 core 固件,已经放到下文第 3 点的 iconv.zip 中,可以直接使用
2. demo 位置
本 demo 主要用于演示在 LuatOS 系统中不同编码格式之间的相互转换
demo 位置参考:
https://gitee.com/openLuat/LuatOS-Air780E/tree/master/demo/iconv
3. 源码及固件已打包压缩,如下所示
压缩包中 core 文件夹存放的是固件,code 文件夹存放的是脚本代码。
五、软硬件资料
5.1 iconv 操作库介绍
需要注意,Air780E 默认固件不带 iconv 库,需要进行云编译添加。云编译操作指南参考:
☁️ 云编译 - LuatOS 文档
https://wiki.luatos.com/develop/compile/Cloud_compilation.html
5.1.1 iconv 库说明
这个库是一个用于在 Lua 中执行字符集转换的模块,称为 iconv。它提供了多种功能,允许用户在不同的字符编码之间进行转换。
5.1.2 API 接口介绍
本教程所使用 API 接口参考:
iconv - iconv 操作 - luatos@air780e - 合宙文档中心https://docs.openluat.com/air780e/luatos/api/core/iconv/
5.2 Air780E 核心板烧录说明
5.2.1 选择固件和脚本
1. 打开 Luatools 工具
2. 点击 项目管理测试
3. 根据图示操作
注意,大家只需要跟着做到第四步即可,第五步跟着后面的操作再做。
5.2.2 烧录
1. 将 Air780E 核心板通过 USB 数据线连接至电脑,如下图所示:
2. 根据下方操作进行烧录
此时就需要大家先点击 Luatools 工具上的 下载底层与脚本/下载脚本,再执行下方操作了。
开发板处于未开机状态:此时先按住下载模式按键(BOOT 键)不放,再长按开机键(POW 键)开机,若不出意外开发板将会进入下载模式,Luatools 工具下载进度条会开始跑,这时便可以松开 BOOT 键和 POW 键,等到工具提示下载完成即可。
开发板已经处于开机状态:此时可以先按住 BOOT 键不放,再短按复位键(RST 键)后开发板会重启并进入下载模式。
5.2.3 不同模式下的端口显示
六、功能验证
6.1 代码示例介绍
本文所用 Lua 代码是一个编码转换工具,主要用于在不同编码格式之间进行转换,包括 Unicode(小端和大端)、GB2312 和 UTF-8。以下是各个部分的详细介绍:
6.1.1 核心信息
PROJECT 和 VERSION 变量用于标识项目的名称和版本。
PRODUCT_KEY 是一个示例密钥,用户需根据实际情况进行替换。
通过 require 引用系统库 sys 和 sysplus。
6.1.2 编码转换函数
Unicode 小端与 GB2312 转换
ucs2ToGb2312(ucs2s):将 Unicode 小端编码转换为 GB2312 编码。
gb2312ToUcs2(gb2312s):将 GB2312 编码转换为 Unicode 小端编码。
Unicode 大端与 GB2312 转换
ucs2beToGb2312(ucs2s):将 Unicode 大端编码转换为 GB2312 编码。
gb2312ToUcs2be(gb2312s):将 GB2312 编码转换为 Unicode 大端编码。
Unicode 小端与 UTF-8 转换
ucs2ToUtf8(ucs2s):将 Unicode 小端编码转换为 UTF-8 编码。
utf8ToUcs2(utf8s):将 UTF-8 编码转换为 Unicode 小端编码。
Unicode 大端与 UTF-8 转换
ucs2beToUtf8(ucs2s):将 Unicode 大端编码转换为 UTF-8 编码。
utf8ToUcs2be(utf8s):将 UTF-8 编码转换为 Unicode 大端编码。
GB2312 与 UTF-8 转换
utf8ToGb2312(utf8s):将 UTF-8 编码转换为 GB2312 编码。
gb2312ToUtf8(gb2312s):将 GB2312 编码转换为 UTF-8 编码。
6.1.3 测试函数
代码中定义了一些测试函数,用于验证编码转换的正确性,并且打印出转换后的编码数据:
testucs2ToGb2312(ucs2s):测试 Unicode 小端到 GB2312 的转换。
testgb2312ToUcs2(gd2312num):测试 GB2312 到 Unicode 小端的转换。
testucs2beToGb2312(ucs2s):测试 Unicode 大端到 GB2312 的转换。
testgb2312ToUcs2be(gb2312s):测试 GB2312 到 Unicode 大端的转换。
testucs2ToUtf8(usc2):测试 Unicode 小端到 UTF-8 的转换。
testutf8ToGb2312(utf8s):测试 UTF-8 到 GB2312 的转换。
testgb2312ToUtf8(gb2312s):测试 GB2312 到 UTF-8 的转换。
6.1.4 主循环
在主任务中,使用 sys.taskInit 定义一个循环,不断进行编码转换测试,每隔一秒循环一次。
6.1.5 结尾
最后,通过 sys.run() 启动系统运行,确保程序按预期执行。
6.2 完整代码展示
6.3 运行结果展示
通过 Luatoos 工具查看
七、总结
本文演示通过对不同字符编码格式的介绍和实际转换操作,使得大家更加了解了字符编码在计算机通信中的重要性,以及如何在不同编码格式之间进行转换。演示中使用的工具和硬件环境为 Air780E 核心板和 Lua 编程语言,通过实际编码转换的例子,展示了字符编码转换在实际应用中的重要性。
在演示中,我们介绍了 Unicode(小端和大端)、GB2312 和 UTF-8 等常见编码格式,并展示了如何在 Lua 中使用 iconv 库进行编码转换。通过这个演示,大家可以了解到不同编码格式之间的差异,以及在不同场景下如何选择合适的编码格式。
此外,我们还提供了一个简单的 Lua 脚本,用于在不同编码之间进行转换测试,并打印出转换后的编码数据。这个脚本可以帮助大家更好地理解和掌握字符编码转换的原理和方法。
全部0条评论
快来发表一下你的评论吧 !