Sigmastar Comake D1 ssd2355 AIOT开发板 开箱体检分享

电子说

1.4w人已加入

描述

开发板介绍

了解到星宸科技也开始做开发板了, 他们家的芯片主打性价比,刚好对端侧的AI开发比较感兴趣,在他们商店买了一套Comake PI D1开发板套件,此文记录一下开箱与使用体验!希望能帮助到大家

更多详细的介绍可以去看[Comake官网] ,或者Comake社区的[贴子] 。

1.到手开箱

开箱!可以看到配件,开发板都在箱子里,整个套件的东西还是很多的。

SigmaStar

SigmaStar

全部拿出来,可以看到包括了:开发板、电源、串口板、亚克力板和螺栓、屏幕、麦克风、扬声器还有组合固定用的亚克力板和螺栓。

SigmaStar

接下来把整个套件安装起来。

2.硬件环境搭建

在官方的[Sigdoc] 中,有对板子硬件的说明,可以看到开发板的系统介绍和接口介绍

SigmaStar

从客服那边了解到, 安装可以参考官方Comake社区中的[配件安装说明] 以及相应[安装视频]

另外这边特别提醒如下:

1.一定要断电状态下安装连接。

2.特别注意屏幕的连线一定要参考官方的配件安装说明,接错或者接反很可能烧坏屏幕。

整个配件安装完就和下图一样

SigmaStar

整个套件的内容还是比较多的,全部连接上也比较分散。不过还好官方也提供了亚克力板来固定,参考官方的安装教程,可以把开发板和亚克力板组合起来,把摄像头、屏幕等配件固定上去。全部安装好之后应该是这个样子。

SigmaStar

3.软件环境搭建

3.1获取软件资料

Comake D1的相关开发资料,可以到[Comake开发者社区] 去下载。

SigmaStar

这里注意,需要注册账号并且完成实名认证,认证通过后方可下载SDK等资料。注册的时候需要提供认证材料。审核是比较宽松也很快的,着急的话可以直接联系客户。

验证通过后就可以下载了。

SigmaStar

SigmaStar

可以根据需要下载,下载完后的资料包内包括有软硬件资料及说明文档,还有各种工具包。

另外他们还建了官方外网的git server, 下一个SDK大版本发布之前,如果想追新, 买了开发板之后, 也可以联系客户去申请官方git账户,
实时的去下载开发版本的SDK。

3.2开发环境搭建

开发环境通常包括 Linux服务器(用来编译代码)、Windows工作台(用来编写代码)和目标板(用来运行代码),三者处于同一个网络中。这里我在虚拟机上搭建了Ubuntu服务器用来编译代码。具体的步骤不再赘述,可以网上搜索,有很多详细的教程。在官方的[Sigdoc 编译环境搭建] 中也有对应的教程。

如果遇到问题也可以参考Comake社区上的这篇[贴子] 。

4.开始使用

4.1. GUI 的功能体验

开发板在出厂时,默认烧录了带gui界面的32bit image。因此即使上面软件环境搭建一时没有完成,也可以先体验使用一下。配件和亚力克板安装完成后,上电,启动,可以直接启动到gui界面,在屏幕上会显示flythings的gui。

SigmaStar

该GUI上面看介绍大概支持如下功能,可玩性还是挺高的:

1.音频播放:演示录音和播放的 Demo

演示不同麦克风输入硬件( AMIC 模拟麦克风,最大支持3通道输入。 DMIC 数字矩阵麦克风,最大支持 8通道输入)的录音效果,支持不同8K/16R/45K不同的采样率,支持录音音量调节。

2.视频播放:演示视频的播放,目前是固定演示一个片源,支持音量的调节

3.摄像头:演示单路摄像头的画面显示,并对接了 IPU 的物体识别算法,能够实时识别摄像头看到的物体类型和位置,例如人物、显示器、键盘等

4.音频算法播放:

  • 人声消除算法演示,算法打开时消除播放声音中的人声,用于歌时,制作不带原唱的背景音乐
  • APC 算法演示,演示 ANR (降噪)、 EQ (均衡器处理)、 AGC (自动增益控制)三个算法的集合,这个是音频算法前处理的基本功能
  • 环绕音渲染增强,增强空间音效
  • 人声关化算法,一般用于 R 歌,为输入的人声增加混响等效果,让声音听起来更好听

5.KMS + ASR :

  • KWS 关键词识别, DMIC 收音后,给到 IPU 做关键字匹配,如果识别到了就点亮右下角"你好小星"
  • ASR 语音转文字,暂时不支持语义识别

6.TTS :文本转语音, Demo 演示了5段不同的文本语音播放的效果,点击文本位置触发文字转语音播放

7.火山模型: 对接了豆包大模型,支持模型功能的演示

接下来我们来一起看下其中一些功能的效果吧!!

4.1.1. 摄像头显示

滑动GUI到第二页,可以看到摄像头的图标

SigmaStar

点击就可以打开。可以看到摄像头的画面输出到屏幕上。并且附带了模型检测,在摄像头前的物体会被识别然后画框。

SigmaStar

4.1.2. 火山引擎大模型

在GUI界面第三页,可以看到有火山引擎图标。这个是内置的demo程序,不能直接使用,需要先在火山引擎上配置文件并且载入板端。

具体的操作可以跟着Comake社区的[贴子] ,一步一步操作。这里不赘述了。

SigmaStar

在全部配置完成后,启动。屏幕会切换到摄像头画面

SigmaStar

同时,扬声器会播放语音“你好,我是小星”的欢迎词。如果你说“你好小星”,那么也会有相应的语句回应。这里我们插上串口板,可以看见大模型的数据发送。

SigmaStar

SigmaStar

4.2. AI实战Demo功能体验

另外建议把把串口也连上,串口的连接同样可以参考Comake开发者社区的这篇[贴子] 。 连上串口之后,除了
上述GUI功能, 该开发板还提供了大量的demo程序,比如 /customer/opendla 提供了大量的AI 算法demo ,具体介绍可以参考 [IPU Sigdoc 开源算法demo实战的介绍]

/customer/opendla # ls 
models                      prog_sed_eat
prog_asr_conformer          prog_segmentation_yolov8
prog_benchmark              prog_separation_sepformer
prog_classification         prog_speaker
prog_detection_yolov11_obb  prog_tts_fastspeech2
prog_detection_yolov5       prog_tts_vits
prog_detection_yolov8       prog_vad_nemo
prog_llm_conformer_punc     prog_vlm_clip
prog_llm_transformerlm      prog_vlm_mobilesam
prog_ocr_lpr                prog_vlm_tag2text
prog_ocr_ppocr              prog_vlm_yolo_world
prog_pose_yolov8            resource

我这里跑了一下yolov8 算法的效果:

1.串口输入如下cmd

cd /customer/opendla
  ./prog_detection_yolov8 -i ./resource/bus.jpg -m ./models/dectection/yolov8n_640x640.img

2.输出结果如下:
SigmaStar

SigmaStar

4.3. 其他功能Demo的体验

在/customer/sample code 也放了海量demo,具体每个demo的用法可以参考SDK内部对应source code目录下的readme.md .感兴趣的小伙伴可以进一步的去研究。

/customer/sample_code # ls -x
audio_ai_ao_demo
audio_alg_2mic_bf_ssl_demo
audio_alg_4mic_bf_ssl_demo
audio_alg_aec_demo
audio_alg_apc_demo
audio_alg_kws_demo
audio_alg_mix_demo
audio_alg_sed_demo
audio_alg_vad_demo
audio_mp3_play_demo
bootlogo_mem_free
crypto_aes_demo
crypto_rsa_demo
crypto_sha_demo
disp_panel_demo
disp_pspi_demo
disp_sensor2Panel_demo
dla_detection_demo
dla_ipu_utilization
double_sensor_transfer_double_sensor_openh264_transfer_demo
double_sensor_transfer_double_sensor_transfer_demo
gfx_gfx_demo
intercoremgr
ive_sample_16bit_to_8bit
ive_sample_acc
ive_sample_add
ive_sample_adp_thresh
ive_sample_alpha_blending
.....等

5.总结

1.comake PI D1的套件内容非常齐全,在视频相关、音频相关、AI相关的开发上有丰富的硬件资源和软件资料。同时[Sigdoc]和[Comake开发者论坛] 都有内容丰富易上手的开发指导资料,也可以在[Comake开发者论坛] 上直接提问。

2.买了开发板还可以进入vip 群,有什么问题都可以及时的交流,原厂直接支持

总的来说,Comake PI D1在智慧视觉、智慧音频、智能机器人、小屏显示、工业HML PLC等应用的音视频处理+AI方向上有非常不错的使用体验和使用前景。

审核编辑 黄宇

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分