历史上的今天

今天是:2024年09月06日(星期五)

正在发生

2021年09月06日 | 徒手编写了一个STM8的反汇编工具

发布者:石头12345 来源: eefocus关键字:STM8  反汇编工具 手机看文章 扫描二维码
随时随地手机看文章

最近打算玩一下STM8, 只为了消化一下我的库存,因为我曾经买过几个型号的STM8单片机,但是一直没用来DIY啥。我对STM8熟悉程度远不如STM32,  后者是流行广泛的ARM核,STM8却是ST独家的架构。

STM8 CPU是在ST7基础上增强,有人说是从6502演变来的,我看倒也不像。学习了一下历史,Motorola的6800演变出来的6805/6811/6809三个分支,以及6502这个与6800有渊源的CPU,从寄存器和指令集上看STM8是和它们有相似之处的,不过差异的地方也很大。作为一个8位MCU,STM8的寻址范围居然达到16M byte(我不信ST会给8位机配上1M以上的ROM或RAM),寻址模式就很多了,间接内存访问比x86都复杂,看惯了RISC的CPU更不能忍。好吧,虽然指令集复杂,STM8的执行速度还快,反正不会纯用汇编来开发。

ST并没有提供STM8的C编译器(汇编器是有的),需要用第三方的。Cosmic C编译器有免费License的版本可以用,这也是ST推荐的,我就装了一个来试。ST官方支持的还有Raisonance的编译器,此外IAR也有STM8的开发环境。


试写了个C程序测试,可以用STVP连接ST-Link下载程序,但我觉得还需要个能反汇编看编译结果的东西。Cosmic工具链里面没有反汇编程序,ST的汇编工具里也没有,STVD既然能跟踪调试应该有,但我没能把它用起来。


干脆自己写一个STM8反汇编工具吧,也练下手怎么写。

先研究下STM8的指令集,这是一种典型变长指令集,除了前缀字节,操作码就在一个字节里面。于是我照着手册统计了一张表出来:
 
一个字节能表示的范围除了 0x90, 0x91, 0x92, 0x72 用来做指令前缀,其它几乎都用来作操作码了。当然许多指令都有多种寻址模式的(比如加法是谁和谁相加,需要指定),因此用了不止一个操作码。算上寻址模式,256种指令都不够用的,所以STM8靠前面增加前缀字节来扩展。从手册里面截一个例子如下(这是XOR指令的多种编码):

在指令的操作码后面就是提供数据或地址的字节了,长度由操作码加上前缀来决定。

编写反汇编程序就是写一个根据字节数据流的查表过程。上面我做的那个表只是划分了指令的分布,涉及到寻址模式的细节还是得一边写一边查手册。从表上看,操作码的高半字节大概可以把指令划分为几类,再用低半字节去细分指令,于是我的程序解码第一步就是一个 switch-case 结构来划分任务:


01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

int decode_instr(unsigned char opcode)

{

    switch(opcode>>4)

    {

        case 1: case 0x0A: case 0x0B: case 0x0C:

        case 0x0D: case 0x0E: case 0x0F:

            return decode_group1(opcode);

        case 0: case 3: case 4: case 6: case 7:

            return decode_group2(opcode);

        case 5:

            if(Prefix==0x72)

                return decode_group2(opcode);

            else

                return decode_5x(opcode);

        case 8:

            return decode_8x(opcode);

        case 2:

            return decode_2x(opcode);

        case 9:

            return decode_9x(opcode);

        default:

            return -1;

    }

}


解码的结果是放到全局变量里面的,返回值只代表了指令是否有效。例如,表格最右边一列的指令我是这样解析的:


01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

int decode_9x(unsigned char opcode)

{

    AutoXY=1;

    switch(opcode&0x0f)

    {

        case 0: return set_prefix(0x90);

        case 1: return set_prefix(0x91);

        case 2: return set_prefix(0x92);

        case 3: format(0, LDW, regX, regY);

                format(0x90, LDW, regY, regX);

                return 1;

        case 4: format(0, LDW, regSP, regX);

                return 1;

        case 5: format(0, LD, regXH, regA);

                return 1;

        case 6: format(0, LDW, regX, regSP);

                return 1;

        case 7: format(0, LD, regXL, regA);

                return 1;

        case 8: format(0, RCF, 0, 0);

                return 1;

        case 9: format(0, SCF, 0, 0);

                return 1;

        case 0xA: format(0, RIM, 0, 0);

                return 1;

        case 0xB: format(0, SIM, 0, 0);

                return 1;

        case 0xC: format(0, RVF, 0, 0);

                return 1;

        case 0xD: format(0, NOP, 0, 0);

                return 1;

        case 0xE: format(0, LD, regA, regXH);

                return 1;

        case 0xF: format(0, LD, regA, regXL);

                return 1;

        default:

            return -1;

    }

}


主要是靠 format() 函数根据当前的指令前缀来翻译操作码:指令名称,寻址的第一操作数、第二操作数。若一共写 256 个 case 分支就太繁琐了,需要抓住共性,像表格中绿色背景的这一组指令我是这么处理的:


01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

int decode_group2(unsigned char opcode)

{

    int instr;

    AutoXY=1;

    switch(opcode&0x0f)

    {

        case 1:

            switch(opcode>>4)

            {

                case 0: format(0, RRWA, regX, 0); return 1;

                case 3: format(0, EXG, regA, longmem); return 1;

                case 4: format(0, EXG, regA, regXL); return 1;

                case 6: format(0, EXG, regA, regYL); return 1;

                default: return -1;

            }

            break;

        case 2:

            switch(opcode>>4)

            {

                case 0: format(0, RLWA, regX, 0); return 1;

                case 3: format(0, POP, longmem, 0); return 1;

                case 4: format(0, MUL, regX, regA); return 1;

                case 6: format(0, DIV, regX, regA); return 1;

                case 7: return set_prefix(0x72);

            }

            break;

        case 5:

            switch(opcode>>4)

            {

                case 3: format(0, MOV, longmem, imm8); return 1;

                case 4: format(0, MOV, mem, mem); return 1;

                case 6: format(0, DIVW, regX, regY); return 1;

                default: return -1;

            }

            break;

        case 0xB:

            switch(opcode>>4)

            {

                case 3: format(0, PUSH, longmem, 0); return 1;

                case 4: format(0, PUSH, imm8, 0); return 1;

                case 6: format(0, LD, offSP, regA); return 1;

[1] [2] [3]
关键字:STM8  反汇编工具 引用地址:徒手编写了一个STM8的反汇编工具

上一篇:STM8单片机CAN滤波器的设置
下一篇:STM8的中断系统以及外部中断详解

推荐阅读

前一段时间学习了STM32,先是用库函数学了一个星期。发现学完之后,一些基本要用的东西能配出来,但是过程却是十分的懵逼。于是决定暂时放弃库函数,用51的思维学习32,从寄存器开始,发现效果不错。一两天学一两个模块,个把星期下来对一些基本模块的常用寄存器也理解的不少。决定慢慢的回归库函数之前写下自己对STM32一些模块的理解,共勉之。 首先附上G...
汽车雷达不断发展,在高级驾驶辅助系统 (ADAS) 中的作用也不断提升,因此测试环境必须能够实现快速、简单、可重复的测试流程。本文将介绍如何使用雷达回波发生器进行下线生产测试,从而保证汽车雷达传感器的功能和质量。随着制造真正安全的车辆涉及到各种实际问题的重要性越来越明显,我们距离制造并认证能在公共道路上使用的全自动驾驶车辆还有相当长一...
企查查 App 显示,今日,小米科技有限责任公司公开一项名为 “屏蔽来电的方法及装置”的发明专利,申请日为 2014 年 10 月 29 日,申请号为 CN201410594119.6,公开号为 CN105635414B,目前已获得授权。  IT之家了解到,根据描述,这是关于一种屏蔽来电的方法及装置,涉及通信领域。该项专利 “解决了当有被标记的陌生电话呼入时...
广告摘要声明广告【文/歌者】9月4日,杭可科技发布公告称,公司已收到比亚迪中标通知书,合计中标锂电池生产设备5.22亿元,预计将对本年及未来年度经营业绩产生积极影响。根据公司披露的公告,近三年来,杭可科技对比亚迪的销售收入及占比大幅攀升。2018-2020年,公司向比亚迪销售设备分别实现收入3.91万元、2384.71万元、5445.57万元,占当年营业收入的比...

史海拾趣

问答坊 | AI 解惑

“简简单单DSP”系列学习活动——第四期中断结构学习

1、外围帧寄存器 2812将外围帧寄存器分为3个空间,分别是: 外围帧0:直接映射到CPU存储器总线 外围帧1:映射到32位外围总线 外围帧2:映射到16位外围总线,只允许16操作 这里所说的外围帧寄存器就是外设寄存器,如ADC寄存器。映射就是分配地 ...…

查看全部问答∨

怎样确定光纤活动连接器的接头类型?

安防行业常见的光纤活动连接器有ST/PC、SC/PC和FC/PC三种(无价差)。ST/PC是卡口式,主要是应用在多模光纤上,使用比较方便,但其精度低、互换性较差,插损也较大。SC/PC是插拔式,插损较小,使用最方便,大量应用在安装条件较好、比较规范的电信 ...…

查看全部问答∨

Keil仿真进不了main

我用Keil写了一个Hello程序,然后进入仿真,可是断点却进不了main,我在startup.s里面看到有执行main的跳转,有没有人了解是什么原因?…

查看全部问答∨

ok2440-III的跑马灯程序,哪为大侠可以帮注解下

/*********************LED实验*********************************/ // 公司名称 :保定飞凌嵌入式技术有限公司 // 描    述 :跑马灯 #define GPFCON (*(volatile unsigned *)0x56000050) #define GPFDAT (*(volatile unsigned *)0x ...…

查看全部问答∨

各位大侠帮我看看这个问题:编译没问题,链接时出错!!

/home/webkit/WebKit-r46507/WebKitBuild/Debug/lib/libQtWebKit.so: undefined reference to `WebCore::HTMLModElement::setDateTime(WebCore::String const&)\' make[2]: Leaving directory `/home/webkit/WebKit-r46507/WebKit/qt/QtLauncher ...…

查看全部问答∨

请各位指个路,用directshow开发wince视频需要哪些软件包?

我现在可以用vs2005调试s3c2440.但是视频捕捉没搞过.…

查看全部问答∨

camera 驱动

我看到 camera驱动中有的带Pin驱动,有的不带,这个pin驱动是干嘛的。知道的告诉一下…

查看全部问答∨

EZ430-RF250汇总

       EZ430-RF2500已经进行了快两个月了,整理完了才感觉大家好像是在一个办公室里完成的任务,基本上没有多少重复帖的,都在完成自己的小模块,最后完成EZ430-RF2500这个大模块。前一段时间大家在一直讨论板子试 ...…

查看全部问答∨

求合众达的6416开发板的光盘资料!

不知道哪位好心人有这个光盘,愿意有偿购买。…

查看全部问答∨

单一仪器噪声比较——低功率纳米技术及其它敏感器件的交流与直流测量方法的比较

所有的电子线路都会产生白噪声和1/f噪声[1]。低频测量噪声通常主要由后者决定。锁定放大器的前端通常是1/f噪声的主导源。使用在直流反转法的仪器具有同样的问题。因此,比较锁定放大器与使用直流反转法仪器的噪声性能,实际上是比较它们前端电路 ...…

查看全部问答∨
小广播
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved