历史上的今天

今天是:2024年09月22日(星期日)

正在发生

2021年09月22日 | ARM协处理器指令

发布者:心有归属 来源: eefocus关键字:ARM  协处理器指令 手机看文章 扫描二维码
随时随地手机看文章

ARM 微处理器可支持多达 16 个协处理器,用于各种协处理操作,在程序执行的过程中,每个协处理器只执行针对自身的协处理指令,忽略 ARM 处理器和其他协处理器的指令。ARM 的协处理器指令主要用于 ARM 处理器初始化 ARM 协处理器的数据处理操作,以及在ARM 处理器的寄存器和协处理器的寄存器之间传送数据,和在 ARM 协处理器的寄存器和存储器之间传送数据。 ARM 协处理器指令包括以下 5 条:


CDP 协处理器数操作指令

LDC 协处理器数据加载指令

STC 协处理器数据存储指令

MCR ARM 处理器寄存器到协处理器寄存器的数据传送指令

MRC 协处理器寄存器到ARM 处理器寄存器的数据传送指令

......


CP15系统控制协处理器


CP15 —系统控制协处理器 (the system control coprocessor)他通过协处理器指令MCR和MRC提供具体的寄存器来配置和控制caches、MMU、保护系统、配置时钟模式(在bootloader时钟初始化用到)


CP15的寄存器只能被MRC和MCR(Move to Coprocessor from ARM Register )指令访问

一些要说明的内容,摘录见下::



Co-processors

There are between zero and three possible co-processors. Most desktop ARM systems do not have logic for external co-processors, so we may either use that which is built into the ARM itself, or an emulated co-processor.

CP15 is reserved on the ARM 3 and later processors for internal configuration, as described in this document.

CP0 and CP1 is used by the floating point system. It may either be an external floating point chip (as used with the ARM 3), hardware built into the processor (as in the ARM 7500FE), or a totally software-based emulation (as with the  FPEmulator  that we all know).

Here is a short exercise for you:


    10 DIM code% 16

    20 P% = code%

    30 [ OPT     3

    40   CDP     CP1, 0, C0, C1, C2, 0

    50   ADFS    F0, F1, F3

    60   MOV     PC, R14

    70 ]

   >RUN

   00008F78                    OPT     3

   00008F78 EE010102           CDP     CP1, 0, C0, C1, C2

   00008F7C EE010102           ADFS    F0, F1, F2

   00008F80 E1A0F00E           MOV     PC, R14

   >

What do you notice?  :-)

 


When the ARM executes a co-processor instruction, or an undefined instruction, it will offer it to any co-processors which may be presently attached. If hardware is available to process the given instruction, then it is expected to do so. If it is busy at the time the instruction is offered, the ARM will wait for it.

If there is no co-processor capable of executing the instruction, the ARM will take its undefined instruction trap, in which case the following will happen:


The PSR and PC are both saved (the method differs for 26 bit and 32 bit ARMs)

SVC mode (26 bit) / UND mode (32 bit) is entered, and the I bit of the PSR is set

The instruction at address &00000004 is executed

This trap may be used to add instructions to the instruction set by emulation, or to implement a software emulation of hardware that isn't fitted. The  Floating Point Emulator  works by doing this.

To return, simply pull the saved PC and PSR (depends on 26/32 bit) and push them to the current PC and PSR, like MOVS PC, R14 in 26 bit systems. This will pick up with the instruction following the one which caused the trap.


All of the co-processor instructions can be executed conditionally. Please note that the conditionals relate to the status of the ARM processor, and not the status of any of the co-processors. This is because the ARM always tries the instruction first, and offers it around and maybe takes the undefined application trap, so the conditions are ARM related.

To make this clearer:


    10 DIM code% 32

    20 P% = code%

    30 [ OPT     3

    40   FLTS    F0, R0

    50   FLTS    F1, R1

    60   FMLS    F2, F0, F1

    70   FIX     R0, F2

    80   MOVS    PC, R14

    90 ]

   100 INPUT "First number : "A%

   110 INPUT "Second number: "B%

   120 PRINT USR(code%)

This probably won't assemble without an enhanced BASIC assembler.

Anyway, you might think the ARM will hand over to the floating point co-processor to do the four FP instructions, then hand back afterwards.

If you did, you would be incorrect!


What actually is executed is:


   MCR     CP1, 0, R0, C0, C0

   MCR     CP1, 0, R1, C1, C0

   CDP     CP1, 9, C2, C0, C1

   MRC     CP1, 0, R0, C0, C2

It is worth pointing out that objasm specifies co-processor registers using the CR notation (ie, CR0 - CR15), which is first defined with the CN directive. It does not appear as if default co-processor instructions are defined in Nick Roberts' ASM, though I've only looked in the instructions at the "defined symbols" section...

Darren Salt's ExtBASICasm provides the register names C0 - C15 to refer to the co-processors. So if any of these examples fail when you try to assemble them, please check what format your assembler provides these instructions.


 


 



MRC

The instruction  MRC  transfers a co-processor register to an ARM register. It takes the form:

   MRC    , , , , ,

The co-processor is denoted in most assemblers by  CPx .

The register    is written to  , using operation  . This may, possibly, be further modified by    and  . For an idea of the sorts of times when this might be necessary, consider instructions of the form  LDR Ra, [Rb], #x . 

The final    may be omitted, as it is in the example, but the other parts of the MRC instruction must be supplied.

 



MCR

The instruction  MCR  transfers an ARM register to a co-processor register. It takes the form:

   MCR    , , , , ,

The co-processor is free to interpret the fields as it desires, but the standard interpretation is that the contents of the ARM register are written to the co-processor register using the operation code given, which may be further modified by the second co-processor register and/or the second operation code.




在U-Boot中我们用到了c7 和 c8这两个协处理器,再来看看MCR的详细用法:



MCR指令:


MCR指令将ARM处理器的寄存器中的数据传送到协处理器寄存器中。如果协处理器不能成功地执行该操作,将产生未定义的指令异常中断。


指令语法格式:


MCR{}

,< opcode_1>,,,{,}


MCR{} p15,0,,,{,}


其中


指令执行的条件码.当忽略时指令为无条件执行。


协处理器将执行的操作的操作码。对于CP15协处理器来说,永远为0b000,当不为0b000时,该指令操作结果不可预知。


作为源寄存器的ARM寄存器,其值将被传送到协处理器寄存器中


作为目标寄存器的协处理器寄存器,其编号可能是C0,C1,…,C15。


两者组合决定对协处理器寄存器进行所需要的操作,如果没有指定,则将为为C0,opcode_2为0



    mcr p15, 0, r0, c7, c7, 0 /* flush v3/v4 cache */


可以看出,其中


rd为r0=0


CRn为C7


CRm为C7


对于这行代码的作用,以此按照语法,来一点点解释如下:


首先,mcr做的事情,其实很简单,就是“ARM处理器的寄存器中的数据传送到协处理器寄存器中”,


此处即是,将ARM的寄存器r0中的数据,此时r0=0,所以就是把0这个数据,传送到协处理器CP15中。


而对应就是写入到“”这个“目标寄存器的协处理器寄存器”,此处CRn为C7,即将0写入到寄存器7(Register 7)中去。


而上面关于Register 7的含义中也说了,“Any data written to this location will cause the selected cache to be flushed”,即你往这个寄存器7中写入任何数据,都会导致对应的缓存被清空。而到底那个缓存被清空呢,即我们这行指令



mcr p15, 0, r0, c7, c7, 0



起了什么作用呢


那是由“两者组合决定”的。


而此处CRm为C7,opcode_2为0,而对于C7和0的组合的作用,参见上面的那个表中Register 7中的Flash I+D那一行,


当opcode_2为0,CRm为0111=7,就是我们要找的,其作用是“Flush I + D”,即清空指令缓存I Cache和数据缓存D Cache。


根据该表,同理,如果是opcode_2=0,而CRm=0101b=5,那么对应的就是去“Flush I”,即只清除指令缓存I Cache了。


而对应的指令也就是



mcr p15, 0, r0, c7, c5, 0


此注释说此行代码的作用是,清理v3或v4的缓存


其中v4,我们很好理解,因为我们此处的CPU是ARM920T的核心,是属于ARM V4的,而为何又说,也可以清除v3的cache呢?


那是因为,本身这些寄存器位域的定义,都是向下兼容的,参见上面引用的内容,也写到了:


ARM 710


Register 7 - IDC flush (write only)

Any data written to this location will cause the IDC (Instruction/Data cache) to be flushed.


即,对于ARM7的话,你写同样的这行代码



mcr p15, 0, r0, c7, c7, 0


也还是向register 7中写入了数据0,这也同样满足了其所说的“Any data written to this location”,也会产生同样的效果“cause the IDC (Instruction/Data cache) to be flushed”。


同理,可以看出此行是去操作寄存器8,而对应的各个参数为:


rd为r0=0


CRn为C8


CRm为C7


opcode_2为0


对照寄存器8的表:



Register 8 - TLB operations (write only)

Any data written to this location will cause the selected TLB flush operation.


The OPC_2 and CRm co-processor fields select which cache


operation should occur:


Function OPC_2 CRm Data


Flush I + D %0000 %0111 -


Flush I %0000 %0101 -


Flush D %0000 %0110 -


Flush D single %0001 %0110 Virtual address”


其含义为:


向寄存器8中写入数据,会导致对应的TLB被清空。具体是哪个TLB,由opcode_2和CRm组合决定,


此处opcode_2为0,CRm为7=0111b,所以对应的作用是“Flush I + D”,即清空指令和数据的TLB。

关键字:ARM  协处理器指令 引用地址:ARM协处理器指令

上一篇:s3c6410 时钟设置
下一篇:ARM体系架构—ARMv7-A协处理器

推荐阅读

NVIC概念:提供中断控制器,用于总体管理异常,称之为“内嵌向量中断控制器”。简单来说,就是MCU提供、处理内部中断的模块。NVIC库函数:中断优先级:在配置NVIC之前得弄懂一个概念:中断优先级,即中断的执行顺序。中断优先级中,分为抢占式优先级(先占优先级)和响应优先级(从优先级)。抢断优先级,顾名思义,能再别人中断是抢占别人中断,实现中断...
iPhone 11系列即将发售,有关这款新机的细节正在逐步被揭秘。  9月18日消息,据外媒报道,美版iPhone 11、iPhone 11 Pro和iPhone 11 Pro Max均搭载了英特尔LTE调制解调器。  外媒指出,英特尔和高通版本的iPhone测试菜单选项有所区别,他们查看了从iPhone 6到iPhone XR所有型号,发现iPhone 11、iPhone 11 Pro和iPhone 11 Pro...
有的朋友买了示波器,看到示波器的刷新率标称,可能会很好奇,想知道能否测出来。相对于采样率、存储深度等由硬件特性决定的指标,刷新率完全是由处理器处理方式决定的,合理的数据处理方式可以得到更高的刷新率,接下来我们就手把手教大家测量示波器的刷新率,感兴趣的朋友可以拿起手中的示波器测一下。首先我们先来了解下示波器刷新率(也叫波形捕获率)...
新能源车发展到这个阶段,电池依旧是各家车企跳不过的坎儿。毕竟一辆电动车的结构说到底比燃油车还是简单太多了,而电池这个关系到车辆续航和安全两个最大问题的部分一旦出现问题,一般就不会是小问题。所以各家车企在这个方面自然也没有少花费心思。昨天,我受岚图的邀请来到天津中国汽车技术研究中心,安安静静的看了一场“好戏”。简单来说,这个好戏分...

史海拾趣

问答坊 | AI 解惑

FFT核

RT,FFT核及FFT设计资料…

查看全部问答∨

8X16点阵滚动显示的时钟

8X16点阵滚动显示的时钟…

查看全部问答∨

基于uC_FS 的大容量微存储FAT32格式的实现与应用

摘要:进入后PC 时代以后,嵌入式操作系统成为目前已经成为了最热门的技术之一,在嵌入式系统的应用中,微型大容量存储器的 文件管理系统的重要性越来越突出,其中uC/ FS 以源码开放,价格低廉,兼容性好,效率高等特点受到越来越高的重视。…

查看全部问答∨

大家帮忙分析下问题 我很无奈啊(52单片机)

以下是我写的程序  用来从AD读出数据再在P0口的数码管显示  可是一直不能通过编译 但是我又真的查不出在哪错了  希望指教  谢谢    程序后面有提示的错误信息 #include<reg52.h> #define ...…

查看全部问答∨

WINCE操作系统定制

我想学习一下WINCE操作系统的定制,安装了PB5.0,硬件设备也有,2440跑WINCE5.0的板子。我想学习一下,自己定制一个系统,下进去跑跑。如何使用PB生成系统映像的大体流程我已经清楚了。现在想系统的学习一下,比如那些特性我该怎么去选择等等。我现 ...…

查看全部问答∨

为何pb5中用x86debug可以模拟运行wince,用ARMV4I就不行

我在pb中定制内核,先按一本书上讲的,使用了x86_debug来编译内核镜像,无错误,可仿真运行。 后来我用armv4i来编译,就会报错呢。 我的板是QQ2440V3的。已经装好了相应的bsp。 在安装pb5是也选择了支持2440的内容啊。 请各位高手指点。 书名 ...…

查看全部问答∨

EVC怎么读取SQLCE数据库中Image字段的数据,并通过一系列处理在控件上画出图形。

已经通过RDA将SQL SERVER2000 上的一个表数据下载到SQLCE 中,现在需要在应用程序中将表中的Image字段读出,并经过转化,转化为图像,显示出来。这个跟VC 中的好像不大一样,VC有getchunk等函数,EVC好像没有啊,还是我没找到?用EVC4.0开发,求助 ...…

查看全部问答∨

win7下USB转串口驱动问题(已解决)

    刚买了GT2440开发板,将USB转串口接笔记本上时,找不到驱动安装程序,不知道如何解决。而且连USB时也是这样。     我也知道win7在应用软件兼容性上没xp好,但是我装的是正版的,舍不得换!     ...…

查看全部问答∨

申请MSP-EXP430FR5739实验板套件

我想MSP-EXP430FR5739实验板套件做个智能小车学习。…

查看全部问答∨
小广播
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved