ARM平台下独占访问指令LDREX和STREX-电子工程世界

为了实现线程间同步，一般都要在执行关键代码段之前加互斥（Mutex）锁，且在执行完关键代码段之后解锁。为了实现所谓的互斥锁的概念，一般都需要所在平台提供支持。

本文主要用来说明ARM平台上特有的独占访问指令LDREX和STREX的工作原理，以及如何使用。而它们也是ARM平台上，实现互斥锁等线程同步工具的基础。

我们先来看看LDREX和STREX两条指令的语义。其实LDREX和STREX指令，是将单纯的更新内存的原子操作分成了两个独立的步骤。

1）LDREX用来读取内存中的值，并标记对该段内存的独占访问：

LDREX Rx, [Ry]

上面的指令意味着，读取寄存器Ry指向的4字节内存值，将其保存到Rx寄存器中，同时标记对Ry指向内存区域的独占访问。

如果执行LDREX指令的时候发现已经被标记为独占访问了，并不会对指令的执行产生影响。

2）而STREX在更新内存数值时，会检查该段内存是否已经被标记为独占访问，并以此来决定是否更新内存中的值：

STREX Rx, Ry, [Rz]

如果执行这条指令的时候发现已经被标记为独占访问了，则将寄存器Ry中的值更新到寄存器Rz指向的内存，并将寄存器Rx设置成0。指令执行成功后，会将独占访问标记位清除。

而如果执行这条指令的时候发现没有设置独占标记，则不会更新内存，且将寄存器Rx的值设置成1。

一旦某条STREX指令执行成功后，以后再对同一段内存尝试使用STREX指令更新的时候，会发现独占标记已经被清空了，就不能再更新了，从而实现独占访问的机制。

大致的流程就是这样，但是ARM内部为了实现这个功能，还有不少复杂的情况要处理。

在ARM系统中，内存有两种不同且对立的属性，即共享（Shareable）和非共享（Non-shareable）。共享意味着该段内存可以被系统中不同处理器访问到，这些处理器可以是同构的也可以是异构的。而非共享，则相反，意味着该段内存只能被系统中的一个处理器所访问到，对别的处理器来说不可见。

为了实现独占访问，ARM系统中还特别提供了所谓独占监视器（Exclusive Monitor）的东西，其结构大致如下：

可以看出来，一共有两种类型的独占监视器。每一个处理器内部都有一个本地监视器（Local Monitor），且在整个系统范围内还有一个全局监视器（Global Monitor）。

如果要对非共享内存区中的值进行独占访问，只需要涉及本处理器内部的本地监视器就可以了；而如果要对共享内存区中的内存进行独占访问，除了要涉及到本处理器内部的本地监视器外，由于该内存区域可以被系统中所有处理器访问到，因此还必须要由全局监视器来协调。

对于本地监视器来说，它只标记了本处理器对某段内存的独占访问，在调用LDREX指令时设置独占访问标志，在调用STREX指令时清除独占访问标志。

而对于全局监视器来说，它可以标记每个处理器对某段内存的独占访问。也就是说，当一个处理器调用LDREX访问某段共享内存时，全局监视器只会设置针对该处理器的独占访问标记，不会影响到其它的处理器。当在以下两种情况下，会清除某个处理器的独占访问标记：

1）当该处理器调用LDREX指令，申请独占访问另一段内存时；

2）当别的处理器成功更新了该段独占访问内存值时。

对于第二种情况，也就是说，当独占内存访问内存的值在任何情况下，被任何一个处理器更改过之后，所有申请独占该段内存的处理器的独占标记都会被清空。

另外，更新内存的操作不一定非要是STREX指令，任何其它存储指令都可以。但如果不是STREX的话，则没法保证独占访问性。

现在的处理器基本上都是多核的，一个芯片上集成了多个处理器。而且对于一般的操作系统，系统内存基本上都被设置上了共享属性，也就是说对系统中所有处理器可见。因此，我们这里主要分析多核系统中对共享内存的独占访问的情况。

为了更加清楚的说明，我们可以举一个例子。假设系统中有两个处理器内核，而一个程序由三个线程组成，其中两个线程被分配到了第一个处理器上，另外一个线程被分配到了第二个处理器上。且他们的执行序列如下：

大致经历的步骤如下：

1）CPU2上的线程3最早执行LDREX，锁定某段共享内存区域。它会相应更新本地监视器和全局监视器。

2）然后，CPU1上的线程1执行LDREX，它也会更新本地监视器和全局监视器。这时在全局监视器上，CPU1和CPU2都对该段内存做了独占标记。

3）接着，CPU1上的线程2执行LDREX指令，它会发现本处理器的本地监视器对该段内存有了独占标记，同时全局监视器上CPU1也对该段内存做了独占标记，但这并不会影响这条指令的操作。

4）再下来，CPU1上的线程1最先执行了STREX指令，尝试更新该段内存的值。它会发现本地监视器对该段内存是有独占标记的，而全局监视器上CPU1也有该段内存的独占标记，则更新内存值成功。同时，清除本地监视器对该段内存的独占标记，还有全局监视器所有处理器对该段内存的独占标记。

5）下面，CPU2上的线程3执行STREX指令，也想更新该段内存值。它会发现本地监视器拥有对该段内存的独占标记，但是在全局监视器上CPU1没有了该段内存的独占标记（前面一步清空了），则更新不成功。

6）最后，CPU1上的线程2执行STREX指令，试着更新该段内存值。它会发现本地监视器已经没有了对该段内存的独占标记（第4步清除了），则直接更新失败，不需要再查全局监视器了。

所以，可以看出来，这套机制的精髓就是，无论有多少个处理器，有多少个地方会申请对同一个内存段进行操作，保证只有最早的更新可以成功，这之后的更新都会失败。失败了就证明对该段内存有访问冲突了。实际的使用中，可以重新用LDREX读取该段内存中保存的最新值，再处理一次，再尝试保存，直到成功为止。

还有一点需要说明，LDREX和STREX是对内存中的一个字（Word，32 bit）进行独占访问的指令。如果想独占访问的内存区域不是一个字，还有其它的指令：

1）LDREXB和STREXB：对内存中的一个字节（Byte，8 bit）进行独占访问；

2）LDREXH和STREXH：中的一个半字（Half Word，16 bit）进行独占访问；

3）LDREXD和STREXD：中的一个双字（Double Word，64 bit）进行独占访问。

它们必须配对使用，不能混用。

关键字：ARM平台 LDREX STREX 引用地址：ARM平台下独占访问指令LDREX和STREX

上一篇：u-boot顶层目录config.mk分析
下一篇：ARM MMU

推荐阅读最新更新时间：2024-11-07 18:59

ARM 平台上的Linux系统启动流程

　　开始学习嵌入式开发就一直在使用Linux系统作为学习的平台，到现在无论是PC机还是ARM开发板都已经能顺利地跑起了Linux系统，但是对Linux 的启动流程还是不甚了解。于是开始各种百度谷歌，当然看到了各路大神写的介绍。总的来说就是：bootloader - kernel- root filesystem，当然还介绍了哪个阶段完成了哪些工作。比如bootloader 是一上电就拿到cpu 的控制权的，而bootloader实现了硬件的初始化。bootloader俨然就成了power on 之后第一个吃螃蟹的代码。　　谈到这就得想到硬件机制是如何满足这个功能的了。就拿S3C2440 这个芯片来说（我的硬件平台就是拿这个芯片

[单片机]

<font color='red'>ARM</font> <font color='red'>平台</font>上的Linux系统启动流程

基于ARM平台的GPRS CQT测试系统的设计

　　GPRS作为中国移动据数业务的承载网，支持多种数据业务，涉及不同的网元，任何一个网元出故障都会直接影响数据业务的正常使用，保证用户端到端使用就显得非常重要。　　GPRSDT／CQT测试模拟终端用户的使用情况，将数据业务的使用过程用时间图、事件列表、层三信令等工具来表述，有助于工程师对测试中遇到的问题进行准确定位与分析。以往CQT测试主要是以人工测试的方式进行，先制定测试计划交由测试人员到指定地点进行测试，测试工具一般为信号测试专用手机，这种测试所得的数据都是由测试人员手工记录而来，再进行统计整理、制作分析报告，存在很大的主观性，缺乏真实性和准确性。目前移动通信中基站架设的特点是数量大、分布广，不可能对大量的基站和其覆盖的范围

[测试测量]

基于<font color='red'>ARM</font><font color='red'>平台</font>的GPRS CQT测试系统的设计

基于ARM平台的数字滤波器的软件实现方法

数字滤波器作为语音与图象处理、模式识别、雷达信号处理、频谱分析等应用中最基本的处理部件，现已成为最常用的工具之一。它既能满足滤波器对幅度和相位特性的严格要求，又能避免模拟滤波器所无法克服的电压漂移、温度漂移和噪声等问题。而对于具有线性相位特性的滤波问题，设计时一般都选择FIR滤波器。相对于窗函数法和频率设计法，在将理数字滤波器作为语音与图象处理、模式识别、雷达信号处理、频谱分析等应用中最基本的处理部件，现已成为最常用的工具之一。它既能满足滤波器对幅度和相位特性的严格要求，又能避免模拟滤波器所无法克服的电压漂移、温度漂移和噪声等问题。而对于具有线性相位特性的滤波问题，设计时一般都选择FIR滤波器。相对于窗

[单片机]

基于<font color='red'>ARM</font><font color='red'>平台</font>的数字滤波器的软件实现方法

基于ARM平台的MAC协议IP核设计

　　引言　　无线局域网被认为是下一代IT产业发展的是大推动之一，被IT业赋予了极大的希望。无线局域网802.11系列标准的MAC协议是一样的，只是在物理层上有差异，因此对802.11MAC协议的开发，不论是在802.11b流行的今天，还是802.11g可能会成为主流的将来，都是很有意义的。当然，ARM以其先进的体系结构已经成为嵌入式市场的RISC标准，因此基于ARM的IEEE802.11MAC协议的开发是很有现实意义的。　　PC软件开发是指脱离硬件的嵌入式软件开发阶段。此阶段可以在各种IDE环境下进行开发，并进行软仿真来验证软件的逻辑正确性。然后将开发出来的PC软件结合硬件所需要的硬件相关代码向硬件平台进行移值调试。前两个阶段

[单片机]

医疗设备逐渐从X86转到ARM平台主要原因是什么

　　x86概述　　X86是由Intel推出的一种复杂指令集，用于控制芯片的运行的程序，现在X86已经广泛运用到了家用PC（机箱+xx主板+xx电源+xx处理器+（光驱选装）的领域。　　x86架构于1978年推出的Intel 8086中央处理器中首度出现，它是从Intel 8008处理器中发展而来的，而8008则是发展自Intel 4004的。8086在三年后为IBM PC所选用，之后x86便成为了个人计算机的标准平台，成为了历来最成功的CPU架构。　　x86架构是重要地可变指令长度的CISC（复杂指令集计算机，Complex InstrucTIon Set Computer）。字组（word， 4字节）长度的存储器访

[单片机]

医疗设备逐渐从X86转到<font color='red'>ARM</font><font color='red'>平台</font>主要原因是什么

基于ARM-Linux平台的电子油门控制

引言巡航控制系统(CCS)是20世纪60年代发展起来的，又称为恒速行驶系统。巡航控制系统工作时，ECU根据各种传感器输送来的信号判断汽车的运行状况，通过执行元件自动调节节气门的开度使汽车的行驶速度与设定的车速保持一致。汽车在良好路面上长时间行驶时，驾驶员启动巡航控制系统并设定行驶速度，不需驾驶员操纵加速踏板，通过巡航控制系统即可自动保持既定的行驶速度，不仅减轻了驾驶员的劳动强度，同时利用先进的电子控制技术控制节气门的开度，比驾驶员操纵节气门更精确，汽车燃料经济性、排放污染性也可得到改善。 1 系统原理 1．1 电控油门原理工作时，由驾驶员发出转速的控制指令，由节气门开度传感器采集发动机的转速参数，并把信号输入电控单元；电控单

[单片机]

基于Linux平台下的FPGA的ARM驱动开发方法

Linux操作系统的全称是GNU／Linux，它是由GNU工程和Linux内核两个部分共同组成的一个操作系统。该系统中所有组件的源代码都是自由的，可以有效保护学习成果，因而在嵌入式领域得到了广泛的应用。 FPGA是英文Field Programmable Gate Array的缩写，即现场可编程门阵列，该器件是作为专用集成电路ASIC (Application Specific Integrated Circuit)领域中的一种半定制电路而出现的，它的出现既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。在通信行业、传输网、医疗仪器、各种电子仪器、安防监控、电力系统、汽车电子以及消费类电子中都大面积使用。随着产品

[工业控制]

基于Linux<font color='red'>平台</font>下的FPGA的<font color='red'>ARM</font>驱动开发方法

英特尔推双操作系统平台：借势压制ARM芯片

英特尔推双系统平台压制ARM 　　新浪科技罗亮发自美国拉斯维加斯　　英特尔(25.53, 0.22, 0.87%)在2014年美国消费电子展CES上推出了“双操作系统平台”(dual OS platform)。采用这种技术，用户可以在单个设备上同时运行谷歌(1130.18, -0.06, -0.01%)Android和微软(36.04, 0.51, 1.44%)Windows 8系统。如果类似产品能够得到大多数消费者的喜爱，这将会是英特尔反击ARM芯片的一次巨大胜利。　　力推双系统平台　　在本届CES大展上，英特尔引入了“dual OS platform”的新概念，公司表示运行英特尔处理器的计算机能够在Windo

[手机便携]

热门资源推荐
热门放大器推荐

小广播

ARM平台下独占访问指令LDREX和STREX

设计资源 培训 开发板 精华推荐

设计资源培训开发板精华推荐