使用 Python 检测 C 文件中的递归

2023-12-31

我需要检测相当大（5-15,000）的 C（不是 C++）文件集中的直接和间接递归。

文件已经过预处理。

出于安全原因，该代码相当“老派”，因此没有诸如函数指针之类的奇特东西，只有传递变量的函数和一些执行相同操作的函数宏。

检测递归的最自然的方法是创建一个有向调用图，将每个函数视为一个节点，其边缘指向它调用的所有其他函数。如果图有循环，那么就有递归。

查找函数调用的正则表达式很简单，但我还需要知道调用的是哪个函数。

PyCParser 很好，但它抱怨很多事情，例如未定义的变量或未定义源类型或在不同文件中定义的 typedef，这些与我的用例完全无关。该项目使用自定义依赖管理系统，因此一些包含内容会自动添加，因此我需要 PyCParser 不关心anything以外FuncCall and FuncDef节点，我认为没有办法将解析过程本身限制于此。

我宁愿不实现解析器，因为我没有时间学习如何在 python 中执行此操作，然后实现解决方案。

回到问题，我将如何解析 C 文件中的函数？基本上得到一个字典，其中字符串（文件中定义的函数名称）作为键，字符串列表（每个函数调用的函数）作为值？正则表达式似乎是最自然的解决方案。

遗憾的是，使用 python 不是可选的。

为什么不直接使用objdump在您编译的代码上然后解析生成的程序集来构建您的图？

测试1.c文件：

extern void test2();

void test1()
{
   test2();
}

测试2.c文件：

extern void test1();

void test2()
{
   test1();
}


int main()
{
   test2();
}

现在构建它：

gcc -g test1.c test2.c -o myprog

现在拆解

objdump -d myprog > myprog.asm

使用几个简单的正则表达式查找所有函数调用，同时记住您所在的上下文。反汇编示例向您展示了它应该是多么容易：

00401630 <_test1>:
  401630:   55                      push   %ebp
  401631:   89 e5                   mov    %esp,%ebp
  401633:   83 ec 08                sub    $0x8,%esp
  401636:   e8 05 00 00 00          call   401640 <_test2>
  40163b:   c9                      leave  
  40163c:   c3                      ret    
  40163d:   90                      nop
  40163e:   90                      nop
  40163f:   90                      nop

00401640 <_test2>:
  401640:   55                      push   %ebp
  401641:   89 e5                   mov    %esp,%ebp
  401643:   83 ec 08                sub    $0x8,%esp
  401646:   e8 e5 ff ff ff          call   401630 <_test1>
  40164b:   c9                      leave  
  40164c:   c3                      ret

然后使用 python 来后处理你的反汇编并构建一个 function=>calls 的字典：

import re
import collections

calldict = collections.defaultdict(set)

callre = re.compile(".*\scall\s+.*<(.*)>")
funcre = re.compile("[0-9a-f]+\s<(.*)>:")

current_function = ""

with open("myprog.asm") as f:
    for l in f:
        m = funcre.match(l)
        if m:
            current_function = m.group(1)
        else:
            m = callre.search(l)
            if m:
                called = m.group(1)
                calldict[current_function].add(called)

我没有编写完整的图搜索，但您可以使用简单的代码检测“乒乓”递归，例如：

for function,called_set in calldict.items():
    for called in called_set:
        callset = calldict.get(called)
        if callset and function in callset:
            print(function,called)

这给了我：

_test2 _test1
_test1 _test2

这种符号/asm分析技术也用于呼叫捕捉器 http://www.skynet.ie/~caolan/Packages/callcatcher.html检测未使用的 C 函数（这里也可以通过检查不在任何集合中的键以及对编译器符号进行一些过滤来轻松完成）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Parsing

使用 Python 检测 C 文件中的递归的相关文章

当前的 c++ 工作草案与当前标准有何不同

通过搜索该标准的 PDF 版本我最终找到了这个链接C 标准措辞草案 http www open std org jtc1 sc22 wg21 docs papers 2012 n3376 pdf从 2011 年开始我意识到我可以购买最终
如何在 OSX 上安装 numpy 和 scipy？

我是 Mac 新手请耐心等待我现在使用的是雪豹 10 6 4 我想安装numpy和scipy 所以我从他们的官方网站下载了python2 6 numpy和scipy dmg文件但是我在导入 numpy 时遇到问题 Library F
如何将“外部模板”与由同一类中的模板化成员使用的嵌套类一起使用？

首先一些背景信息我尝试以 Herb Sutter 在他的解决方案中介绍的方式使用 Pimpl 习语得到了 101 http herbsutter com gotw 101 这在头文件中看起来像这样 include pimpl h h
在 2D 中将一个点旋转另一个点

我想知道当一个点相对于另一个点旋转一定角度时如何计算出新的坐标我有一个块箭头想要将其相对于箭头底部中间的点旋转角度 theta 这是允许我在两个屏幕控件之间绘制多边形所必需的我无法使用和旋转图像从我到目前为止所考虑的情况来看使问题
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
基于xsd模式生成xml（使用.NET）

我想根据我的 xsd 架构 cap xsd 生成 xml 文件我找到了这篇文章并按照说明进行操作使用 XSD 文件生成 XML 文件 https stackoverflow com questions 6530424 generatin
为什么我不应该对不是由 malloc() 分配的变量调用 free() ？

我在某处读到使用它是灾难性的free删除不是通过调用创建的对象malloc 这是真的为什么这是未定义的行为永远不要尝试它让我们看看当您尝试时会发生什么free 自动变量堆管理器必须推断出如何获取内存块的所有权为此它要么必须使
当“int”处于最大值并使用 postfix ++ 进行测试时，代码定义良好吗？

示例未定义行为的一个示例是整数溢出的行为 C11dr 3 4 3 3 int溢出是未定义的行为但这是否适用于存在循环的以下内容并且不使用现在超出范围的副作用i 特别是这是否后缀增量规格帮助结果的值计算在副作用之前排序更新操作数的
在 C 中使用 GNU automake 中的解析器

我是 GNU autotools 的新手在我的项目中使用了 lex 和 yacc 解析器将它们作为 makefile am 中的源代码会产生以下错误配置 in AC CHECK PROGS YACC bison yacc none i
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
无法在前端使用 JavaScript Fetch API 将文件上传到 FastAPI 后端

我正在尝试弄清楚如何将图像发送到我的 API 并验证生成的token那是在header的请求到目前为止这就是我所处的位置 app post endreProfilbilde async def endreProfilbilde requ
如何在 javascript 正则表达式中匹配平衡分隔符？

我原以为这个问题是不可能的据我所知 Javascript 的正则表达式既没有递归插值也没有漂亮的 NET 平衡组功能但问题就在那里如问题 12 所示正则表达式 alf nu http regex alf nu 匹配平衡对 lt an
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
当前的 x86 架构是否支持非临时加载（来自“正常”内存）？

我知道有关此主题的多个问题但是我没有看到任何明确的答案或任何基准测量因此我创建了一个处理两个整数数组的简单程序第一个数组a非常大 64 MB 第二个数组b很小无法放入 L1 缓存程序迭代a并将其元素添加到相应的元素中b在模块化
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
转到定义：“无法导航到插入符号下的符号。”

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动我今天突然开始在我的项目中遇到一个问题单击转到定义会出现一个奇怪的错误无法导航到
如何在 gulp.src 中使用基本正则表达式？

我正在尝试选择两个文件gulp src highcharts js and highcharts src js 当然我知道我可以使用数组表达式显式添加这两个表达式但出于学习目的我尝试为它们编写一个表达式我读过可以使用简单的正则表达式
您可以使用关键字参数而不提供默认值吗？

我习惯于在 Python 中使用这样的函数方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default
错误：无效使用不完整类型“类 Move”/未定义对 Move::NONE 的引用

拜托我不知道为什么这个简单的代码被拒绝它给了我 2 个编译错误请帮帮我 I use 代码块 20 03 我的编译器是GNU GCC 移动 hpp class Move public Move Move int int public

随机推荐

获取窗口样式

我正在尝试使用 GetWindowLong hWnd GWL STYLE 检查窗口是否具有某种样式但这给了我一个 LONG 类型的变量您将如何检查常量值类型 WS CAPTION 中的特定样式使用按位运算符与该 long 类型进行比
我是否需要将异步添加到 Visual Studio 2017 ASP.NET Core MVC 中的控制器操作

我刚刚将 Visual Studio 2015 ASP NET MVC Core 项目转换为 Visual Studio 2017 并且我在错误列表中收到以下信息性消息消息 IDE1006 违反命名规则缺少后缀 Async 此消息出现在
如何禁用 ionic 4 中的 ion-button 阴影？

我无法在 ionic 4 中将 ion button 的 box shadow 属性设置为 none 那么如何同时对单个按钮和所有按钮执行此操作
虚拟环境中 pip install 的问题 - Rust 包管理器 Cargo 未安装或不在 PATH 上

我正在使用 python 虚拟环境来处理项目设置我的 venv 并从 git 中提取后我尝试pip install r requirements txt但下面出现错误 Collecting orjson 3 5 2 Using cach
如何使用电子获取文件夹路径

我对电子非常陌生谁能建议我如何使用电子获取本地文件夹的相对路径 JavaScript 不具备这种能力我有一个选择文件按钮请参阅快照所以我的问题是当我选择一个文件夹并单击打开按钮时它应该返回整个目录路径正如 phuong
Python 多处理陷入 selenium 困境

所以我有代码可以启动 4 个 selenium chrome 驱动程序并从网页上的元素中抓取数据代码可以简化为这样 import json import multiprocessing as mp from selenium import
实时向点云添加新点 - Open3D

我正在使用 Open3D 在 Python 中可视化点云本质上我想做的是以编程方式向点云添加另一个点然后实时渲染它这是我到目前为止所拥有的我找不到任何解决方案在下面的代码中我展示了一种可能的解决方案但它并不有效第一个窗口关
使用 dgemm/dgemv 的矩阵向量积

将 Lapack 与 C 结合使用让我有点头疼我发现为 fortran 定义的函数有点奇怪所以我尝试在 C 上创建一些函数以便我更容易阅读正在发生的事情不管怎样我没有让矩阵向量乘积按我的意愿工作这是该程序的一个小示例小matl
在 SwiftUI 中显示“UIActivityViewController”

我想让用户能够共享位置但我不知道如何显示UIActivityViewController在 SwiftUI 中基本实现UIActivityViewController in SwiftUI is import UIKit import
在mysql中像查询一样搜索带有撇号的记录

我有类似这样的 mysql 查询 SELECT from users where username LIKE test s 并且有users带有字段名称的数据库表username 并且有 1 条记录users带有用户名的表test s现在我
如果释放不干净的设备上下文会发生什么？

通常如果程序将一个对象选择到设备上下文中或者更改其属性则应该在释放设备上下文之前将它们更改回来如果不这样做会发生什么假设我这样做 HDC hdc GetDC some window SelectObject hdc some fo
Nokogiri 抓取带有格式和链接标签的文本，、、等

如何使用 Nokogiri 递归捕获带有格式标记的所有文本 div This is text in the TD with strong strong strong tags p This is a child node with b bo

请解释一下 Option 的 orNull 方法的使用

Scala 的 Option 类有一个orNull方法其签名如下所示 orNull A1 gt A implicit ev lt lt Null A1 A1 我对隐含的东西感到困惑有人可以解释一下如何使用它最好是举个例子吗 scala

在 Python 中使用多个代码文件和文件夹

我是 Python 新手还没有找到在多个代码文件和文件夹中分离代码的简单方法我今天所做的是为每个文件夹创建一个 init py文件有时它是空的我不知道为什么要这样做但这似乎是必要的这是与使用 C 的第一个区别第二个区别是对

facebook FB.Event.subscribe('auth.authResponseChange') 不起作用

对于我的一生我无法让 Event subscribe auth auth Response Change 工作请参阅下面的代码 div div

如何在C#中使用WCF REST服务？

我的合同详细信息如下我使用 Json 响应和请求格式还使用 POST 方法如何用 C 编写客户端来使用此服务 OperationContract WebInvoke UriTemplate RESTJson Sample1 Sampl

Firebase 身份验证 Javascript：用于重定向待处理凭据的 setCookie

我正在尝试使用多重身份验证进行链接singinwithredirect 我抓住了错误 credential并使用JSON stringify通过 cookie 传递它从那里我使用以下方法将其转换回对象JSON parse 但是当我尝试将

富文本 (YUI) 编辑器在 IE11 上损坏

我正在运行 Internet Explorer 11 和 YUI 2 富文本编辑器似乎无法正常工作有关更多详细信息请参阅随附的屏幕截图有什么想法如何在 IE11 下解决这个问题吗由于IE改变了它的User Agent YUI 2 9

Android Studio 初始化“com.intellij.util.net.ssl.CertificateManager”时发生致命错误

当我将Android Studio 3 0升级到3 1时出现这个问题 java lang RuntimeException com intellij ide plugins PluginManager StartupAbortedExcep

使用 Python 检测 C 文件中的递归

我需要检测相当大 5 15 000 的 C 不是 C 文件集中的直接和间接递归文件已经过预处理出于安全原因该代码相当老派因此没有诸如函数指针之类的奇特东西只有传递变量的函数和一些执行相同操作的函数宏检测递归的最自然的方法是创建

热门标签

笔记本式计算机处理器

SCF

腾讯云函数

云函数

EC11

单片机学习手稿

StoreKit

内购

YOLOV3中文标签

中文标签

YOLO中文标签

YOLOV3实战

DTU相机参数

Arduino类

数据结构系列

受虐的C之路

智慧校园系统

BUG排查修复教程

量化交易知识

Ansible

分布式事务

循环依赖

FDR

方案设计

使用 Python 检测 C 文件中的递归

使用 Python 检测 C 文件中的递归 的相关文章

随机推荐

热门标签

使用 Python 检测 C 文件中的递归的相关文章