创建数组时使用 OpenMP 时出现分段错误

2024-01-13

我在访问 for 循环内的数组时遇到分段错误。我想做的是生成 DNA 字符串的所有子序列。

当我在 for 中创建数组时，就发生了这种情况。读了一段时间后，我发现openmp限制了堆栈大小，所以使用堆来代替会更安全。所以我更改代码以使用malloc，但问题仍然存在。

这是完整的代码：

#include <limits.h>
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#include <omp.h>

#define DNA_SIZE 26 
#define DNA "AGTC"

static char** powerset(int argc, char* argv)
{
    unsigned int i, j, bits, i_max = 1U << argc;

    if (argc >= sizeof(i) * CHAR_BIT) {
        fprintf(stderr, "Error: set too large\n");
        exit(1);
    }
    omp_set_num_threads(2);
    char** subsequences = malloc(i_max*sizeof(char*));

    #pragma omp parallel for shared(subsequences, argv) 
    for (i = 0; i < i_max ; ++i) {
        //printf("{");
        int characters = 0;
        for (bits=i; bits ; bits>>=1)
            if (bits & 1)
                ++characters;

        //This is the line where the error is happening. 
        char *ss = malloc(characters+1 * sizeof(char)*16);//the *16 is just to save the cache lin       

        int ssindex = 0;

        for (bits = i, j=0; bits; bits >>= 1, ++j) {
            if (bits & 1) {
                //char a = argv[j];
                ss[ssindex++] = argv[j] ;
            } 
        }
        ss[ssindex] = '\0';
        subsequences[i] = ss;       
    }
    return subsequences;
}

char* getdna()
{
    int i;

    char *dna = (char *)malloc((DNA_SIZE+1) * sizeof(char));

    for(i = 0; i < DNA_SIZE; i++)
    {
        int randomDNA = rand() % 4;
        dna[i] = DNA[randomDNA];
    }

    dna[DNA_SIZE] = '\0';

    return dna;
}

void printResult(char** ss, int size)
{
    //PRINTING THE SUBSEQUENCES
    printf("SUBSEQUENCES FOUND:\r\n");
    int i;
    for(i = 0; i < size; i++)
    {
        printf("%i.\t{ %s } \r\n",i+1 , ss[i]);
        free(ss[i]);
    }
    free(ss);
}

int main(int argc, char* argv[])
{
    srand(time(NULL));
    double starttime, stoptime;
    starttime = omp_get_wtime();
    char* a = getdna();
    printf("%s\r\n", a);
    int size = pow(2, DNA_SIZE);
    printf("number of subsequences: %i\r\n", size);

    char** subsequences = powerset(DNA_SIZE, a);    
    //todo: make it optional printing to the stdout or saving to a file
    //printResult(subsequences, size);
    stoptime = omp_get_wtime();

    printf("Tempo de execucao: %3.2f segundos\n\n", stoptime-starttime);
    printf("Numero de sequencias geradas: %i\n\n", size);
    free(a);
    return 0;
}

我还尝试使 malloc 行变得至关重要#pragma omp critical这没有帮助。我还尝试使用 -mstackrealign 进行编译，但这也不起作用。

感谢所有的帮助。

您应该使用更有效的线程安全内存管理。

应用程序可以使用malloc() and free()显式或隐式地存在于编译器生成的动态/可分配数组、向量化内在函数等代码中。

线程安全的malloc() and free()在一些libc实现带有高同步性内部锁定引起的开销。存在用于多线程应用程序的更快的分配器。例如，在 Solaris 上，多线程应用程序应与“MT-hot”分配器链接mtmalloc, (i.e.,链接到-lmtmalloc to use mtmalloc而不是默认的 libc 分配器）。glibc，用于 Linux 和一些具有 GNU 用户空间的 OpenSolaris 和 FreeBSD 发行版，使用修改后的ptmalloc2分配器，基于 Doug Lea 的dlmalloc。它使用多个内存区域来实现近乎无锁的行为。它还可以配置为使用每线程竞技场，并且某些发行版（特别是 RHEL 6 及其衍生版本）启用了该功能。

static char** powerset(int argc, char* argv)
{
    int i, j, bits, i_max = 1U << argc;

    if (argc >= sizeof(i) * CHAR_BIT) {
        fprintf(stderr, "Error: set too large\n");
        exit(1);
    }
    omp_set_num_threads(2);
    
    
    char** subsequences = malloc(i_max*sizeof(char*));
    
    int characters = 0;
    for (i = 0; i < i_max ; ++i)
    {
         for (bits=i; bits ; bits>>=1)
            if (bits & 1)
                ++characters;
         
        subsequences[i] = malloc(characters+1 * sizeof(char)*16);
        characters = 0;
    }
    
    
    #pragma omp parallel for shared(subsequences, argv) private(j,bits)
    for (i = 0; i < i_max; ++i)
    {     

        int ssindex = 0;

        for (bits = i, j=0; bits; bits >>= 1, ++j) {
            if (bits & 1) {
                subsequences[i][ssindex++] = argv[j] ;
            } 
        }
       subsequences[i][ssindex] = '\0';
    }
    
    return subsequences;
}

我在并行区域之前创建（并分配）所需的数据，然后进行剩余的计算。上面的版本在 24 核机器上运行 12 个线程，采用“Tempo de exeucao: 9.44 segundos”。

但是，当我尝试并行化以下代码时：

   #pragma omp parallel for shared(subsequences) private(bits,characters)
    for (i = 0; i < i_max ; ++i)
            {
                 for (bits=i; bits ; bits>>=1)
                    if (bits & 1)
                        ++characters;
                 
                subsequences[i] = malloc(characters+1 * sizeof(char)*16);
                characters = 0;
            }

它需要“执行速度：10.19 秒”

正如你所看到的malloc并行会导致时间变慢。

最终，您会遇到每个子 malloc 都试图分配的问题(characters+1*DNA_SIZE*sizeof(char))而不是((characters+1)*DNA_SIZE*sizeof(char))，如果我理解您想要避免的情况，则在并行部分中不需要乘以缓存行大小的因子。

这段代码似乎也存在一些问题：

for (bits = i, j=0; bits; bits >>= 1, ++j) {
    if (bits & 1) {
        //char a = argv[j];
        ss[ssindex++] = argv[j] ;
    }
}

有了这段代码，j有时会击中DNA_SIZE or DNA_SIZE+1，导致读取argv[j]离开数组的末尾。（另外，使用argc and argv因为这个函数中的参数名称有点令人困惑。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

创建数组时使用 OpenMP 时出现分段错误的相关文章

在 C++ 代码中转换字符串

我正在学习 C 并开发一个项目来练习但现在我想在代码中转换一个变量字符串就像这样用户有一个包含 C 代码的文件但我希望我的程序读取该文件并插入将其写入代码中如下所示 include
如何在 C# 中将 Json 转换为对象

我想将 Json 转换为 C 中的对象这里的 Json 是值 e920ce0f e3f5 4c6f 8e3d d2fbc51990e4 如何使用 Object 问题看似愚蠢但其实并不那么愚蠢我没有简单的 Json 我有 IEnume
JavaScript 错误：MVC2 视图中的条件编译已关闭

我试图在 MVC2 视图页面中单击时调用 JavaScript 函数 a href Select a JavaScript 函数 function SelectBenefit id code alert id alert code 这里 b
C# 根据当前日期传递日期时间值

我正在尝试根据 sql server 中的两个日期获取记录 Select from table where CreatedDate between StartDate and EndDate我通过了5 12 2010 and 5 12 20
测量进程消耗的 CPU 时钟

我用 C 语言编写了一个程序它是作为研究结果创建的程序我想计算程序消耗的确切 CPU 周期精确的循环次数知道我怎样才能找到它吗 The valgrind tool cachegrind valgrind tool cachegrin
保证复制省略是否适用于函数参数？

如果我理解正确的话从 C 17 开始这段代码现在要求不进行任何复制 Foo myfunc void return Foo auto foo myfunc no copy 函数参数也是如此吗下面的代码中的副本会被优化掉吗 Foo myf
什么是竞争条件？

编写多线程应用程序时最常见的问题之一是竞争条件我向社区提出的问题是竞赛条件是什么你如何检测它们你如何处理它们最后如何防止它们发生当两个或多个线程可以访问共享数据并且它们试图同时更改它时就会出现竞争条件由于线程调度算法可以
条件类型定义

如果我有一小段这样的代码 template
在 azure blob 存储中就地创建 zip 文件

我将文件存储在 Blob 存储帐户内的一个容器中我需要在第二个容器中创建一个 zip 文件其中包含第一个容器中的文件我有一个使用辅助角色和 DotNetZip 工作的解决方案但由于 zip 文件的大小最终可能达到 1GB 我担心在进
Unity c# 四元数：将 y 轴与 z 轴交换

我需要旋转一个对象以相对于现实世界进行精确旋转因此调用Input gyro attitude返回表示设备位置的四元数另一方面这迫使我根据这个四元数作为默认旋转来计算每个旋转将某些对象设置为朝上的简单方法如下 Vector3 up I
以编程方式创建 Blob 存储容器

我有一个要求即在创建公司时在我的 storageaccount 中创建关联的 blob 存储容器并将容器名称设置为传入的字符串变量我已尝试以下操作 public void AddCompanyStorage string subDo
使用 gcc 时在头文件中查找定义的好方法是什么？

在使用 gcc 时有人有推荐的方法在头文件中查找定义吗使用 MSVC 时我只需右键单击并选择转到定义这非常好我使用过 netbeans gcc 它确实有代码帮助包括到定义的超链接所以这是一种选择但是我想知道是否有任何其他
C++ 指针引用混淆

struct leaf int data leaf l leaf r struct leaf p void tree findparent int n int found leaf parent 这是 BST 的一段代码我想问一下为什么
C：设置变量范围内所有位的最有效方法

让我们来int举个例子 int SetBitWithinRange const unsigned from const unsigned to To be implemented SetBitWithinRange应该返回一个int其中所有
构建 C# MVC 5 站点时项目之间的处理器架构不匹配

我收到的错误如下 2017 年 4 月 20 日构建 13 23 38 C Windows Microsoft NET Framework v4 0 30319 Microsoft Common targets 1605 5 警告 MSB3
Array.of 与“[ ]”。何时使用 Array.of 而不是“[ ]”？

当我发现时我正在读一些书Array of https developer mozilla org en docs Web JavaScript Reference Global Objects Array of 根据 MDN Array o
任何人都可以清楚地告诉如何在不使用像这样的预定义函数的情况下找到带有小数值或小数值的指数吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案例如 2 0 5 1 414 所以想要我是 c 的新手所以请解释简单的逻辑如果不是复杂的逻辑也足够了在数学中从整数取幂到实数
.Net Reactive Extensions Framework (Rx) 是否考虑拓扑顺序？

Net 反应式扩展框架是否按拓扑顺序传播通知以最大限度地减少更新量就像 Scala Rx 所做的那样 Net 反应式扩展 Rx 是否可以 https github com lihaoyi scala rx wiki How it Work
声明一个负长度的数组

当创建负长度数组时 C 中会发生什么例如 int n 35 int testArray n for int i 0 i lt 10 i testArray i i 1 这段代码将编译并且启用 Wall 时不会出现警告并且似乎您可以分配
如何在 C# 中获取 CMD/控制台编码

我需要指定正确的代码页来使用 zip 库打包文件正如我所见我需要指定控制台编码在我的例子中为 866 C Users User gt mode Status for device CON Lines 300 Columns 130 K

随机推荐

使用Python搜索具有各种编码的文本文件内容？

打开文本文件以在文件内容中查找匹配项时我遇到了可变文本编码的问题我正在编写一个脚本来扫描文件系统以查找具有特定内容的日志文件以便将它们复制到存档中名称经常发生变化因此内容是识别它们的唯一方法我需要识别 txt 文件并在其内容中找
如何在 Bash 中运行一个超时的进程？ [复制]

这个问题在这里已经有答案了可能的重复 Bash 脚本在给定的超时后杀死子进程 https stackoverflow com questions 5161193 bash script that kills a child process
使 GCM/CBC 密码在 golang 中可流式传输

Go 中的 GCM 和 CBC AES 密码不能与 StreamWriter 或 StreamReader 一起使用这迫使我将整个文件分配到内存中显然这对于大文件来说并不理想我正在考虑通过将一些固定大小的块分配到内存中并将它们提供给
将大量常量和工作区变量传递给 fsolve 目标函数的最佳方法是什么？

与根本不使用全局变量相比调用全局变量需要花费大量时间来加载考虑一个具有 1000 次迭代的循环对这些变量进行一些计算 0 6 秒没有全局变量约 1000 个变量 2 2 秒一个定义的全局变量和其他变量 6 秒约 1000 个全局变
如何使用 PHP 和 htaccess 创建动态子域？

我有一个问题我想设置 PHP 和 htaccess 来创建动态子域我不知道怎么办目前我的网址如下所示 www exemple com index php subdomain mike component content id 26 t
在 Firebase 中创建新目录并插入数据

我想在 Firebase 中动态创建五个新目录我也想动态地在这些目录中插入数据我为此目的编写了这个 jquery 脚本 for var i 0 i lt 5 i var dataRef new Firebase https blr re
使用 Javascript 获取当前域名（不是路径等）

我计划为同一个网站购买两个域名根据使用的域我计划在页面上提供略有不同的数据有没有办法让我检测页面加载的实际域名以便我知道将内容更改为什么我已经四处寻找类似的东西但大多数都没有按照我想要的方式工作例如当使用 document w
使用 RTSP 的视频流：Android

我正在尝试在我的 Linux 计算机上安装 Wowza 服务器以便为我的 Android 应用程序启用 RTSP 流在 Android 客户端我的应用程序需要进行哪些更改我使用 Videoview 只是播放本地存储的视频文件现在我
Android JNI，如何加载soname libxx.so.1.2.3的库

需要使用来自第 3 方的 Android 共享库该库的 soname 和文件名相同格式为 libxx so 1 2 3 这在 Linux 上很常见我将lib文件重命名为libxx so 并使用ndk build将libxx so链接到
由于 inputStream 过早 EOF，Hadoop MapReduce 作业 I/O 异常

我使用以下命令运行 MapReduce 程序hadoop jar
如何在 PHP 中检测浏览器的预取？

某些页面可以由浏览器预取请参阅this http www whatwg org specs web apps current work multipage links html link type prefetch or that htt
调用AUGraphStart播放时接收kAUGraphErr_CannotDoInCurrentContext

我正在与AUGraph和 Audio Units API 用于在我的 iOS 应用程序中播放和录制音频现在我遇到一个罕见的问题AUGraph无法启动出现以下错误结果 kAUGraphErr CannotDoInCurrentConte
`字段不能相同：' ' 和 ' '` mongoimport 错误

我正在尝试将 csv 导入到本地计算机上的 mongodb 中我在 shell 中使用了以下命令 mongoimport d mydb c things type csv file Users agentsFullOutput csv h
Gmaps4rails - 数据库中的经度和纬度未更新。 <嵌套形式>

我有一个模型地点其中包含属性名称州经度和纬度模型 Travel plan 有很多地方我对旅行计划表单中的位置使用嵌套表单 gem 我的问题是更新名称和状态时经度和纬度没有更新在我的地方 rb belongs to trave
仅从早上到晚上设置 cron [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我必须每天运行 cron Cron 必须运行的时间是早上 11 点到晚上 7 点在此给定时间内 cron 必须每天每 15 分钟运行一次同样的事情
现代操作系统/编译器中 int （C 语言）不是 32 位？

这个问题实际上有点广泛根据过去 15 年的经验我目前假设类型的大小如下 byte 8 bit short 2 bytes int 4 bytes long long 8 bytes 是否有一个现代操作系统可以挑战这个假设不管是不是这样
FutureWarning：未来版本中正则表达式的默认值将从 True 更改为 False

我正在运行下面的代码来清理文本 import pandas as pd def not regex pattern return r format pattern tmp pd DataFrame No one has a European
为什么向类 str 构造函数传递字节很特殊？

Python 官方文档是这样描述传递的bytes到单参数构造函数class str 将 bytes 对象传递给 str 而不进行编码或错误参数属于返回非正式字符串的第一种情况表示另请参阅 Python 的 b 命令行选项 Ref ht
为什么 CMake 中的脚本内部无法访问变量？

我有一个名为安装 copy dlls cmake 它被调用以从顶级 cmake 文件执行如下所示安装脚本 install copy dlls cmake 而且我有一个名为 USE OSG STATIC如果我使用静态编译的 Open
创建数组时使用 OpenMP 时出现分段错误

我在访问 for 循环内的数组时遇到分段错误我想做的是生成 DNA 字符串的所有子序列当我在 for 中创建数组时就发生了这种情况读了一段时间后我发现openmp限制了堆栈大小所以使用堆来代替会更安全所以我更改代码以使用mal

创建数组时使用 OpenMP 时出现分段错误

创建数组时使用 OpenMP 时出现分段错误 的相关文章

随机推荐

热门标签

创建数组时使用 OpenMP 时出现分段错误的相关文章