假设我们有一个 C 函数,它接受一组一个或多个输入数组,处理它们,并将其输出写入一组输出数组。签名如下所示(count
表示要处理的数组元素的数量):
void compute (int count, float** input, float** output)
我想通过 ctypes 从 Python 调用此函数,并使用它对一组 NumPy 数组应用转换。对于单输入/单输出函数定义为
void compute (int count, float* input, float* output)
以下作品:
import ctypes
import numpy
from numpy.ctypeslib import ndpointer
lib = ctypes.cdll.LoadLibrary('./block.so')
fun = lib.compute
fun.restype = None
fun.argtypes = [ctypes.c_int,
ndpointer(ctypes.c_float),
ndpointer(ctypes.c_float)]
data = numpy.ones(1000).astype(numpy.float32)
output = numpy.zeros(1000).astype(numpy.float32)
fun(1000, data, output)
但是,我不知道如何创建相应的指针数组multiple输入(和/或输出)。有任何想法吗?
Edit: 所以人们一直想知道如何compute
知道需要多少个数组指针(如count
指每个数组的元素数量)。事实上,这是硬编码的;给定的compute
准确地知道预期有多少输入和输出。调用者的工作是验证这一点input
and output
指向正确数量的输入和输出。这是一个例子compute
获取 2 个输入并写入 1 个输出数组:
virtual void compute (int count, float** input, float** output) {
float* input0 = input[0];
float* input1 = input[1];
float* output0 = output[0];
for (int i=0; i<count; i++) {
float fTemp0 = (float)input1[i];
fRec0[0] = ((0.09090909090909091f * fTemp0) + (0.9090909090909091f * fRec0[1]));
float fTemp1 = (float)input0[i];
fRec1[0] = ((0.09090909090909091f * fTemp1) + (0.9090909090909091f * fRec1[1]));
output0[i] = (float)((fTemp0 * fRec1[0]) - (fTemp1 * fRec0[0]));
// post processing
fRec1[1] = fRec1[0];
fRec0[1] = fRec0[0];
}
}
我无法影响签名和实施compute
。我可以验证(从 Python!)需要多少输入和输出。关键问题是如何给出正确的argtypes
该函数,以及如何在 NumPy 中生成适当的数据结构(指向 NumPy 数组的指针数组)。