在 64 位系统上分配低地址内存的最可靠/可移植的方法是什么?

2023-12-20

我需要分配位于前 32GB 虚拟地址空间内的大内存块(由我的自定义分配器使用)。

我想如果我需要,比如说 1MB 块,我可以使用迭代mmap and MAP_FIXED_NOREPLACE(或 VirtualAlloc)从低地址开始以 1MB 为增量,直到调用成功。从上一个成功的块继续下一个块。

这听起来很笨拙,但至少它对于操作系统地址空间布局变化和 ASLR 算法变化具有一定的鲁棒性。根据我对当前操作系统布局的理解,这样第一个 32GB 中应该有足够的可用内存,但也许我错过了一些东西?

Windows、Linux、OS X、iOS 或 Android 中是否有任何东西可以击败这个方案?有没有更好的办法?

以防万一您想知道,这是用于编程语言的 VM 实现,其中将所有指针放入 64 位系统上的 32 位值中可以带来巨大的内存使用优势,甚至速度增益。由于所有对象至少都是 8 字节对齐的,因此可以将低 3 位移出,从而将指针范围从 4GB 扩展到 32GB。


为了限制Windows中分配的内存范围,我们可以使用NtAllocateVirtualMemory https://learn.microsoft.com/en-us/windows-hardware/drivers/ddi/content/ntifs/nf-ntifs-ntallocatevirtualmemory功能。该 API 可在用户模式和内核模式下使用。在用户模式下它导出为dll文件 (use ntdll库 or ntdllp库来自 WDK)。这个函数有一个参数叫做ZeroBits - 剖面视图基地址中必须为零的高位地址位数。但是在上面的msdn链接中,接下来的一些细节是关于ZeroBits是不正确的。这是正确的描述:

ZeroBits

提供必须为零的高阶地址位的数量 剖面视图的基地址。该参数的值必须 小于或等于零位的最大数量并且仅 当内存管理确定在哪里分配视图时使用 (即当 BaseAddress 为空时)。

If ZeroBits为零,则不应用零位约束。

If ZeroBits大于0且小于32,则为 位 31 中的前导零位数。还需要位 63:32 为零。这保留了与 32 位系统的兼容性。 如果ZeroBits大于32,则视为掩码,然后统计出前导零的个数 在面具中。这然后成为零位参数。

所以我们真的可以使用ZeroBits作为面具。这是它最强大的用法。但也可以用作从第 31 位开始的零位计数。在这种情况下,由于分配粒度的原因,63-32 位将始终等于 0。因此,有效值为ZeroBits在位数模式下可以是 1 到 15 (=31-16) 之间的任何数字。为了更好地理解此参数的工作原理,请查看下面的示例代码。为了这个演示,我将使用MEM_TOP_DOWN作为分配类型:

MEM_TOP_DOWN

指定区域应创建在最高虚拟地址 可能基于ZeroBits.

PVOID BaseAddress;
ULONG_PTR ZeroBits;
SIZE_T RegionSize = 1;
NTSTATUS status;

for (ZeroBits = 0xFFFFFFFFFFFFFFFF;;)
{
    if (0 <= (status = NtAllocateVirtualMemory(NtCurrentProcess(), &(BaseAddress = 0), 
        ZeroBits, &RegionSize, MEM_RESERVE|MEM_TOP_DOWN, PAGE_NOACCESS)))
    {
        DbgPrint("%p:%p\n", ZeroBits, BaseAddress);
        NtFreeVirtualMemory(NtCurrentProcess(), &BaseAddress, &RegionSize, MEM_RELEASE);

        ZeroBits >>= 1;
    }
    else
    {
        DbgPrint("%x\n", status);
        break;
    }
}

for(ZeroBits = 0;;) 
{
    if (0 <= (status = NtAllocateVirtualMemory(NtCurrentProcess(), &(BaseAddress = 0), 
        ZeroBits, &RegionSize, MEM_RESERVE|MEM_TOP_DOWN, PAGE_NOACCESS)))
    {
        DbgPrint("%x:%p\n", ZeroBits++, BaseAddress);
        NtFreeVirtualMemory(NtCurrentProcess(), &BaseAddress, &RegionSize, MEM_RELEASE);
    }
    else
    {
        DbgPrint("%x\n", status);
        break;
    }
}

Output:

FFFFFFFFFFFFFFFF:00007FF735B40000
7FFFFFFFFFFFFFFF:00007FF735B40000
3FFFFFFFFFFFFFFF:00007FF735B40000
1FFFFFFFFFFFFFFF:00007FF735B40000
0FFFFFFFFFFFFFFF:00007FF735B40000
07FFFFFFFFFFFFFF:00007FF735B40000
03FFFFFFFFFFFFFF:00007FF735B40000
01FFFFFFFFFFFFFF:00007FF735B40000
00FFFFFFFFFFFFFF:00007FF735B40000
007FFFFFFFFFFFFF:00007FF735B40000
003FFFFFFFFFFFFF:00007FF735B40000
001FFFFFFFFFFFFF:00007FF735B40000
000FFFFFFFFFFFFF:00007FF735B40000
0007FFFFFFFFFFFF:00007FF735B40000
0003FFFFFFFFFFFF:00007FF735B40000
0001FFFFFFFFFFFF:00007FF735B40000
0000FFFFFFFFFFFF:00007FF735B40000
00007FFFFFFFFFFF:00007FF735B40000
00003FFFFFFFFFFF:00003FFFFFFF0000
00001FFFFFFFFFFF:00001FFFFFFF0000
00000FFFFFFFFFFF:00000FFFFFFF0000
000007FFFFFFFFFF:000007FFFFFF0000
000003FFFFFFFFFF:000003FFFFFF0000
000001FFFFFFFFFF:000001FFFFFF0000
000000FFFFFFFFFF:000000FFFFFF0000
0000007FFFFFFFFF:0000007FFFFF0000
0000003FFFFFFFFF:0000003FFFFF0000
0000001FFFFFFFFF:0000001FFFFF0000
0000000FFFFFFFFF:0000000FFFFF0000
00000007FFFFFFFF:00000007FFFF0000
00000003FFFFFFFF:00000003FFFF0000
00000001FFFFFFFF:00000001FFFF0000
00000000FFFFFFFF:00000000FFFF0000
000000007FFFFFFF:000000007FFF0000
000000003FFFFFFF:000000003FFF0000
000000001FFFFFFF:000000001FFF0000
000000000FFFFFFF:000000000FFF0000
0000000007FFFFFF:0000000007FF0000
0000000003FFFFFF:0000000003FF0000
0000000001FFFFFF:0000000001FF0000
0000000000FFFFFF:0000000000FF0000
00000000007FFFFF:00000000007F0000
00000000003FFFFF:00000000003F0000
00000000001FFFFF:00000000001F0000
00000000000FFFFF:00000000000F0000
000000000007FFFF:0000000000070000
000000000003FFFF:0000000000030000
000000000001FFFF:0000000000010000
c0000017
0:00007FF735B40000
1:000000007FFF0000
2:000000003FFF0000
3:000000001FFF0000
4:000000000FFF0000
5:0000000007FF0000
6:0000000003FF0000
7:0000000001FF0000
8:0000000000FF0000
9:00000000007F0000
a:00000000003F0000
b:00000000001F0000
c:00000000000F0000
d:0000000000070000
e:0000000000030000
f:0000000000010000
c0000017

所以如果我们想限制内存分配32Gb (0x800000000), 我们可以用ZeroBits = 0x800000000 - 1:

NtAllocateVirtualMemory(NtCurrentProcess(), &(BaseAddress = 0), 
            0x800000000 - 1, &RegionSize, MEM_RESERVE|MEM_TOP_DOWN, PAGE_NOACCESS);

这将在范围内分配内存[0, 7FFFFFFFF]。 (实际上,范围将是[0, 7FFFF0000]。由于分配粒度的原因,地址的低 16 位始终为 0。)


然后,您可以使用以下命令在分配的区域中创建堆对象RtlCreateHeap https://learn.microsoft.com/en-us/windows-hardware/drivers/ddi/content/ntifs/nf-ntifs-rtlcreateheap并从此堆中分配内存。 (注意 - 此 API 在用户模式下也可用。使用ntdll[p].lib用于链接器输入。)

PVOID BaseAddress = 0;
SIZE_T RegionSize = 0x10000000;// reserve 256Mb
if (0 <= NtAllocateVirtualMemory(NtCurrentProcess(), &BaseAddress, 
    0x800000000 - 1, &RegionSize, MEM_RESERVE, PAGE_READWRITE))
{
    if (PVOID hHeap = RtlCreateHeap(0, BaseAddress, RegionSize, 0, 0, 0))
    {
        HeapAlloc(hHeap, 0, <somesize>);
        RtlDestroyHeap(hHeap);
    }

    VirtualFree(BaseAddress, 0, MEM_RELEASE);
}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 64 位系统上分配低地址内存的最可靠/可移植的方法是什么? 的相关文章

随机推荐