下面的答案显示了如何拆分 C 字符串,就像 shell 在将其传递给main
充当argc
and argv
。那是ls -la
将分为:
argv[0] == "ls"
argv[1] == "-la"
但是,由于您想要包含多个用管道字符粘在一起的命令行,因此您首先必须在每个命令行中拆分字符串|
特点。这可以使用以下方法完成strtok正如你提到的。
str = "ls -la|grep hello";
...
// Do split on |
...
strs[0] == "ls -la";
strs[1] == "grep hello";
然后进一步将这些命令行分割成自己的argv
数组。然后最后将它们组装成一个数组NULL
正如您所描述的那样。
因为当你开始时你不知道最终数组的大小。或者就此而言有多少|
有迹象表明,您可以首先计算这些并分配一个包含所有argv
s:
char **strs = NULL;
char **argvs = NULL;
size_t count = 0;
size_t i = 0;
while (*str) if (*str++ == '|') ++count;
strs = calloc(count, sizeof(char *));
...
// strtok on | and save tokens into strs[i]
...
现在分割命令行并附加NULL
在最后:
// Code for split_commandline below.
for (i = 0; i < count; i++)
{
argvs[i] = split_commandline(strs[i], &argc);
// Make room for NULL at the end of the argv array.
argvs[i] = realloc(argvs[i], (argc + 1) * sizeof(char *));
argvs[i][argc] = NULL;
}
所有这些都有点做作,当然可以使用存储,但这样做的步骤很清晰。
NOTE: 这个不分裂"ls -la"
into "ls", "-l", "a"
正如最初的问题所要求的那样,而是"ls", "-la"
。我不确定为什么需要这样做,但它需要对单个命令进行黑客攻击,因为什么"-la"
手段特定于ls
程序。
分割命令行
Unix/Linux您可以使用wordexp对于这件事。然而,这并不意味着您应该意识到这会带来一些安全隐患。也就是说,它将扩展 shell 变量,并且许多(如果不是全部)实现都会导致调用sh
.
注意:OSX 10.9.5 似乎会泄漏内存wordexp
即使wordfree
叫做。看OSX 10.9.5 上 libc 中的 wordexp 是否存在泄漏?了解详情。
Windows我知道这个问题只针对 Linux。但其他人可能对多平台解决方案感兴趣。
在这里你可以使用CommandLineToArgvW。请注意,这是为了wchar_t *
所以下面的示例代码首先从char *
to wchar_t *
,进行分割,然后转换回char *
为两个平台获得一致的 API。
写完这个实现后我还发现__getmainargs它支持char *
相反,但我还没有尝试使用这个。
代码示例:
char **split_commandline(const char *cmdline, int *argc)
{
size_t i;
char **argv = NULL;
assert(argc);
if (!cmdline)
{
return NULL;
}
// Posix.
#ifndef _WIN32
{
int ret;
wordexp_t p;
memset(&p, 0, sizeof(p));
// Note! This expands shell variables (might be a security issue).
if ((ret = wordexp(cmdline, &p, 0)))
{
return NULL;
}
*argc = p.we_wordc;
if (!(argv = calloc(*argc, sizeof(char *))))
{
goto fail;
}
for (i = 0; i < p.we_wordc; i++)
{
if (!(argv[i] = strdup(p.we_wordv[i])))
{
goto fail;
}
}
// Note that on some OSX versions this does not free all memory (10.9.5)
wordfree(&p);
return argv;
fail:
p.we_offs = 0;
wordfree(&p);
}
#else // WIN32
{
// TODO: __getmainargs is an alternative... https://msdn.microsoft.com/en-us/library/ff770599.aspx
wchar_t **wargs = NULL;
size_t needed = 0;
wchar_t *cmdlinew = NULL;
size_t len = strlen(cmdline) + 1;
if (!(cmdlinew = calloc(len, sizeof(wchar_t))))
{
goto fail;
}
if (!MultiByteToWideChar(CP_ACP, 0, cmdline, -1, cmdlinew, len))
{
goto fail;
}
if (!(wargs = CommandLineToArgvW(cmdlinew, argc)))
{
goto fail;
}
if (!(argv = calloc(*argc, sizeof(char *))))
{
goto fail;
}
// Convert from wchar_t * to ANSI char *
for (i = 0; i < *argc; i++)
{
// Get the size needed for the target buffer.
// CP_ACP = Ansi Codepage.
needed = WideCharToMultiByte(CP_ACP, 0, wargs[i], -1,
NULL, 0, NULL, NULL);
if (!(argv[i] = malloc(needed)))
{
goto fail;
}
// Do the conversion.
needed = WideCharToMultiByte(CP_ACP, 0, wargs[i], -1,
argv[i], needed, NULL, NULL);
}
if (wargs) LocalFree(wargs);
free(&cmdlinew);
return argv;
fail:
if (wargs) LocalFree(wargs);
free(&cmdlinew);
}
#endif // WIN32
if (argv)
{
for (i = 0; i < *argc; i++)
{
if(argv[i]) free(argv[i]);
argv[i] = NULL;
}
free(argv);
}
return NULL;
}