你可能会重复使用这个C++ 解决方案(通过硬编码替换通用迭代器char*
反而)。
我试了一下。但是,我想发出警告:看起来您正在尝试实现一个表达式解析器。我强烈建议你要么
- 手卷(递归下降)解析器
- 使用flex/bison(或lex/yacc)
这样你就不会陷入 C 文本处理中容易出错的尴尬境地。
Edit:我重写了你的C程序使用C++;你可以看到在这里工作生活.
Edit 2:纯 C 语言中 C 程序的另一个修正:http://ideone.com/ExnufJ 现在也进行了更新以支持迭代扩展
答案只涉及纯 C 方法:
那么,让我们开始吧。我假设了一个示例“电子表格”(它可以包含数字而不是字符串):
const char* cells[][4] = {
/* A B C D */
{ "the" , "lazy" , "cow" , "jumped" }, /* 1 */
{ "over" , "the" , "quick", "brown" }, /* 2 */
{ "paper", "packages", "tied" , "up" }, /* 3 */
{ "with" , "silver" , "white", "winters" }, /* 4 */
{ "that" , "melt" , "fox" , "springs" }, /* 5 */
};
仅使用两个助手:
const char* get_cell_value(const char* coordinate_b, const char* coordinate_e);
char* expand_cell_references(const char* f, const char* const l, char* o); /*the magic engine*/
我们可以编写如下的演示程序:
int main()
{
const char in[] = "The C2 D2 C5 D1 A2 B2 B1 dog!";
char out[1024] = {0};
expand_cell_references(in, in+strlen(in), out);
puts(out); /* "The quick brown fox jumped over the lazy dog!" */
return 0;
}
它根据评论打印众所周知的测试短语。现在,get_cell_value
非常简单:
const char* get_cell_value(const char* coordinate_b, const char* coordinate_e)
{
size_t col = 0, row = 0;
const char* it;
for (it=coordinate_b; it != coordinate_e; ++it)
{
if (*it >= 'A' && *it <= 'Z')
col = 26*col + (*it - 'A');
if (*it >= '0' && *it <= '9')
row = 10*row + (*it - '0'); /* or use atoi and friends */
}
row--; /* 1-based row nums in Excel */
return cells[row][col]; /* 1-based indexes in Excel */
}
And expand_cell_references
稍微复杂一些,是一个简单的 DFA 解析器:
char* expand_cell_references(const char* f, const char* const l, char* o)
{
enum parser_state {
other,
in_coord_col,
in_coord_row
} state = other;
/*temporary storage for coordinates being parsed:*/
char accum[16] = {0};
char* accit = accum;
while (f!=l)
{
switch(state) /*dummy, the transitions flow in fallthrough order for now*/
{
case other:
*(accit = accum) = 0; /*reset the accumulator*/
while (f!=l && !(*f>='A' && *f<='Z'))
*o++ = *f++;
/*fallthrough*/
case in_coord_col:
while (f!=l && *f>='A' && *f<='Z')
*accit++ = *f++;
/*fallthrough*/
case in_coord_row:
{
const char* expanded = accum;
if (f!=l && *f>='0' && *f<='9')
{
while (f!=l && *f>='0' && *f<='9')
*accit++ = *f++;
expanded = get_cell_value(accum, accit);
}
else
{
*accit = 0;
}
while (*expanded)
*o++ = *expanded++;
continue; /*state = other;*/
}
}
}
return o;
}
我在那里采取了一些捷径,因为这个语法非常简单,但它应该让您正确了解从哪里开始。
在这里查看现场演示http://ideone.com/kS7XqB这样你就可以自己玩了。请注意,我将调试(断言)添加到get_cell_value
函数,这样您就不会意外引用越界索引。