当您只对源文件的某些部分感兴趣时,您可以设置filter=true
在你的选项 { ... }部分。这将使您能够仅定义您感兴趣的标记,而您未定义的标记将被词法分析器忽略。
请注意,这仅适用于词法分析器语法,不适用于组合(或解析器)语法。
一个小演示:
lexer grammar CSharpClassLexer;
options {
language=CSharp2;
filter=true;
}
@namespace { Demo }
Comment
: '//' ~('\r' | '\n')*
| '/*' .* '*/'
;
String
: '"' ('\\' . | ~('"' | '\\' | '\r' | '\n'))* '"'
| '@' '"' ('"' '"' | ~'"')* '"'
;
Class
: 'class' Space+ Identifier
{Console.WriteLine("Found class: " + $Identifier.text);}
;
Space
: ' ' | '\t' | '\r' | '\n'
;
Identifier
: ('a'..'z' | 'A'..'Z' | '_') ('a'..'z' | 'A'..'Z' | '_' | '0'..'9')*
;
重要的是你离开Identifier
在那里因为你不想要Xclass Foo
被标记为:['X', 'class', 'Foo']
。随着Identifier
在那里,Xclass
将成为整个标识符。
可以使用以下类来测试语法:
using System;
using Antlr.Runtime;
namespace Demo
{
class MainClass
{
public static void Main (string[] args)
{
string source =
@"class TestClass
{
int a = 42;
string _class = ""inside a string literal: class FooBar {}..."";
class Nested {
/* class NotAClass {} */
// class X { }
class DoubleNested {
string str = @""
multi line string
class Bar {}
"";
}
}
}";
Console.WriteLine("source=\n" + source + "\n-------------------------");
ANTLRStringStream Input = new ANTLRStringStream(source);
CSharpClassLexer Lexer = new CSharpClassLexer(Input);
CommonTokenStream Tokens = new CommonTokenStream(Lexer);
Tokens.GetTokens();
}
}
}
产生以下输出:
source=
class TestClass
{
int a = 42;
string _class = "inside a string literal: class FooBar {}...";
class Nested {
/* class NotAClass {} */
// class X { }
class DoubleNested {
string str = @"
multi line string
class Bar {}
";
}
}
}
-------------------------
Found class: TestClass
Found class: Nested
Found class: DoubleNested
请注意,这只是一个快速演示,我不确定我是否在语法中处理了正确的字符串文字(我不熟悉 C#),但这个演示应该给您一个开始。
祝你好运!