Antlr4识别包含引号转义字符串格式

我要识别的字符串格式是使用单引号或双引号引起来的一个字符序列,如

"hello world"'hello world'

Antlr4可以这样写词法规则

QuotedString: DoubleString | SingleString ;

fragment
DoubleString: '"' .*? '"' ;

fragment
SingleString: '\'' .*? '\'' ;

但是,当我的字符串中存在转义的引号时,上边的词法规则是无法正确识别的,如

"hello \"world\""'hello \'world\''

此时,词法规则进行如下修改,可正确识别

QuotedString: DoubleString | SingleString ;

fragment
DoubleString: '"' ('\\"'|~["])* '"' ;

fragment
SingleString: '\'' ('\\\''|~['])* '\'' ;

即:
双引号字符串的内容可以包含\",但不包含"
单引号字符串的内容可以包含\’,但不包含’


版权声明:本文为momo3507原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。