java 中用正则表达式匹配和提取字符串

java.util.regex类支持用正则表达式来匹配和提取字符串,读者可以去官网查看java.util.regex的详细使用方法。

首先给出一个匹配字符串的例子(判断line是否符合格式"GraphType\\s*=\\s*\".+\"\\s*"):

public static boolean isLegalInputLine(String line )   {

        Pattern p =Pattern.compile("GraphType\\s*=\\s*\".+\"\\s*");
     	Matcher m = p.matcher(line);
    	boolean r =m.matches(); 
    
    	return r;
    	
    }

这个函数判断line是否匹配格式"GraphType\\s*=\\s*\".+\"\\*",这里的格式是使用java的正则表达式语法规则书写的。具体的语法规则我提供一个网址:https://wenku.baidu.com/view/e109601f52d380eb62946d75.html?rec_flag=default&mark_pay_doc=2&mark_rec_page=1&mark_rec_position=4&mark_rec=view_r_1&clear_uda_param=1
里面有具体的介绍

下面给出用正则表达式提取字符串的例子(从s中提取匹配格式"GraphType\\s*=\\s*\".+\"\\s*"的字符串):

public List<String> getString(String s) {

   List<String> strs = new ArrayList<String>();
   Pattern p = Pattern.compile("GraphType\\s*=\\s*\".+\"\\s*");
   Matcher m = p.matcher(s);
   while(m.find()) {
     strs.add(m.group());

   }
   return strs;
}

有一款叫做Regex Match Tracer的软件,可以用它来练习书写java的正则表达式。值得注意的是这款软件匹配和提取字符串的结果和java中的有所不同,有时这块软件不能识别的,java可以识别,笔者就碰到过这种情况。

另外对于学过形式语言与自动机的要注意java的语法规则与形式语言与自动机里面的正则语法不同。


版权声明:本文为wupeigang1原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。