`
luotuoass
  • 浏览: 640341 次
文章分类
社区版块
存档分类
最新评论

常用JAVA正则表达式

 
阅读更多

最近写了一些正则表达式,特总结如下:

1,提取HTML页面中的图片:

"<img\\s+[^>]*src\\s*=\\s*['\"]{1}([^'\"]+)['\"]{1}";

,2,验证是否是图片:

"^http://.*\\.[(?:gif)(?:jpg)(?:jpeg)(?:png)(?:bmp)]"

提取HTTP HEADER 中的charset:

"charset\\s*=\\s*([^\\s]+)[\\s;]*"

提取HTML中的<meta> 中的charset:

<meta\\s*.*charset\\s*=\\s*[\"']?([^\"\\s]+)[\\s\"';]{1}


匹配非中文字母和数字

[^0-9a-zA-Z\u4e00-\u9fa5]

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics