几种实用的正则表达式提取url网址中的域名

怎么使用正则表达式获取url 网址中的域名呢???

假如连接是: http://www.flammulina.com/category/%E7%BD%91%E8%B5%9A/

1. 想获取 www.flammulina.com    

URL中的域名就是“http://”与第一个“/”之间的部分,知道了规律我们就可以用一下正表达式获取啦

我们使用 正则  (?<=://).+?(?=/)

zhenze.png

2. 想获取 http://www.flammulina.com   

这个正则是在 stackoverflow 中查到的 避免了一些中文 或者其他语言路径的问题

((([A-Za-z]{3,9}:(?:\/\/)?)(?:[-;:&=\+\$,\w]+@)?[A-Za-z0-9.-]+(:[0-9]+)?|(?:ww‌​w.|[-;:&=\+\$,\w]+@)[A-Za-z0-9.-]+)((?:\/[\+~%\/.\w-_]*)?\??(?:[-\+=&;%@.\w_]*)#?‌​(?:[\w]*))?)

3.想获取主域名 flammulina.com   

使用正则  (?<=http://|\.)[^.]*?\.(com|cn|net|org|biz|info|cc|tv)

如果要得到 flammulina.com/tag/java/

正则表达式最后加上 .* 即可.

4. 代码