日韩精品免费一区二区三区_久久精品国产三级不卡_免费观看中文字幕_好男人社区神马在线观看www

注冊|登錄

聯系電話:024-31891684  13390130939
沈陽軟件公司--沈陽軟件定制

沈陽軟件開發_沈陽軟件公司_沈陽軟件定制/軟件/最新技術

Latest technology最新技術

正文提取中用到的正則表達式

瀏覽量:2923

#region 相關正則表達式

 
/// <summary>
/// 去掉所有html標簽
/// </summary>
private static readonly Regex FilterAll = new Regex(
@"(\[([^=]*)(=[^\]]*)?\][\s\S]*?\[/\1\])|(?<lj>(?=[^\u4E00-\u9FA5\uFE30-\uFFA0,."");])<a\s+[^>]*>[^<]{2,}</a>(?=[^\u4E00-\u9FA5\uFE30-\uFFA0,."");]))|(?<Style><style[\s\S]+?/style>)|(?<select><select[\s\S]+?/select>)|(?<Script><script[\s\S]*?/script>)|(?<Explein><\!\-\-[\s\S]*?\-\->)|(?<li><li(\s+[^>]+)?>[\s\S]*?/li>)|(?<Html></?\s*[^> ]+(\s*[^=>]+?=['""]?[^""']+?['""]?)*?[^\[<]*>)|(?<Other>&[a-zA-Z]+;)|(?<Other2>\#[a-z0-9]{6})|(?<Space>\s+)|(\&\#\d+\;)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase); //(?<Link><a[\s\S]*?</a>)|
//(?<Style><style[\s\S]+?/style>)|(?<select><select[\s\S]+?/select>)|(?<Script><script[\s\S]*?/script>)|(?<Explein><\!\-\-[\s\S]*?\-\->)|(?<li><li(\s+[^>]+)?>[\s\S]*?/li>)|(?<Html></?\s*[^> ]+(\s*[^=>]+?=['""]?[^""']+?['""]?)*?[^\[<]*>)|(?<Other>&[a-zA-Z]+;)|(?<Other2>\#[a-z0-9]{6})|(?<Space>\s+)
 
/// <summary>
/// 找出title標簽
/// </summary>
private static readonly Regex FindTitle = new Regex(
@"<\s*/?title\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出title標簽內容
/// </summary>
private static readonly Regex FindTitleContent = new Regex(
@"<\s*/?title\s*>(?<Content>[\s\S]*?)<\s*/?title\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出h 和Strong標簽
/// </summary>
private static readonly Regex FindHStrong = new Regex(
@"<\s*/?h\s*>|<\s*/?strong\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出p 和br標簽
/// </summary>
private static readonly Regex FindPB = new Regex(
@"<\s*/?p\s*>|<\s*br\s*/?>|<\s*/?tr\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出nbsp標簽
/// </summary>
private static readonly Regex FindNbsp = new Regex(
@"&nbsp",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出結尾標簽
/// </summary>
private static readonly Regex FindS = new Regex(
@"(?<Content>[\s\S]*?)\$",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為標準句
/// </summary>
private static readonly Regex IsSen = new Regex(
@"[,.,。!!;;::……??《》“”""]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句[strong][h]標簽過多的
/// </summary>
private static readonly Regex IsWs = new Regex(
@"\[\(h\)\]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句冒號和·-過多的
/// </summary>
private static readonly Regex IsWsM = new Regex(
@"\[·]|[-]|[::]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為BBS特征
/// </summary>
private static readonly Regex IsBbsInfo = new Regex(
@"第[^樓]{1,50}樓|Powered\s*/?by[\s\S]*?Dvbbs|Powered\s*/?by[\s\S]*?Discuz",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取KEYWORD
/// </summary>
private static readonly Regex mKeyWord = new Regex(
@"<meta\s*name\s*=\s*['""]?keywords['""]?\s*content\s*=\s*['""]?(?<KeyWords>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<KeyWords>[^'"">]*)['""]?\s*name\s*=\s*['""]?keywords['""]?\s*[^>]*>
",RegexOptions.ExplicitCapture| RegexOptions.Multiline| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取DESCRIPTION
/// </summary>
private static readonly Regex mDescription = new Regex(
@"<meta\s*name\s*=\s*['""]?description['""]?\s*content\s*=\s*['""]?(?<description>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<description>[^'"">]*)['""]?\s*name\s*=\s*['""]?description['""]?\s*[^>]*>
",RegexOptions.ExplicitCapture| RegexOptions.Multiline| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取Tags
/// </summary>
private static readonly Regex mTag = new Regex(
@"<meta\s*name\s*=\s*['""]?tagwords['""]?\s*content\s*=\s*['""]?(?<tagwords>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<tagwords>[^'"">]*)['""]?\s*name\s*=\s*['""]?tagwords['""]?\s*[^>]*>
", RegexOptions.ExplicitCapture | RegexOptions.Multiline | RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句:后字符號過少,:號前無“說”字,:號后無"關于"
/// </summary>
private static readonly Regex IsWsMM = new Regex(
@"^[^說\s]{0,8}?[::].{0,10}$",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出spider寫入的url標記
/// </summary>
private static readonly Regex txtUrl = new Regex(
@"當前URL為:http://(?<URL>.*)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出spider寫入的錨點描述標記
/// </summary>
private static readonly Regex txtDescription = new Regex(
@"當前鏈接描述為:(?<Describe>.*)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
///// <summary>
///// 取需要a標簽
///// </summary>
//private static readonly Regex cleanFirst = new Regex(
// @"([\u4E00-\u9FA5]|[\uFE30-\uFFA0]|[,."");])(?<Robbish1><a\s+[^>]*>)[^<]{1,6}(?<Robbish2></a>)([\u4E00-\u9FA5]|[\uFE30-\uFFA0]|[,."");])", RegexOptions.ExplicitCapture | RegexOptions.Multiline | RegexOptions.IgnoreCase);
 
#endregion
 

CRM定制 辦公OA找沈陽易勢科技有限公司

沈陽團購網|營口網站制作|沈陽軟件公司|軟件定制|網站建設|加盟易勢|提交問題

日韩精品免费一区二区三区_久久精品国产三级不卡_免费观看中文字幕_好男人社区神马在线观看www
国产精品国码视频| 国产一区二区电影在线观看 | 欧美二区不卡| 国产精品嫩草影院av蜜臀| 亚洲影院免费观看| 欧美激情一区在线| 精品91在线| 久久综合久久综合久久| 国产精品欧美在线| 欧美在线91| 国产精品大片| 香蕉精品999视频一区二区| 欧美日韩高清在线播放| 狠狠网亚洲精品| 欧美成人午夜激情| 国内精品久久久久久| 麻豆精品网站| 精品成人在线视频| 欧美精品一区二区精品网| 伊人伊人伊人久久| 欧美久色视频| 亚洲综合第一| 欧美性久久久| 久久精品亚洲精品| 国产手机视频一区二区| 快she精品国产999| 在线观看视频一区二区欧美日韩| 欧美激情一区二区三区四区| 亚洲影视在线播放| 欧美午夜精品久久久久久久| 欧美一区二区三区视频在线| 国产精品日本欧美一区二区三区| 欧美在线啊v一区| 国产日韩专区| 免费亚洲一区| 亚洲午夜精品网| 欧美性色aⅴ视频一区日韩精品| 欧美亚洲专区| 国产偷自视频区视频一区二区| 免费观看在线综合色| 亚洲小说春色综合另类电影| 欧美日韩亚洲高清一区二区| 久久国产日韩欧美| 黄色成人免费观看| 欧美午夜www高清视频| 久久久久国产精品一区| 狠狠色狠狠色综合日日五| 欧美日本中文字幕| 久久成人免费日本黄色| 国产亚洲精品美女| 欧美人成在线| 久久精品一区| 亚洲视频日本| 国产美女精品人人做人人爽| 欧美国产激情二区三区| 午夜精品免费| 国产有码在线一区二区视频| 欧美日韩免费在线观看| 久久香蕉国产线看观看网| 中文网丁香综合网| 国产精品视频导航| 欧美激情精品久久久六区热门 | 午夜久久久久| 国产日韩欧美视频在线| 欧美破处大片在线视频| 久久字幕精品一区| 亚洲欧美久久| 国内精品久久国产| 国产精品久久久久久久久免费桃花 | 国产日韩一区二区三区在线| 欧美伦理91i| 久久亚洲春色中文字幕| 欧美亚洲免费高清在线观看| 国产一区二区三区免费观看| 欧美小视频在线观看| 欧美国产日韩xxxxx| 久久久久久精| 欧美一级黄色录像| 亚洲一区不卡| 一色屋精品亚洲香蕉网站| 国产精品伦一区| 欧美人妖另类| 欧美国产第一页| 卡通动漫国产精品| 久久精品成人一区二区三区蜜臀| 亚洲午夜精品久久久久久浪潮| 国产一区亚洲| 国产日韩视频一区二区三区| 国产精品男女猛烈高潮激情| 欧美视频在线观看一区| 欧美精品尤物在线| 免费日韩一区二区| 久久综合999| 久久深夜福利| 久久国产99| 久久精品国产综合精品| 香蕉精品999视频一区二区 | 亚洲视频视频在线| 精品动漫av| 激情久久久久久久| 国产综合精品一区| 国产主播一区| 黑丝一区二区三区| 国内揄拍国内精品久久| 国产一区二区观看| 国产性天天综合网| 国产日韩欧美日韩大片| 国产精品伊人日日| 国产伦理一区| 国产视频一区三区| 国产日韩欧美在线看| 国产亚洲精品久| 韩日欧美一区二区| 影院欧美亚洲| 亚洲视频欧洲视频| 亚洲女人小视频在线观看| 亚洲欧美综合一区| 午夜精品三级视频福利| 午夜天堂精品久久久久| 欧美一区二区视频在线观看2020| 性欧美大战久久久久久久免费观看| 午夜精品亚洲一区二区三区嫩草| 亚洲免费在线播放| 欧美一区二区三区视频免费播放| 久久国产精品99久久久久久老狼| 欧美一区三区三区高中清蜜桃| 欧美亚洲免费| 久久精品视频在线观看| 麻豆freexxxx性91精品| 欧美国产综合视频| 欧美日韩亚洲国产一区| 国产精品久久久久9999| 国产精品试看| 国产婷婷97碰碰久久人人蜜臀| 国产一区亚洲一区| 亚洲视频免费看| 校园春色综合网| 久久夜色精品国产噜噜av| 毛片基地黄久久久久久天堂| 久久精品国产99精品国产亚洲性色| 久久久av水蜜桃| 久久青青草原一区二区| 欧美国产欧美亚洲国产日韩mv天天看完整 | 欧美精品在线观看播放| 男人天堂欧美日韩| 欧美精品v日韩精品v国产精品| 欧美另类久久久品| 国产精品乱码一区二区三区| 国产一区二区高清| 亚洲影音一区| 久久久久一区二区三区| 欧美激情一区二区三区全黄| 国产精品草莓在线免费观看| 国产一区二区久久| 亚洲欧美电影院| 久久男人资源视频| 欧美日韩三级在线| 国产一区二区欧美| 亚洲欧美日韩一区在线| 噜噜噜躁狠狠躁狠狠精品视频| 欧美日韩在线亚洲一区蜜芽 | 另类激情亚洲| 欧美视频一区二区三区…| 国产亚洲一区二区在线观看| 亚洲一区二区3| 另类尿喷潮videofree| 国产精品国产馆在线真实露脸 | 欧美激情一区在线| 国产欧美精品日韩区二区麻豆天美 | 欧美一区二区在线播放| 欧美高清在线精品一区| 国产女精品视频网站免费 | 国产精品成人播放| 激情另类综合| 久久精品亚洲乱码伦伦中文| 欧美人体xx| 狠狠色丁香久久婷婷综合_中| 欧美在线视频日韩| 欧美日本成人| 黄色国产精品一区二区三区| 久久精品1区| 欧美日韩综合在线免费观看| 精品av久久707| 久久在线视频| 国产精品一区二区在线观看不卡| 亚洲综合日韩中文字幕v在线| 蜜臀av国产精品久久久久| 欧美日韩国产一区二区| 韩国av一区| 久久久精品国产一区二区三区 | 亚洲香蕉在线观看| 美女尤物久久精品| 国产精品视频免费在线观看| 亚洲欧美在线免费| 欧美日韩亚洲高清| 亚洲午夜精品17c| 欧美国产极速在线| 黄色日韩在线| 欧美大片91| 极品尤物一区二区三区|