日韩精品免费一区二区三区_久久精品国产三级不卡_免费观看中文字幕_好男人社区神马在线观看www

注冊|登錄

聯系電話:024-31891684  13390130939
沈陽軟件公司--沈陽軟件定制

沈陽軟件開發_沈陽軟件公司_沈陽軟件定制/軟件/最新技術

Latest technology最新技術

辦公OA--正文提取中用到的正則表達式

瀏覽量:2645

CRM定制 辦公OA

#region 相關正則表達式

 
/// <summary>
/// 去掉所有html標簽
/// </summary>
private static readonly Regex FilterAll = new Regex(
@"(\[([^=]*)(=[^\]]*)?\][\s\S]*?\[/\1\])|(?<lj>(?=[^\u4E00-\u9FA5\uFE30-\uFFA0,."");])<a\s+[^>]*>[^<]{2,}</a>(?=[^\u4E00-\u9FA5\uFE30-\uFFA0,."");]))|(?<Style><style[\s\S]+?/style>)|(?<select><select[\s\S]+?/select>)|(?<Script><script[\s\S]*?/script>)|(?<Explein><\!\-\-[\s\S]*?\-\->)|(?<li><li(\s+[^>]+)?>[\s\S]*?/li>)|(?<Html></?\s*[^> ]+(\s*[^=>]+?=['""]?[^""']+?['""]?)*?[^\[<]*>)|(?<Other>&[a-zA-Z]+;)|(?<Other2>\#[a-z0-9]{6})|(?<Space>\s+)|(\&\#\d+\;)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase); //(?<Link><a[\s\S]*?</a>)|
//(?<Style><style[\s\S]+?/style>)|(?<select><select[\s\S]+?/select>)|(?<Script><script[\s\S]*?/script>)|(?<Explein><\!\-\-[\s\S]*?\-\->)|(?<li><li(\s+[^>]+)?>[\s\S]*?/li>)|(?<Html></?\s*[^> ]+(\s*[^=>]+?=['""]?[^""']+?['""]?)*?[^\[<]*>)|(?<Other>&[a-zA-Z]+;)|(?<Other2>\#[a-z0-9]{6})|(?<Space>\s+)
 
/// <summary>
/// 找出title標簽
/// </summary>
private static readonly Regex FindTitle = new Regex(
@"<\s*/?title\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出title標簽內容
/// </summary>
private static readonly Regex FindTitleContent = new Regex(
@"<\s*/?title\s*>(?<Content>[\s\S]*?)<\s*/?title\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出h 和Strong標簽
/// </summary>
private static readonly Regex FindHStrong = new Regex(
@"<\s*/?h\s*>|<\s*/?strong\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出p 和br標簽
/// </summary>
private static readonly Regex FindPB = new Regex(
@"<\s*/?p\s*>|<\s*br\s*/?>|<\s*/?tr\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出nbsp標簽
/// </summary>
private static readonly Regex FindNbsp = new Regex(
@"&nbsp",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出結尾標簽
/// </summary>
private static readonly Regex FindS = new Regex(
@"(?<Content>[\s\S]*?)\$",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為標準句
/// </summary>
private static readonly Regex IsSen = new Regex(
@"[,.,。!!;;::……??《》“”""]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句[strong][h]標簽過多的
/// </summary>
private static readonly Regex IsWs = new Regex(
@"\[\(h\)\]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句冒號和·-過多的
/// </summary>
private static readonly Regex IsWsM = new Regex(
@"\[·]|[-]|[::]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為BBS特征
/// </summary>
private static readonly Regex IsBbsInfo = new Regex(
@"第[^樓]{1,50}樓|Powered\s*/?by[\s\S]*?Dvbbs|Powered\s*/?by[\s\S]*?Discuz",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取KEYWORD
/// </summary>
private static readonly Regex mKeyWord = new Regex(
@"<meta\s*name\s*=\s*['""]?keywords['""]?\s*content\s*=\s*['""]?(?<KeyWords>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<KeyWords>[^'"">]*)['""]?\s*name\s*=\s*['""]?keywords['""]?\s*[^>]*>
",RegexOptions.ExplicitCapture| RegexOptions.Multiline| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取DESCRIPTION
/// </summary>
private static readonly Regex mDescription = new Regex(
@"<meta\s*name\s*=\s*['""]?description['""]?\s*content\s*=\s*['""]?(?<description>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<description>[^'"">]*)['""]?\s*name\s*=\s*['""]?description['""]?\s*[^>]*>
",RegexOptions.ExplicitCapture| RegexOptions.Multiline| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取Tags
/// </summary>
private static readonly Regex mTag = new Regex(
@"<meta\s*name\s*=\s*['""]?tagwords['""]?\s*content\s*=\s*['""]?(?<tagwords>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<tagwords>[^'"">]*)['""]?\s*name\s*=\s*['""]?tagwords['""]?\s*[^>]*>
", RegexOptions.ExplicitCapture | RegexOptions.Multiline | RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句:后字符號過少,:號前無“說”字,:號后無"關于"
/// </summary>
private static readonly Regex IsWsMM = new Regex(
@"^[^說\s]{0,8}?[::].{0,10}$",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出spider寫入的url標記
/// </summary>
private static readonly Regex txtUrl = new Regex(
@"當前URL為:http://(?<URL>.*)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出spider寫入的錨點描述標記
/// </summary>
private static readonly Regex txtDescription = new Regex(
@"當前鏈接描述為:(?<Describe>.*)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
///// <summary>
///// 取需要a標簽
///// </summary>
//private static readonly Regex cleanFirst = new Regex(
// @"([\u4E00-\u9FA5]|[\uFE30-\uFFA0]|[,."");])(?<Robbish1><a\s+[^>]*>)[^<]{1,6}(?<Robbish2></a>)([\u4E00-\u9FA5]|[\uFE30-\uFFA0]|[,."");])", RegexOptions.ExplicitCapture | RegexOptions.Multiline | RegexOptions.IgnoreCase);
 
#endregion

沈陽團購網|營口網站制作|沈陽軟件公司|軟件定制|網站建設|加盟易勢|提交問題

日韩精品免费一区二区三区_久久精品国产三级不卡_免费观看中文字幕_好男人社区神马在线观看www
国产精品一区二区三区久久| 亚洲视频一区二区在线观看 | 国产一区二区视频在线观看| 亚洲校园激情| 欧美大片免费观看在线观看网站推荐| 国产精品视频免费| 亚洲欧美综合国产精品一区| 欧美激情中文字幕一区二区| 国产一区二区三区在线观看视频 | 欧美三级在线播放| 亚洲一区免费网站| 欧美麻豆久久久久久中文| 激情91久久| 女人色偷偷aa久久天堂| 国产一区二区精品| 久久香蕉国产线看观看网| 国产精品日产欧美久久久久| 欧美伊久线香蕉线新在线| 国产精品chinese| 亚洲欧美另类在线| 欧美性猛交xxxx乱大交蜜桃| 亚洲综合丁香| 国产精品久久久久久久久果冻传媒 | 中日韩美女免费视频网站在线观看| 免费观看国产成人| 一区二区视频欧美| 欧美日韩国产成人在线| 亚洲综合日本| 国产精品久久久爽爽爽麻豆色哟哟| 性欧美xxxx大乳国产app| 欧美日韩在线免费| 欧美在线观看网址综合| 国产精品久久久久毛片软件| 欧美与欧洲交xxxx免费观看| 国产精品一区二区久久| 玖玖国产精品视频| 在线不卡中文字幕| 欧美视频二区| 久久久久综合网| 在线免费观看欧美| 国产精品99一区二区| 久久精品国产久精国产一老狼 | 久久婷婷激情| 一区在线视频| 国产精品a级| 久久嫩草精品久久久精品| 激情av一区| 欧美日韩一区二区在线播放| 欧美在线观看日本一区| 国产综合色在线| 欧美日韩八区| 久久久免费精品| 亚洲视频一区二区免费在线观看| 国产精品国产三级国产aⅴ入口 | 国产一区在线播放| 欧美日韩亚洲一区二区三区在线观看| 久久精品91| 中文在线资源观看视频网站免费不卡| 国产精品久久久久久久app| 免费亚洲电影| 亚洲欧美电影院| 国产亚洲一区二区三区在线观看| 欧美精品一区二区视频| 久久免费视频一区| 亚洲女人小视频在线观看| 国产一区二区日韩精品欧美精品| 欧美日韩调教| 老司机免费视频一区二区三区 | 午夜一区二区三区在线观看 | 欧美freesex8一10精品| 午夜欧美大尺度福利影院在线看| 国内精品久久久| 国产精品国产三级国产专播精品人| 麻豆精品精华液| 性18欧美另类| 中文国产成人精品久久一| 国产伦精品一区二区三区免费迷| 欧美日韩成人精品| 欧美成人久久| 久久婷婷色综合| 久久av红桃一区二区小说| 亚洲视频播放| 国模私拍一区二区三区| 国产精品私拍pans大尺度在线| 欧美精品一区二区三区很污很色的| 久久视频这里只有精品| 欧美一区综合| 午夜精品久久久久久99热软件| 在线看视频不卡| 国内成+人亚洲| 国产日韩1区| 国产精品日日做人人爱| 欧美午夜激情在线| 欧美日本韩国一区| 美女脱光内衣内裤视频久久影院 | 国产精品免费小视频| 欧美日韩亚洲激情| 欧美精品91| 欧美不卡视频一区| 蜜臀久久99精品久久久久久9| 久久精品理论片| 性刺激综合网| 欧美一级免费视频| 午夜精品一区二区三区电影天堂| 在线播放视频一区| 一区二区视频免费完整版观看| 国产一区二区三区久久久| 国产欧美不卡| 国产麻豆成人精品| 国产农村妇女精品| 国产欧美一区二区精品秋霞影院| 国产精品久久久久影院色老大| 国产精品福利网站| 国产精品入口66mio| 国产精品美女久久久免费| 国产精品美腿一区在线看| 国产精品亚洲欧美| 国产日韩欧美三区| 韩国一区二区三区在线观看| 韩国亚洲精品| 中文在线资源观看网站视频免费不卡 | 亚洲综合成人在线| 亚洲欧美日韩综合| 久久不射电影网| 久久成人18免费观看| 久久久久久国产精品一区| 久久国产主播| 久久字幕精品一区| 欧美大片91| 欧美欧美在线| 国产精品电影网站| 国产精品女主播| 国产欧美精品在线播放| 国产亚洲精品综合一区91| 国内在线观看一区二区三区| 一区二区在线观看视频| 亚洲午夜精品福利| 欧美一级夜夜爽| 久久免费视频在线观看| 欧美成人69av| 久久精品日韩欧美| 快射av在线播放一区| 欧美成人资源| 欧美色大人视频| 国产精品一香蕉国产线看观看| 国产亚洲观看| 亚洲一区二区三区欧美| 久久se精品一区二区| 蜜桃视频一区| 欧美视频日韩视频| 国产日韩欧美中文| 尤物视频一区二区| 欧美亚洲一级片| 久久综合伊人| 欧美日韩一区二区精品| 国产精品人人做人人爽| 红桃视频国产精品| 午夜精品久久99蜜桃的功能介绍| 久久久久女教师免费一区| 欧美国产日韩精品免费观看| 欧美午夜精品一区| 好看的av在线不卡观看| 午夜久久影院| 欧美国产精品v| 国产精品视频一二三| 影音先锋亚洲电影| 欧美资源在线| 欧美精品一区二区三区高清aⅴ| 国产精品另类一区| 中日韩男男gay无套| 久久女同互慰一区二区三区| 欧美日韩一区二区三区| 玉米视频成人免费看| 久久久久久69| 国产精品久久夜| 亚洲影院一区| 嫩草国产精品入口| 国产欧美午夜| 欧美在线在线| 欧美日韩在线电影| 在线日韩中文| 美女999久久久精品视频| 国产精品综合视频| 欧美一区二区三区久久精品| 欧美国产精品v| 国产专区精品视频| 久久精品电影| 国产精品久久久久国产a级| 亚洲午夜日本在线观看| 欧美电影免费观看高清| 国产日本欧美一区二区三区在线| 欧美在线免费播放| 欧美性视频网站| 亚洲欧美精品伊人久久| 欧美日本韩国| 亚洲一区二区精品在线观看| 欧美激情精品久久久久| 激情视频一区二区三区| 久久综合久色欧美综合狠狠 | 久久久视频精品|