Ранее я писал об использовании jQuery для удаления всех тегов HTML с Div . Теперь, если вы хотите удалить все плохие символы из строки HTML (которая могла быть предоставлена вызовом $ .getScript () или другим).
Вот как вы можете легко очистить ваш HTML и удалить плохие символы, это может быть полезно, когда вы получаете html откуда-то и хотите использовать .match () для строк, но .match () выдает ошибку из-за плохих символов. Мы можем сделать это с помощью регулярных выражений и при этом сохранить наши HTML-теги следующим образом:
//clean up string/HTML (remove bad chars but keep html tags)
rawData = rawData.replace(/[<>^a-zA-Z 0-9]+/g,'');
Если мы хотим быть более конкретными, мы также можем удалить другие общие символы, которые не нужны:
///clean up HTML ready to be used with match() statement
rawData = rawData.replace(/[^/\"_+-<>=a-zA-Z 0-9]+/g,'');
Функция cleanHTML ()
Я написал эту небольшую функцию, чтобы помочь с процессом очистки HMTL, готового к использованию регулярных выражений на нем.
/* clean up HTML for use with .match() statement or regex */
var JQUERY4U = {};
JQUERY4U.UTIL =
{
cleanUpHTML: function(html) {
html = html.replace("'",'"');
html = html.replace(/[^/\"_+-?!<>[]{}()=*.|a-zA-Z 0-9]+/g,'');
return html;
}
}
//usage:
var cleanedHTML = JQUERY4U.UTIL.cleanUpHTML(htmlString);