http://ru.wikipedia.org/wiki/Межсайтовый_скриптинг
подскжаите как очистить текст от тэгов разных, чтобы был только только текст, велосипед писать не хочется, в гугле нашел по разному... может есть готовое на cpan.org? (я раньше использовал 2 регулярки)
вот есть модуль:
http://search.cpan.org/~podmaster/HTML- ... crubber.pm
я не знаю как его настроить или как проверить праивльно ли он работает...
модуль для очистки HTML perl
Правила форума
Убедительная просьба юзать теги [code] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
Убедительная просьба юзать теги [code] при оформлении листингов.
Сообщения не оформленные должным образом имеют все шансы быть незамеченными.
- ProFTP
- подполковник
- Сообщения: 3388
- Зарегистрирован: 2008-04-13 1:50:04
- Откуда: %&й
- Контактная информация:
Услуги хостинговой компании Host-Food.ru
Тарифы на хостинг в России, от 12 рублей: https://www.host-food.ru/tariffs/hosting/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/
Тарифы на виртуальные сервера (VPS/VDS/KVM) в РФ, от 189 руб.: https://www.host-food.ru/tariffs/virtualny-server-vps/
Выделенные сервера, Россия, Москва, от 2000 рублей (HP Proliant G5, Intel Xeon E5430 (2.66GHz, Quad-Core, 12Mb), 8Gb RAM, 2x300Gb SAS HDD, P400i, 512Mb, BBU):
https://www.host-food.ru/tariffs/vydelennyi-server-ds/
Недорогие домены в популярных зонах: https://www.host-food.ru/domains/
-
- полковник
- Сообщения: 5845
- Зарегистрирован: 2007-12-07 13:51:33
- Откуда: Верх-Нейвинск
Re: модуль для очистки HTML perl
та не парься -))) проблема решается много проще, надо эскейпь пять символовProFTP писал(а):http://ru.wikipedia.org/wiki/Межсайтовый_скриптинг
Код: Выделить всё
'&' => '&' ,
'"' => '"',
'\'' => ''',
'<' => '<' ,
'>' => '>'
- ProFTP
- подполковник
- Сообщения: 3388
- Зарегистрирован: 2008-04-13 1:50:04
- Откуда: %&й
- Контактная информация:
Re: модуль для очистки HTML perl
вот еще нашел, говорят с форума ikonboard
Код: Выделить всё
sub clean {
my $Tmp = shift;
return '' unless defined $Tmp;
$Tmp =~ s|&|&|g;
$Tmp =~ s|<!--|<!--|g; $Tmp =~ s|-->|-->|g;
$Tmp =~ s|<script|<script|ig;
$Tmp =~ s|>|>|g;
$Tmp =~ s|<|<|g;
$Tmp =~ s|"|"|g;
$Tmp =~ s!^\s+!!;
$Tmp =~ s!\s+$!!;
$Tmp =~ s| | |g;
$Tmp =~ s!\|!|!g;
$Tmp =~ s|\n|<br>|g;
$Tmp =~ s|\$|$|g;
$Tmp =~ s|\r||g;
$Tmp =~ s|\_\_(.+?)\_\_||g;
$Tmp =~ s|\\|\|g;
$Tmp =~ s|!|!|g;
$Tmp =~ s|\'|'|g;
return $Tmp;
}
-
- проходил мимо
Re: модуль для очистки HTML perl
Знаю что для граббинга интернет страниц используют LWP::Simple
есть на CPAN
есть на CPAN
- thefree
- лейтенант
- Сообщения: 980
- Зарегистрирован: 2008-12-29 9:23:19
- Откуда: Весёлая Страна
Re: модуль для очистки HTML perl
Не судите меня строго, Я не волшебник, а только учусь!
http://planetbsd.ru - RSS-агрегатор *BSD по Рунету
http://planetbsd.ru - RSS-агрегатор *BSD по Рунету