|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Ruslan Bondarev 2:463/327.37 18 Oct 2002 09:13:39 To : All Subject : HTML::Parser режет текст --------------------------------------------------------------------------------
Hе могу понять, у кого не едут лыжи: у меня или у Gisle Aas.
Вот минимальный для понимания код, вызывающий непонимание.
use strict;
use HTML::Parser;
my $body = "test1 test2";
print _remove_htmltags($body);
sub _remove_htmltags($)
{
my ($body) = @_;
my $ret = '';
# binmode STDOUT; # dear windoze
my $texth = sub { $ret .= $_[0] };
HTML::Parser->new(
api_version => 3,
handlers =>
[
text => [$texth, "dtext"],
],
marked_sections => 1,
unbroken_text => 1, # !!! (1)
)->parse($body) || return $ret;
$ret;
}
Выдает:
Если (1) не закомментировано -- ничего.
Если (1) закомментировать -- "test1".
Должно выдать:
"test1 test2"
D:\usr\perl>perl -MHTML::Parser -e "print $HTML::Parser::VERSION"
3.25
Сборка активстейта (или моя, не помню, да это и не важно).
--- GoldED+/W32 1.1.4.7
* Origin: (2:463/327.37)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/33883dafaaee.html, оценка из 5, голосов 10
|