У меня есть содержимое таблицы html, которое я пытаюсь преобразовать в текст с той же структурой, с помощью use HTML::TreeBuilder
и use HTML::FormatText
в perl. Я пробовал с этим кодом
use strict;
use warnings;
use HTML::TreeBuilder;
use HTML::FormatText;
my $raw_html='';
my $tree = HTML::TreeBuilder->new_from_content($raw_html);
print $tree->format(HTML::FormatText->new);
ожидаемый результат:
data1 data1_value
data2 data2_value
data3 data3_value
но вывод, который я получаю, похож:
data1
data1_value
data2
data2_vaue
data3
data3_value
Мне нужно какое-то предложение.
Документация HTML::FormatText
утверждает: "Форматирование HTML-таблиц и форм не реализовано".
Поэтому вам нужно будет найти другой подход. HTML::TableExtract
- вероятный кандидат.