Преобразование таблицы HTML в текст с использованием perl

0

У меня есть содержимое таблицы html, которое я пытаюсь преобразовать в текст с той же структурой, с помощью use HTML::TreeBuilder и use HTML::FormatText в perl. Я пробовал с этим кодом

use strict;
use warnings;
use HTML::TreeBuilder;
use HTML::FormatText;
my $raw_html='';
my $tree = HTML::TreeBuilder->new_from_content($raw_html); 
print $tree->format(HTML::FormatText->new);

ожидаемый результат:

data1            data1_value

data2            data2_value

data3            data3_value

но вывод, который я получаю, похож:

data1

data1_value

data2

data2_vaue

data3

data3_value

Мне нужно какое-то предложение.

Теги:
html-treebuilder

1 ответ

1

Документация HTML::FormatText утверждает: "Форматирование HTML-таблиц и форм не реализовано".

Поэтому вам нужно будет найти другой подход. HTML::TableExtract - вероятный кандидат.

Ещё вопросы

Сообщество Overcoder
Наверх
Меню