Атрибуты. Парсинг
Одной строки настроек достаточно, чтобы спарсить все атрибуты, которые имеются на веб странице.
Допустим, ссылка на веб-страницу сайта-донора находится в колонке 12, а атрибуты располагаются в области, ограниченной параметрами id="tab-specification"> и </table
Следовательно, "Тексты начала и конца парсинга" будут: id="tab-specification">,</table
Названия атрибутов ограничено текстами <td> и </td>, также, как и значения. Следовательно, параметры парсинга будут: <td>,</td,<td>,</
Итоговые настройки:
- номер колонки 12 необходимо прописать здесь:
- дать разрешение на загрузку атрибутов:
P.S. В колонке 12 прайс листа может находится не ссылка для парсинга, а описание товара, содержащее атрибуты:
в таком случае, можно парсить текст описания в атрибуты. Параметры те же.
Выводы.
- Для парсинга атрибутов, номер колонки, содержащей ссылку на веб-страницу необходимо указывать на главной странице формы поставщика, в полосе "Название товара"
- Заполнение вкладки "Атрибуты" параметрами парсинга, не является достаточным условием для парсинга атрибутов: нужно еще дать разрешение на загрузку на главной странице формы
- Для парсинга атрибутов недостаточно двух параметров (как для парсинга названия или описания). Нужно 4 параметра: 2 для названия атрибута и 2 параметра для значения атрибута.
Исключения.
1. В некоторых ситуациях, используется не 4 параметра, а 3. Например:
Здесь, второй параметр названия атрибута - точка с запятой, является одновременно первым параметром значения атрибута. Следовательно, получается всего 3 параметра:
и этого достаточно.
2. Можно парсить атрибуты по-отдельности, индивидуально. Например, нужно взять только один атрибут: "Тип" (см. пример веб страницы выше):
В таких случаях, используется только 2 параметра парсинга, но "Тексты начала и конца парсинга", тут, как правило, обязательны.