Сегменты: как с ними работать

Изменено Mon, 09 Oct 2023 на 07:37 PM

1. Что такое сегмент в Netpeak Spider?

2. Как сегментировать результаты сканирования?

3. Экспорт сегментированных результатов.

4. Примеры использования сегментов.


1. Что такое сегмент в Netpeak Spider?

Сегментация — функция, позволяющая изменить набор представленных данных, ограничивая их определённым фильтром. Она помогает упростить работу с большими сайтами, например, при необходимости провести анализ сайта по конкретной выборке данных.

Применение сегментов влияет на формирование всех отчётов в программе, включая таблицы результатов, внутреннюю базу данных, а также панели «Дашборд», вкладки «Ошибки», «Сводка», «Структура сайта», «Парсинг» боковой панели и т.д. Сегментация затрагивает работу некоторых встроенных в программу инструментов: «Расчёт внутреннего PageRank» и «Генератор Sitemap» → в их расчётах будут участвовать данные только по выбранному сегменту.

2. Как сегментировать результаты сканирования?

Есть два способа работы с сегментами:

1. Применить сегмент к предварительно отфильтрованным результатам. Этот способ поможет быстро и удобно отфильтровать результат, если для ваших задач подходят преднастроенные фильтры или фильтр по значению.

Для этого нажмите на кнопку «Применить как сегмент» на вкладке отфильтрованных результатов.

генератор sitemap

2. Настроить сегмент самостоятельно. Например, чтобы определить разделы, в которых больше всего критических ошибок: для этого нажмите на кнопку «Настроить сегмент... » на панели управления (или воспользуйтесь комбинацией клавиш Ctrl+Shift+F) и в открывшимся окне задайте необходимые условия.

настройка кастомного сегмента

Обратите внимание: после настройки сегмента, его имя и процент относительно просканированных страниц отобразятся на кнопке, выполняющей функцию настройки сегмента. Кликните на неё, чтобы снова открыть окно настроек.

размер сегмента

Чтобы отменить сегментацию, нажмите на кнопку «Сбросить».

3. Экспорт сегментированных результатов

Применение сегмента влияет на все данные, поэтому в экспортированные отчёты попадут те, которые относятся к выбранному сегменту. Исключением является отчёт «Ссылки в очереди», так как в ходе сканирования сегмент не применяется.

4. Примеры использования сегментов

4.1. Исключение из отчётов страниц с get-параметрами (пользовательские условия)

Если при работе с результатами сканирования вам не нужны некоторые отсканированные страницы, например, URL, которые передают определённый параметр, тогда:

1. Нажмите на «Настроить сегмент... » на панели управления.

2. Настройте условие сегмента. Для исключения страниц с get-параметрами необходимо исключить URL, содержащие «?».

3. Нажмите OK.

сегментация get-параметров

Вы также можете настроить аналогичный фильтр для применённого сегмента, чтобы изменить его представление на вкладке отфильтрованных результатов.

фильтрация сегмента

4.2. Настройка сегмента для отображения ошибок с высокой критичностью (вкладка «Ошибки»)

Чтобы получить все данные и отчёты исключительно по страницам, на которых были найдены ошибки высокой критичности, вам нужно:

1. Открыть вкладку «Ошибки» на боковой панели.

2. Отфильтровать ошибки кликом на пункт «Высокая критичность», чтобы в таблице отфильтрованных результатов оказались соответствующие данные.

3. Нажать на «Применить как сегмент» в верхнем правом углу «Дашборда».

Теперь все отчёты и статистика будут отображаться с учётом применённого сегмента.

сегментация ошибок

4.3. Настройка сегмента для отображения индексируемых страниц (вкладка «Сводка»)

Аналогично предыдущему примеру вы можете применить сегмент и к другим преднастроенным фильтрам. Например, чтобы увидеть статистику по индексируемым страницам сайта, выполните следующие действия:

1. Откройте вкладку «Сводка» на боковой панели.

2. Отфильтруйте URL, кликнув на статус страницы «Индексируемые».

3. На вкладке «Отфильтрованные результаты» примените фильтр как сегмент.

сегментация индексируемых страниц

4.4. Настройка сегмента по элементу структуры (вкладка «Структура»)

На вкладке «Структура сайта» отобразятся просканированные разделы и категории. Тут вы можете в два клика выделить сегментом:

  • интересующую языковую локаль,
  • нужный раздел товаров,
  • определённый поддомен или другую часть сайта.

Для этого:

1. Кликните на нужный пункт структуры сайта.
2. Примените отфильтрованные результаты как сегмент.

сегментация структуры

4.5. Настройка сегмента по определённому условию парсинга (вкладка «Парсинг»)

Вы также можете сегментировать результаты по условию парсинга. Для этого:

1. В настройках парсинга Netpeak Spider пропишите условия в соответствии с необходимой информацией и запустите сканирование.
2. После окончания краулинга на боковой панели «Парсинг» выберите необходимый параметр.
3. Примените отфильтрованные результаты как сегмент.

сегментация результатов парсинга

Статья помогла?

Отлично!

Спасибо за ваш отзыв

Извините, что не удалось помочь!

Спасибо за ваш отзыв

Расскажите, как мы можем улучшить эту статью!

Выберите хотя бы одну причину
Требуется проверка CAPTCHA.

Комментарий отправлен

Мы ценим вашу помощь и постараемся исправить статью