Анализ исходного кода и HTTP-заголовков

Изменено Mon, 09 Oct 2023 на 07:39 PM

  1. Запуск инструмента.
  2. Работа с результатами.
  3. Экспорт результатов. 

Инструмент «Анализ исходного кода и HTTP-заголовков» показывает, как именно Netpeak Spider анализирует текст при расчётах количества слов или символов на странице и помогает понять, почему иногда данные в Netpeak Spider отличаются от тех, что вы видите при посещении сайта в браузере. Больше информации по этому вопросу вы сможете найти статье «Почему Netpeak Spider и браузер показывают разные данные?».

1. Запуск инструмента 

Открыть инструмент вы можете двумя способами:

1.1. С помощью контекстного меню (горячих клавиш). В таблице результатов выделите интересующий вас URL и воспользуйтесь комбинацией клавиш Ctrl+U либо выберите в контекстном меню пункт «Исходный код и HTTP-заголовки».

Запуск анализа исходного кода и заголовков

1.2. Запуск через панель управления. На панели управления выберите «Запустить (Инструменты) → Анализ исходного кода и HTTP-заголовков».

Запуск анализа заголовков http

В открывшемся окне инструмента введите URL интересующей вас страницы и нажмите «Старт». 

Запуск кнопкой старт

Netpeak Spider сохраняет подсказки для быстрого повторного ввода URL в будущем.

2. Работа с результатами

Перечень данных, которые вы можете увидеть в левой части окна, а также их описание приведены в таблице ниже. Тип и количество этих полей могут быть разными для разных страниц, поэтому в таблице собраны самые распространённые.


Название поля

Описание

Общие данные, полученные при обращении к URL

Page Type

Тип запрашиваемой страницы (HTML, JSON, Изображение и т.д.).

Request URL

URL-адрес запрашиваемой страницы.

Request Method

Метод запроса (например, GET).

Status Code

Код ответа страницы.

Response Time

Время (в миллисекундах) до получения первого байта от сервера.

Content Download Time

Время (в миллисекундах), за которое  сервер возвращает HTML-код страницы.

Proxy Server

IP-адрес и порт прокси, с которого был отправлен запрос странице, если прокси задан в настройках программы. Если вы не использовали прокси, будет отображаться значение «(Not Set)». 

Remote Address

IP-адрес и порт домена, на котором расположена запрашиваемая страница.

HTTP-заголовки ответа сервера

Date

Дата генерации отклика.

Content-Type

Тип контента страницы.

Content-Encoding

Способ кодирования элементов на запрашиваемой странице.

Connection

Параметры управления для текущего подключения.

Vary

Оповещает запрашивающий сервер, как сопоставить будущие заголовки запросов, чтобы решить, можно ли использовать кэшированный ответ вместо того, чтобы запрашивать новый ответ с оригинального сервера.

Set-Cookie

Данные cookie. Используется для отправки cookie от сервера к User Agent. Формат значения: =.

HTTP-заголовки запроса к серверу

User-Agent

Текущий User Agent, который был использован при запросе указанной страницы. Вы можете изменять User Agent в настройках программы.

Accept

Список допустимых форматов ресурса.

Accept-Encoding

Список допустимых кодировок.

Accept-Charset

Список поддерживаемых кодировок для предоставления пользователю.

Host

URL-адрес домена, на котором расположена запрашиваемая страница.

Cache-Control

Директивы для управления кэшированием.

Pragma

Используется для обратной совместимости с кэшами HTTP / 1.0, где заголовок Cache-Control HTTP / 1.1 еще не присутствует.


В левой части окна вы также можете увидеть список GET-параметров в том случае, если они присутствуют в URL страницы. Например, если URL-адрес страницы https://www.example.com/products?sort=popularity&os=windows, вы увидите следующие данные:


Get-параметры

sort

popularity

os

windows


Просмотреть исходный код и извлечённый текст вы можете в правой части окна инструмента. Благодаря подсветке, нумерации и автопереносу строк вы легко можете распознать метатеги, канонические ссылки и другие важные элементы кода. На вкладке «Извлечённый текст» вы увидите весь текст на странице без HTML-тегов.

Обратите внимание: исходный код отображается только для страниц с кодом ответа сервера 2xx.
На вкладке «Исходный код» доступны следующие типы документов:

  • HTML;
  • PlainText (например, TXT-файлы);
  • JavaScript;
  • CSS (файлы стилей);
  • XML;
  • GZIP → Netpeak Spider может распаковать архив и открыть содержимое.


Исходный код


Чтобы найти нужные данные из любой вкладки, воспользуйтесь полем быстрого поиска или комбинацией Ctrl+E

Для удаления всех результатов анализа нажмите кнопку «Очистить».

Очистить результаты анализа

3. Экспорт результатов 

Полученные результаты анализа можно выгрузить двумя способами:

  • С помощью кнопки «Экспорт» → выгружает содержимое колонок «Название» и «Значение» в левой части окна.
  • С помощью кнопки «Сохранить исходный код» → выгружает в файл исходный код в том виде, в каком он был получен от сервера. 

Экспорт анализа

Статья помогла?

Отлично!

Спасибо за ваш отзыв

Извините, что не удалось помочь!

Спасибо за ваш отзыв

Расскажите, как мы можем улучшить эту статью!

Выберите хотя бы одну причину
Требуется проверка CAPTCHA.

Комментарий отправлен

Мы ценим вашу помощь и постараемся исправить статью