Skip to main content

Documentation Index

Fetch the complete documentation index at: https://www.doc-reviewer.site/llms.txt

Use this file to discover all available pages before exploring further.

Вместо загрузки файла вы можете указать Doc Reviewer URL страницы. Приложение загружает её через headless-браузер Chromium, извлекает разделы с инструкциями из HTML и обрабатывает результат как обычный документ, готовый к оценке. До запуска оценки вы можете добавить несколько страниц в один документ.
Для оценки веб-страниц нужен Chromium, который не входит в комплект .exe. Установите его один раз на каждом компьютере, где вы хотите использовать эту функцию — независимо от того, запускаете ли вы .exe или исходный код. Откройте терминал и выполните:
py -3.11 -m playwright install chromium

Загрузка веб-страницы

1

Откройте страницу Оценка

Нажмите Оценка в боковом меню или перейдите в любой проект и нажмите Оценить по URL.
2

Выберите вкладку «По URL»

В верхней части страницы Оценка нажмите вкладку По URL, чтобы переключиться с загрузки файла в режим URL.
3

Вставьте URL и нажмите «Загрузить»

Вставьте полный URL страницы (должен начинаться с http:// или https://) и нажмите Загрузить. Doc Reviewer запустит Chromium в headless-режиме и загрузит страницу.
4

Дождитесь загрузки страницы

Chromium полностью отрисовывает страницу до начала извлечения контента, поэтому страницы с JavaScript и одностраничные приложения (SPA) загружаются корректно. Загрузка обычно занимает несколько секунд. В процессе отображается индикатор загрузки.
5

Добавьте дополнительные страницы (необязательно)

После успешной загрузки первой страницы в заголовке документа появляется кнопка + Добавить страницу. Нажмите её, вставьте другой URL и нажмите Загрузить, чтобы добавить инструкции этой страницы в тот же документ. Повторите для каждой дополнительной страницы.
6

Перейдите к оценке

После загрузки всех страниц в дереве документа слева отображаются все извлечённые разделы с инструкциями. Просмотрите разделы, скорректируйте классификации при необходимости и нажмите Оценить, чтобы запустить оценку LLM.
Все добавленные страницы становятся частью одного документа. Каждый блок с инструкцией, извлечённый с каждой страницы, отображается как отдельный раздел в дереве документа и оценивается по отдельности.

Как работает веб-парсер

Doc Reviewer использует две стратегии разбора в зависимости от источника:
Если страница содержит пользовательские теги <instruction>, <action> или <task> — структура, используемая в веб-справке Positive Technologies — Doc Reviewer применяет специализированный парсер, который:
  • Обрабатывает каждый блок <instruction> как отдельный раздел документа
  • Корректно нумерует шаги внутри тегов <action>
  • Убирает артефакты вёрстки, например символы мягкого переноса (&shy;)
Этот парсер обеспечивает наилучшее качество извлечения и является основным сценарием использования для веб-оценки.
Поскольку Chromium отрисовывает JavaScript до извлечения контента, приложение поддерживает страницы с JS и SPA. Статические HTML-страницы загружаются быстрее, но оба типа работают корректно.