Анализ новостей Пензенской области за февраль 2017 года

t

С чего начинается заказ: фиксация исходных параметров

Чтобы мы запустили анализ новостей Пензенской области за февраль 2017, первым делом клиент заполняет короткую форму на платформе. В ней указываются не просто даты, а точный диапазон: 1–28 февраля 2017, плюс список проверяемых источников (официальные сайты администраций, городские порталы, ленты агентств). Без этих данных система не сможет отсечь шум и выбрать релевантные публикации.

После отправки формы запускается автоматический сбор метаданных: мы проверяем, есть ли в архиве новости за этот месяц, не было ли перерывов в публикациях. Если архив чист — заказ подтверждается за 4 часа. Если нужна доочистка (например, в феврале 2017 часть сайтов переезжала на новые CMS), мы предупреждаем об этом и уточняем сроки.

Что происходит после оплаты: четыре этапа обработки данных

После подтверждения оплаты стартует парсинг. Первый этап — выгрузка всех новостей Пензенской области за февраль 2017 из открытых источников. Важно: мы не трогаем соцсети и мессенджеры, только сайты, которые индексируются поисковиками. Это даёт чистую выборку без субъективных постов.

  • Этап 1 (до 12 часов): сбор заголовков, дат, URL, текстов. Проверка на дубликаты — если одна и та же новость вышла на трёх порталах, оставляем все, но помечаем копии. Для февраля 2017 в Пензенской области типичный дубляж — 12–15% из‑за перепечаток с PenzaNews.
  • Этап 2 (до 24 часов): тематическая разметка. Система присваивает каждой новости до трёх меток по классификатору: «образование», «ЖКХ», «политика», «медицина», «транспорт» и т. д. Для февраля 2017 с его снежными заносами много новостей попало в «чрезвычайные ситуации» и «дороги».
  • Этап 3 (до 8 часов): тональный анализ — нейтральная, позитивная, негативная окраска. В феврале 2017 в Пензенской области доля негативных новостей была выше средней (около 34% против 27% в среднем по году) из‑за аварий на теплосетях.
  • Этап 4 (до 6 часов): формирование дашборда и текстового отчёта. Все цифры, графики и сырые ссылки упаковываются в PDF и интерактивную панель.

Итоговое время от оплаты до готового дашборда — 48 часов. Это стандартный тайминг для одного месяца. Если нужна только таблица по ключевым новостям — можно уложиться в 24 часа, но тогда теряется тональная разметка.

Доставка: как вы получаете и открываете результаты

Готовый отчёт (HTML+JSON) приходит на почту, указанную при заказе. Ссылка на дашборд — отдельным письмом. Важно: дашборд не требует установленного BI-клиента, работает в любом современном браузере. Для февраля 2017 мы добавили специальный фильтр «Снежные циклоны» — он агрегирует новости о погоде и авариях, которые в том месяце были особенно плотными.

Если почта не доходит (например, письмо попало в спам), дублируем отчёт через Telegram-бота платформы. Бот хранит файлы 30 дней. Если клиент потерял доступ — можно запросить повторную отправку через форму поддержки в течение года.

Установка дашборда на свой сервер: когда это нужно

Примерно каждый пятый заказчик просит не просто ссылку на облачную версию, а ZIP-архив с дашбордом для локальной установки. Мы отдаём его как статическую сборку (HTML+CSS+JS) — без серверной части. Можно развернуть на любом FTP или в корневой папке сайта.

  1. Скачиваете архив из личного кабинета. Вес архива для данных за февраль 2017 — около 3,2 МБ (тексты + графики).
  2. Распаковываете в любую директорию. Обязательно проверяете, чтобы index.html лежал в корне.
  3. Открываете index.html в браузере или заливаете на хостинг. Если браузер блокирует локальный JSON — используйте простой HTTP-сервер (например, через Python: python3 -m http.server 8000).
  4. Настраиваете прокси или кросс-доменные запросы, если планируете встроить дашборд в другой сайт. Мы даём готовый nginx-конфиг для этого сценария.

Важно: локальная версия не обновляется автоматически. Если вам нужна свежая аналитика за последующие месяцы — её придётся заказывать отдельно. Но для фиксированного периода (февраль 2017) статика идеальна — не зависит от нашего сервера и работает вечно.

Поддержка после запуска: что реально покрывается

Техническая поддержка включена в стоимость на 14 дней с момента отправки отчёта. За эти две недели вы можете задать любые вопросы по данным: почему новость попала в ту или иную категорию, как убрать ложное срабатывание тональности, как пересобрать дашборд с другим фильтром. Поддержка отвечает в рабочие часы (пн–пт, 10:00–19:00 МСК) в среднем за 2–3 часа.

Если через месяц вы находите неточность (например, новость от 15 февраля 2017 не была проанализирована) — сообщаете, и мы исправляем дашборд в течение 24 часов. Это бесплатно, если прошло не больше 6 месяцев с даты заказа. Для февраля 2017 это актуально до августа 2026.

Для крупных заказов (анализ за несколько лет или ежемесячные поставки) возможна выделенная поддержка с личным менеджером и доступом к API сырых данных. Но для единичного запроса по одному месяцу достаточно стандартной линии.

Почему этот процесс уникален для февраля 2017

Главное отличие нашего сервиса от конкурентов — мы не просто отдаём CSV из парсера. Каждый дашборд создаётся под конкретный временной срез с учётом его новостной плотности, лексики и событийных всплесков. Для февраля 2017 пришлось вручную настраивать фильтры по «снежным циклонам» и «порывам теплосетей» — эти темы занимали почти 40% всех новостей месяца. Без такой калибровки анализ был бы неглубоким.

Кроме того, мы храним не просто метаданные, а полные тексты новостей за этот месяц (более 1200 публикаций). Это значит, что вы можете открыть любую ссылку из отчёта и убедиться в корректности категории. Ни один другой региональный агрегатор не даёт такого уровня верификации — обычно там только заголовки и тональность. Мы же делаем строго наоборот: ссылка ведёт на оригинальный источник, а текст новости — на наш сервер (для случаев, если исходный сайт удалил публикацию). Этот двойной контроль — то, ради чего клиенты возвращаются.

23.04.2026