Очередь: 0 / В работе: 0

Обновления: Новый алгоритм парсинга Wordstat и подсказок Яндекса, поиск неявных дублей, сортировка групп и другое

  1. Добавлены новые функциональные кнопки для каждой группы: сортировка (стрелка вверх и вниз), разгруппировка (иконка корзины). При нажатии разгруппировки, все слова попадают в группу "Запросы без группы", а сама группа удаляется.
  2. Реализован новый инструмент "Выявить неявные дубли". Ищет все вариации одинаковых фраз с перестановкой слов и собирает их в отдельную группу "!!! Найдены дубли !!!". Главный ключ остается в основных группах, а все его дубли помещаются в эту группу. Если у вас собрана частота "[!W]", то среди всех дублей он ищет самый высокочастотный и оставляет его, а все его аналоги с более низкой частотой отправляет в группу "найдены дубли".
  3. Добавлены стрелки < и > к постраничной навигации по ядру.
  4. Улучшил парсинг Wordstat. Это обновление ставит парсинг на новый уровень и открывает колоссальные возможности профессиональным пользователям.

    Теперь сервис будет учитывать и применять операторы родительских фраз для всех собранных фраз, которые вы зададите для парсинга. В данном случае учитываться будут: оператор +, окончания (оператор !) и порядок слов (квадратные скобочки []).

    -- Пример парсинга запроса: !шкаф !купе --
    КАК БЫЛО: Собрано 2 000 слов с окончанием шкаф купе, а потом пошел вглубь и напарсил другие окончания (угловые шкафы купе, магазин шкафов купе и т.д.).
    СТАЛО: Собрал строгое соответствие ВСЕХ фраз ТОЛЬКО с требуемым окончанием (угловой шкаф купе, шкаф купе в прихожую и т.д.).

    -- Пример парсинга запроса: [билеты из сочи в москву] --
    КАК БЫЛО: Собрано 2 000 слов "билеты москва сочи", дальше вглубь куча всего (москва сочи жд билеты цена, билеты москва сочи, сколько стоит билет москва сочи и т.д.). Согласитесь, это совсем не то, что мы хотели спарсить.
    СТАЛО: Собрано строгое соответствие ВСЕХ фраз по вашим условиям, порядку слов (билет из сочи в москву на самолет, жд билеты из сочи в москву и т.д.)

    Также эти операторы можно комбинировать, типа [!билет из сочи в москву]. Фиксируем окончание и порядок слов.

    -- Еще пример --
    Парсим теже шкафы купе, регион москва и область. Если мы парсим запрос как есть: шкафы купе, то получаем всего 18638 слов. А если мы используем хитрую комбинацию (2 фразы и уточним окончания): !шкаф !купе и !шкафы !купе, то получаем уже 22 349 фраз.
  5. Новый парсинг поисковых подсказок. Очень многие меня просили проработать данный инструмент. Я полностью переработал алгоритм парсинга подсказок. Теперь будет гораздо меньше мусора и больше качественных фраз.

    Алгоритм теперь такой: фраза + [а-я] (русский алфавит), фраза + [a-z] (анг. алфавит), фраза + [0-9] (цифры).  Т.е. одна фраза множится на 65 вариаций и парсится.

    Также сняты ограничения с количества собираемых фраз с подсказок. Т.е. больше нет потолка в "1000", "3000" и "5000" подсказок. Собирает максимум, все, что есть. Единственное ограничение - лимит запросов в ядре.

    НО из-за сложного технического решения и некоторой утечки памяти (работаю над этим), сейчас максимум за раз можно обработать только 10 фраз. 
19.08.2020
Всего комментариев: 0