Как сортируются результаты поиска кратко

Обновлено: 04.07.2024

Есть ли способ отсортировать результаты поиска Google по дате?

(Я знаю, как ограничить поиск определенным периодом времени.)

Нет, вы не можете изменить порядок сортировки результатов поиска Google. Порядок сортировки определяется секретным рецептом Google.

Все, что вы можете сделать, это фильтр поиска для определенных периодов времени.

Rubén и infrcl имеют хорошие ответы.

Вот один из способов сортировки по дате, используя Параметры запроса поиска .

Предположим, что вы хотите, чтобы последние два года сортировались по дате.

sbd . Я считаю, что это булевский тип сортировки по дате.

Google Search не включает способ сортировки результатов поиска без фильтрации.

Встроенные фильтры Google Search

Отфильтровать результаты фильтра любого времени. Это отобразит несколько выпадающих меню. Один из них, если для параметров сортировки, включая сортировку по дате. (см. [4])

Пользовательский поиск Google

Альтернативой может быть создание собственной поисковой системы с помощью Google Custom Search, поскольку она позволяет выполнять поиск по всему веб-сайту и включать сортировку результатов.

Также я заметил, что результаты поиска могут быть очень несовместимыми для временного диапазона, если он определен по-другому, используя &tbs=qdr:m1 вместо &tbs=qdr:d30 .

Задание сортировки в запросе

При использовании объектной модели запросов можно выбрать условия сортировки путем указания спецификации сортировки с помощью свойства SortList класса KeywordQuery. Свойство SortList является типом SortCollection, который представляет коллекцию объектов Sort.

Объект Sort определяет способ сортировки результатов поиска. Он состоит из значения, по которому нужно упорядочить результаты поиска (Property), и направления упорядочивания результатов (Direction). Направление относится к типу SortDirection() и может быть возрастающим или убывающим.

При наличии нескольких значений в свойстве SortList сортировка выполняется на основе последовательности появления значений. Это означает, что каждый объект Sort представляет уровень порядка сортировки. Любой последующий уровень не изменяет порядок результатов, отличный от предыдущего уровня, но может влиять на внутренний порядок результатов с одинаковыми значениями сортировки для предыдущих уровней.

Сортировка результатов поиска по рангу

По умолчанию результаты поиска сортируются по степени релевантности. Это означает, что SharePoint помещает наиболее релевантные результаты в начале набора результатов поиска. При сортировке по рангу результаты всегда выводятся в порядке убывания релевантности. Однако порядок сортировки можно изменить на возрастающий с помощью SortDirection().

Также можно влиять на вычисление ранга в строке запроса одним из двух способов:

С помощью оператора XRANK, доступные в Справочник по синтаксису языка запросов по ключевым словам (KQL) и справочник по синтаксису языка запросов FAST (FQL). Применение условного ранга повышение с учетом Если условия запроса можно использовать XRANK.

Выбрав вес релевантности для динамического ранжирования. При использовании FQL можно указать отдельный вес релевантности для каждого оператора STRING.

Сортировка результатов поиска по значению управляемого свойства

Можно указать сортировку результатов поиска на основе значения одного или нескольких управляемых свойств. Это означает, что SharePoint выполняет сортировку на основе всех результатов, соответствующих запросу.

Можно выполнять сортировку на основе текстовых и числовых свойств. Для текстовых свойств порядок сортировки основан на стандартной сортировке текстовой строки. С другой стороны, для числовых свойств (включая управляемые свойства типа DateTime) сортировка основана на числовом значении.

Пример

Следующем примере показано, как для сортировки результатов поиска с помощью Size управляемого свойства.

Кроме того, можно использовать REST API службы поиска для сортировки результатов поиска с использованием свойства Size с помощью указанного ниже вызова.

Сортировка результатов поиска по формуле

Можно задать сортировку результатов поиска на основе спецификации, в которой значения для сортировки создаются с помощью математической формулы.

Сортировка по формуле компонента это расширение одноуровневая и многоуровневой сортировка функциональные возможности для результатов поиска. Позволяет задать формулу управляемого свойства в качестве критерия сортировки.

При сортировке по формуле можно применять математические операции к значению одного или нескольких управляемых свойств для каждого элемента в результатах запроса.

Ниже приведены примеры, которые можно реализовать с помощью формулы задание сортировки результатов поиска.

Алгоритм K ближайших соседей для классификации документов.

Евклидово или манхэттенское расстояние для расчета географических расстояний.

Предпочитаемое значение. Например, для сортировки документов на основании того, насколько сильно отличается значение данного управляемого свойства от предпочитаемого значения.

Сортировка по формуле компонента не включает контроля статистических динамических параметров ранга, таких как частота употребления или степень сходства.

Формула вычисляется слева направо, в ней используется стандартная очередность математических операторов: сначала вычисляются функции и выражения в скобках, затем операции умножения и деления, и наконец операции сложения и вычитания.

Конечный результат формулы должен быть в диапазоне от 32-разрядное целое число со знаком. В противном случае порядок сортировки неверно.

Настройка формулы сортировки в запросе

В спецификации сортировки запроса указывается формула сортировки вместо управляемого свойства.

Спецификация сортировки имеет следующий формат: [formula: ]

В этом формате это выражение формулы сортировки.

Квадратные скобки являются частью синтаксиса спецификации сортировки.

Направление сортировки по умолчанию по убыванию. Можно также использовать формулу, которая сортирует в порядке возрастания значения, например, если формула указывает географических расстояний.

В следующем примере кода показано, как задать сортировки по формуле в порядке возрастания с помощью объектной модели запросов.

Кроме того можно использовать для сортировки результатов поиска с помощью свойства Size с при следующем вызове Search REST API.

Использование управляемых свойств в формуле сортировки

Можно применять формулу сортировки для значений управляемых свойств типа Integer, Decimal, и Datetime(). Необходимо включить сортировку для указанного управляемого свойства в схеме поиска.

Для дополнительных управляемых свойств типа Decimal перед использованием в вычислении формулы значение умножается на 10^(количество десятичных знаков).

Перед использованием в вычислении формулы значения управляемых свойств типа Datetime()](/previous-versions/office/developer/sharepoint-2010/ms500214(v%3Doffice.14)) преобразуются в число сотен наносекунд с 1 января 29000 до н. э. Количество дней в году: 366.

Выражения формулы сортировки

В таблице 1 перечислены функции, которые можно использовать в выражение формулы сортировки. Выражение не должно содержать пробелов.

Таблица 1. Функции для выражений формул сортировки

Характеристики производительности для сортировки по формуле

Использование формулы подразумевает, что вычисления формулы применяются ко всем соответствующим элементам в наборе результатов. Это значит, что производительность запроса зависит от числа соответствующих элементов.

Длинные формулы со многими операторами требуют больше времени на обработку, чем короткие формулы.

Использование сортировки по формуле для географических расстояний

Сортировку по формуле можно использовать для ранжирования на основании расстояний. Для этого требуется включить управляемые свойства, представляющие широту и долготу каждого элемента.

Чтобы постоянно перенаправлять посетителей, попадающих на сайт, и поисковики на адрес, отличный от запрашиваемого, используется метод 301-го редиректа. Когда сервер отвечает таким образом, это говорит о том, что страница перемещена и предыдущий url больше не актуален. Пройдет переиндексация, после которой поисковикам станет понятно, по какому адресу вы собираетесь вести своих посетителей, и они начнут его демонстрировать. Примечательно, что редирект позволяет сделать потерю преимуществом и усилить поток трафика на свою площадку. Но к этому мы еще вернемся, а пока небольшое вступление.

Для работы со ссылочной массой и составления стратегий продвижения важно классифицировать ссылки. Существует несколько основных типов, например вечные и арендованные, естественные и SEO-ссылки, ссылки, которые зависят от донора, и другие. Эта классификация является основой для разработки ссылочной стратегии. Определить тип ссылки просто, об этом и поговорим в статье.

Алгоритм работы поисковых систем при подготовке результата на запрос

получение запроса, сформулированного пользователем;
лингвистический анализ, трактовка морфологии, снятие омонимии, дополнение синонимами, определение тематики запроса;
поиск в индексе страниц с релевантным содержимым, которые подходят под тематику и ключевые слова запроса;
построение порядка выдачи, то есть ранжирование с учетом множества факторов;
передача готового результата поиска пользователю.

Поиск связанной по смыслу информации

Благодаря высокой производительности оборудования, использованию распределенных вычислений эти операции проводятся за доли секунды, после чего формируется поисковый запрос для последующей обработки поисковой системой. Естественно, что он претерпевает значительные изменения для более полного охвата тематики и максимального удовлетворения интереса пользователя.

Язык формулирования запроса к поисковым машинам называется информационно-поисковым. В его составе логические операторы, морфология языка, регистр слов, префиксы обязательности, возможность учета расстояния между словами и расширенного поиска. Подобное представление запроса требуется для более быстрой выборки по обширным базам данных.

Принудительное сужение или расширение круга поиска при формировании запроса

Очевидно, что расширение поиска для пользователя нужно не всегда, и, если он помнит дословно фразу из нужного ему документа, вряд ли ему понравится то, что на первой странице выдачи появится релевантная информация, собранная по синонимам к запросу. Поэтому для поисковых систем существуют общие правила (с некоторыми нюансами для каждой из них) формирования запроса, при помощи которых ей можно указать, какая именно конкретика интересует пользователя.

Так, для сужения или, наоборот, расширения круга поиска в определенной области следует придерживаться таких правил формирования поискового запроса.

Освоив на практике и немного потренировавшись с использованием этих правил формирования поискового запроса, можно быстрее находить нужный материал и избавить себя от просмотра информации, близкой по семантике, но не имеющей важности в конкретном случае.

Принципы ранжирования результатов поиска

После передачи запроса на выполнение поиска по индексу на его основе строится выборка из базы, содержащая ссылки на страницы, которые полностью удовлетворяют всем заданным условиям. Как правило, эта выборка весьма внушительна даже для продуманно составленных поисковых фраз и может содержать сотни и тысячи страниц. Выдать ее в таком необработанном виде пользователю – значит обречь его на сложный ручной поиск и анализ наиболее подходящего результата. Поэтому после формирования выдача ранжируется по достаточно сложной технологии.

Ранжирование, или сортировка ссылок на страницы в Интернете, в порядке убывания их полезности для пользователя – это достаточно сложный и постоянно совершенствующийся процесс. Его главная задача – дать потребителю максимально полезную информацию, которая полностью ответит на его запрос.

Современные алгоритмы ранжирования способны учитывать тысячи различных параметров, начиная от статистических характеристик текста и заканчивая поведенческими факторами на сайте и его смысловым наполнением.

Весь процесс сортировки страниц по соответствию поисковой фразе делится на два этапа:

Отбираются наиболее релевантные страницы сайта, информация с которого должна попасть в выдачу.
Выбранные страницы еще раз сортируются по релевантности запросу.

Такой подход обеспечивает попадание в конечную выдачу обычно не более одной страницы с веб-ресурса, что облегчает для пользователя задачу выбора наиболее интересного сайта из нескольких. В противном случае страницы с одного тематического ресурса могли бы заполнить всю выдачу. Однако в некоторых ситуациях пользователь может заметить в выдаче несколько страниц с одного сайта.

Конечное численное значение релевантности, которое используется в сортировке, определяется по сложным формулам и алгоритмам, которые в большей части известны только компании – владельцу поисковой системы. Также на ранжирование влияет и региональная принадлежность ресурса, что особенно актуально для коммерческих запросов.

После завершения предварительной сортировки отобранные страницы проходят еще через ряд более строгих фильтров, среди которых есть и система санкций, понижающих значимость страницы в выдаче. Санкции, или пессимизация, могут применяться как к ресурсам целиком, так и к отдельным страницам за нарушение правил публикации контента, плагиат, использование технологий накрутки и ряд других факторов.

После завершения всех этапов алгоритма определения релевантности найденные страницы сортируются от более релевантных к менее релевантным и отправляются пользователю на экран в виде выдачи поисковой системы.

Факторы ранжирования

Стоит отметить, что поисковые системы не раскрывают до конца все критерии ранжирования сайта и технологии определения релевантности. Даются лишь общие рекомендации, главная суть которых – улучшение качества контента, его содержательности и полезности для конечного пользователя. К числу основных факторов относятся следующие:

внутренние – текст, его оформление, графические элементы, перелинковка внутри сайта;
внешние – ссылки на страницы сайта с других ресурсов, активность в социальных сетях (лайки, ретвиты, репосты и др.);
поведенческие – показатель отказов, время пребывания на сайте, глубина просмотра и т. д.

По умолчанию набор результатов будет отсортирован по релевантности. Чем выше релевантность, тем выше рейтинг. В Elasticsearch оценка корреляции будет использовать поле _score для получения значения с плавающей запятой, поэтому по умолчанию набор результатов сортируется в обратном порядке _score.
Однако иногда возвращаемое значение _score не имеет смысла, например:

Оператор фильтра не имеет ничего общего с _score, но неявное условие запроса match_all устанавливает определенное значение для _score всех документов, что эквивалентно одному и тому же показателю релевантности для каждого документа.

Сортировка значений полей

В следующем примере набор результатов сортируется по времени, что также является наиболее распространенным сценарием. Чтобы поместить самый последний документ первым, мы используем параметр sort для сортировки.

Вы найдете эти два отличия здесь:

1. Поле _score не рассчитывается, поскольку оно не используется для сортировки.
Во-вторых, поле zcsj преобразуется в миллисекунды в качестве основы для сортировки.
Сначала к каждому результату добавляется поле сортировки, а содержащиеся в нем значения используются для сортировки. В этом примере поле zcsj внутренне преобразуется в миллисекунды, то есть длинное целое число 1487088000000 эквивалентно строке даты
2017-02-14T16:00:00.000Z。
Во-вторых, _score и max_score равны нулю. Вычисление _score очень ресурсоемко и обычно используется в основном для сортировки - нам это не нужно, когда мы используем корреляцию для сортировки. Рассчитайте его корреляцию. Если вы хотите принудительно рассчитать его корреляцию, вы можете установить для track_scores значение true, как показано ниже.

Сортировка по умолчанию

В качестве сокращения нам нужно только указать отсортированные имена полей:

Значения полей сортируются по возрастанию по умолчанию, а _score сортируется по убыванию по умолчанию.

Многоуровневая сортировка

Если мы хотим объединить запрос и отобразить все соответствующие наборы результатов, первый порядок - zcsj, а второй - _score.

Результирующий набор будет сначала отсортирован по первому полю сортировки. Если значения, использованные для сортировки первого поля, совпадают, то сортируется второе поле сортировки и т. Д.
Но _score не является обязательным полем для многоуровневой сортировки, мы можем использовать несколько различных полей.

Сортировать многозначные поля

При сортировке многозначного поля фиксированное упорядочение этих значений фактически отсутствует, поле с несколькими значениями является коллекцией.
Для чисел и дат мы можем использовать одно из нескольких значений для сортировки, мы можем использовать режимы min, max, avg, sum и другие, например, мы можем в поле likenum Выберите самый старый номер для сортировки.

Сортировка многозначных полей

Измененное многозначное отображение полей выглядит следующим образом:

Поле твита используется для анализируемого индекса полного текста без изменений
Индекс подполя tweet.raw is not_analyzer

Теперь, после изменения данных для перестройки индекса, мы можем использовать твит для выполнения полнотекстового поиска или использовать tweet.raw для сортировки.

Подсказка: принудительная сортировка анализируемых полей занимает много памяти.

Читайте также: