„Yandex“ hat, um genauer reagieren auf komplexe Abfragen gelernt
Nachrichten Web Services / / December 19, 2019
Der neue Algorithmus „Yandex“ wandelt die Suchanfrage und mehrere Stellen auf den semantischen Einheiten oder sogenannte semantische Vektoren. Sobald ein Benutzer eine Abfrage eingibt, vergleicht die Suchmaschine, die Vektoren mit dem Titel und den Inhalt von potenziell geeigneten Standorten. Zurück Algorithmus „Palekh“ könnte die semantischen Vektoren der Anforderung und Header nur vergleichen, und „Koroljow“ scannt Webseiten vollständig.
„Yandex“, erklärt den Algorithmus „Koroljow“ als Beispiel für „Krieg und Frieden“. Vorherige Version kann nur suchen ein Buch nach Titel oder Stichwort mit dem Inhalt verknüpft zu finden: die Namen der Charaktere, Kapitelüberschriften, und so weiter. Ein neuer Algorithmus liest sich wie ein Roman und versteht die Bedeutung der Erzählung.
Laut den Entwicklern, dass der Hauptvorteil der Bedeutung von Abfragen zu verstehen wird die Suche Sprache menschlicher. Der Benutzer kann für einen Film nicht namentlich suchen, aber nur kurz die Handlung beschreiben. Zum Beispiel: „ein Film über den Raum, in dem der Held spricht mit ihrer Tochter durch die Uhr.“ Der Algorithmus erkennt, dass es ein Film „Interstellar“ ist, wo der Held Matthew McConaughey ist war im Raum und verwendet, um die Uhr mit ihrer Tochter zu kommunizieren. Und dieser Film wird in den Suchergebnissen angezeigt werden.
Für die Suche nach Verständnis, wie die Bedeutung der Abfrage an den Inhalt einer Web-Seite betrifft, benötigen Sie ein groß angelegtes neuronalen Netzwerk zu verwenden. Für ihre Ausbildung werden Milliarden von Beispielen müssen, warum „Yandex“ Benutzer ihre Trainingsalgorithmen zu verwenden.
Wenn eine Person aus den Suchergebnissen auf die Website und blieb es, höchstwahrscheinlich bewegt wird, arbeitet der Algorithmus richtig. Das neuronale Netz wird auf ein schlechtes Beispiel trainiert: wenn die Site sofort heruntergefahren wird oder nur knapp verfehlt, wird das System erinnern. So dass in der Zukunft sollte die Suche arbeitet besser und besser.