LJSear.ch - ein Service für diejenigen, die die Dateien „Live Journal“ brauchen
Web Services / / December 24, 2019
Haben Sie in „Lernen“ hundert Jahre alten Rekord finden wollen, aber nicht können, weil die Suchoptionen auf einen Monat begrenzt werden? Sie Service kostenlos LJSear.ch, Die enthält das Archiv der russisch-sprachigen LiveJourna für den Zeitraum 2000-2015. Sprechen Sie über die es seinem Schöpfer Roman Ivanov (kukutz).
Roman Ivanov
Product Manager in der "Yandex". Hat eine Blog-Suche, personalisierte Suche „Yandex“, mehrere Versionen von „Yandex gestartet. Mail "Dienste" Yandex. Lenta "" Ya.ru "" Yandex. Pictures „und einige andere. Es wird nun in „Yandex engagiert. Browser „und LJSear.ch.
Was ist LJSear.ch?
„Lernen“ Das ist mehr als ein Terabyte-Archive. Indexiert und für die Suche verfügbar 340 Millionen Beiträge und Kommentare 1 Milliarde von 2000 bis Herbst 2015. Und das alles mit dem bekannten Suchmaschinen zum Blog: Limit nach Autor, nach Datum, von der Gemeinde.
Neue Einträge werden nicht indiziert, da wir unser Projekt als Archiv, Denkmal betrachten.
Das Projekt ist ohne Gewinnerzielungs, keine Werbung und andere Möglichkeiten, um Geld zu machen, ist nicht vorgesehen.
Warum benötige ich Service?
Im Herbst 2015 Suchfunktion für Blogs „Yandex“ wurden erst im letzten Monat begrenzt. Die Erklärung war einfach: die überwiegende Mehrheit der Menschen suchen InformationenIm Zusammenhang mit dem letzten Aufzeichnungen, und tiefere Suche nach ihnen ist überflüssig.
Es stimmt. Im vergangenen Monat ist genug für Aufgaben wie die regelmäßige Überwachung oder eine Eitelkeit Suche Bewertungen einiger jüngsten Ereignisse. Aber es gibt ein Problem, und tiefe Forschung.
Ich glaube, dass in dem „Lernen“ passiert ist, oder zumindest fast all russisch-sprachigen Kultur von null Jahren wider. Der Wert dieses Archiv kann nicht hoch genug eingeschätzt werden. Wenn die „Yandex“ geschlossene Archivsuche hat, bin ich sehr enttäuscht, weil davon überzeugt, dass diese Sammlung von Informationen für die Menschheit erhalten werden müssen. Nun, und ich fragte: „Yandex“ Archive, und er plötzlich stimmte zu und gab ihnen.
Archiv Blog ziemlich einzigartig, weil so viel nicht in dem „Learn“ heruntergeladen werden. Viele Zeitschriften werden von ihren Autoren entfernt, sind einige gebrochen und zerstört von Hackern, in einigen Fällen Aufzeichnungen nicht gelöscht, sondern hinter Schloss und Riegel versteckt.
Die letzten sechs Monate war ich verantwortlich dafür, dass die Daten nicht verloren gehen. Ich rief die Hilfe von Freunden, und unter ihnen gab es diejenigen, die Hilfe vereinbart verstehen, ob wir die Informationen für die Suche machen. Wir haben einen Service LJSear.ch erstellt und offenbar treiben ihn zu einem gesunden Zustand.
Die Freiwilligen waren viele?
Gefunden. Ein ausgewiesener Experte auf dem Gebiet der UX Kohl Zayarny Ich kam mit dem Design nach oben. Sasha Belyanskiy Ich nahm den BEM-vorstku und Frontend auf Node.js. Spaceinvaderz Eingriff systemische Verabreichung. Backend-Programmierung in PHP Ich begann auf der Grundlage des Prototyps selbst, die meinen Freund gemacht tobe.
Das größte Problem war das Eisen: wer zahlt für das Hosting? Freunde sicher sein, dass Sie Geld für kraudfandingovyh Websites sammeln können, aber ich war skeptisch. Und es sind wunderbare Menschen zu uns kamen aus Servers.ru und Hilfe angeboten. Als Ergebnis haben wir einen großen dedizierten Server mit SSD zu indizieren und durchsuchen Backend und Cloud virtuelle Server an das Frontend.
Wer kann an dem Projekt interessiert sein?
Als neuer Datensätze nicht indiziert ist, das Publikum, die ich rechne - sind Forscher. Wie buchstäblich Forscher Kulturschichten von null Jahren und einem aktuellen oder ehemaligen Benutzer „Lernen“, die etwas finden wollen, die in diesen Jahren geschrieben wurde. Und weil ich nicht die maximale Ausführungszeit Suchbegriffe beschränken habe: Ermittler können für komplexe Abfragen und eine Minute warten, und zwei. Natürlich sind einfache Abfragen schnell ausgeführt wird, und wenn der Dienst erkennt, dass die Abfrage ist jetzt eine Menge, enthält es einen kontrollierten Abbau, einschließlich Grenzen Timeout Anfrage.
LJSear.ch →