Book description
Eine leistungsfähige Volltextsuche ist heute auf Websites, in Online-Shops oder auch im Unternehmen nicht mehr Kür, sondern Pflicht. Gefragt ist eine flexible Suchtechnologie, die auf unterschiedlichsten Systemen genutzt werden kann. Hier kommt Apache Solr 4 ins Spiel: Dieser Open Source-Suchserver bietet Entwicklern auf Basis von Standard-Webtechnologien eine mächtige und dabei einfach zu integrierende und zu benutzende Search Engine. Einführung in Apache Solr bietet Ihnen einen fundierten Einstieg in diese Suchtechnologie: Das Buch vermittelt Ihnen das nötige Handwerkszeug, um eine individuelle Suchlösung auf Basis von Apache Solr aufzusetzen. Beschrieben wird, aus welchen Komponenten Solr sich zusammensetzt, wie die Indexierung manipuliert werden kann und welche Möglichkeiten Solr für die Suche bietet. Schnelleinstieg: Erstellen Sie nach der Solr-Installation einen Index und setzen Sie Ihre erste Suche ab. Index-Konfiguration: Erfahren Sie, welche Möglichkeiten der Analyse-Prozess bietet, um die Inhalte von Dokumenten suchoptimiert im Index abzulegen. Solr-Features out-of-the-box: Nutzen Sie Funktionalitäten wie Facetten, AutoSuggest oder Meinten Sie für Ihre Suche und sehen Sie am Beispiel der Browse-Oberfläche, wie man sie einbinden kann. Scoring und Relevanz: Erfahren Sie, mit welchen Mitteln Sie bei Solr sowohl die Qualität als auch die Quantität der Treffer beeinflussen können. Solr-Architekturen: Lernen Sie die zwei Architekturansätze Master/Slave und SolrCloud kennen und richten Sie sie für Ihr System ein. Deployment und Monitoring: Informieren Sie sich über das Deployment in einem Servlet-Container sowie über das Aufsetzen eines Monitorings.
Table of contents
- Vorwort
- Einleitung
- 1. Schnelleinstieg in Solr
-
2. Die Konzepte von Solr kennenlernen
- Apache Solr innerhalb einer Applikation
- Der Grundaufbau von Solr
- Die Indexierung – Out-of-the-Box-Möglichkeiten
- Die Suche – Wie kann ich suchen?
-
3. Den Index konfigurieren
- Der Lucene-Index
- Die Schema-Konfiguration
-
Der Analyse-Prozess
- Konfiguration des Analyse-Prozesses
- 1. Schritt: CharFilter
- 2. Schritt: Tokenizer
- 3. Schritt: TokenFilter
- Typische Anwendungsfälle der Analyse
- Die sprachspezifische Analyse
- Das Analyse-Interface
- Ein Blick in den Index
-
4. Was kann Solr out-of-the-box?
- Die Konfigurationsdatei solrconfig.xml
-
Such-Features out-of-the-box
- Velocity und der /browse-RequestHandler
- Facetten – Suchergebnisse verfeinern
- AutoSuggest – Suchbegriffe vorschlagen
- Highlighting – Suchbegriffe im Treffer hervorheben
- Result Grouping – ähnliche Dokumente gruppieren
- Meinten Sie ... – Tippfehler ausbessern
- MoreLikeThis – ähnliche Dokumente finden
- Elevate – Top-Treffer definieren
- Terms-Komponente – Solr-Felder auslesen
- TermVector-Komponente – Term-Informationen auswerten
- Stats-Komponente – statistische Auswertung
- /browse-RequestHandler für die Wikipedia
-
5. Scoring und Relevanz beeinflussen
- Precision versus Recall
- Den Scoring-Mechanismus verstehen
- Scoring-Probleme analysieren
-
Das Scoring beeinflussen
- Query Parser für die Scoring-Manipulation nutzen
- Mit FunctionQueries das Scoring beeinflussen
- Typische Scoring-Anwendungsfälle
-
6. Skalierung der Suche – die Solr-Architektur gestalten
- Master/Slave-Architektur
-
SolrCloud
- Reichen Replication und Sharding nicht aus?
- SolrCloud – Diese Gedanken stecken hinter dieser Innovation
- Who is Who oder: Die Terminologie der SolrCloud
- Zero-Installation – einfach loslegen
- Indexieren und Suchen in der SolrCloud
- Erhöhung der Ausfallsicherheit der Administrationsseite – externes ZooKeeper-Ensemble
- Mehr Infos – clusterstate.json
- SolrCloud-Verwaltung – Collections-API
- Wohin gehen meine Dokumente? – Document Routing
- Verwaltung mehrerer Collections in der SolrCloud
- Pitfalls – Auf was Sie sonst noch achten sollten
-
7. Ein Blick über den Tellerrand
- Mit Solr arbeiten – Client-APIs
- Deployment von Solr in Apache Tomcat
- Monitoring Ihrer Solr-Installation
- Die Community – Wie kann ich zum Projekt beitragen?
- Die Apache Software Foundation
- Die Konkurrenz – Elasticsearch
- A. Glossar
- B. Über die Autoren
- Stichwortverzeichnis
- Kolophon
- Copyright
Product information
- Title: Einführung in Apache Solr
- Author(s):
- Release date: March 2014
- Publisher(s): O'Reilly Verlag
- ISBN: 97833955614218
You might also like
book
Scaling Apache Solr
Optimize your searches using high-performance enterprise search repositories with Apache Solr In Detail This book is …
article
Run Llama-2 Models Locally with llama.cpp
Llama is Meta’s answer to the growing demand for LLMs. Unlike its well-known technological relative, ChatGPT, …
book
OpenShift OKD on IBM LinuxONE, Installation Guide
This document provides the step-by-step instructions for installing OpenShift OKD 3.10 on LinuxONE. The intended audience …
book
Einfach Java
Die Leser werden auf Ihrer Entdeckungsreise vom Java-Experten Michael Inden begleitet. Er erklärt ihnen die Grundlagen …