Information-Retrieval Beschreibung Information-Retrieval  
 
   
Beschreibung von Information-Retrieval Infos zu Information-Retrieval und Beschreibung.
Nicht angemeldet: Anmelden | Impressum 
Navigation
· Hauptseite
· Know Forum - neu!
· Zufälliger Artikel
· Spezialseiten
· Alle Artikel
· Eingeordnet unter
Aktueller Artikel
· Seite bearbeiten
· Links auf diese Seite
· Verlinkte Seiten
· Versionen


 
 



Letzte Beiträge
Die Klimalüge CO2Guten Abend Herr Enger
"Meine Fr...
Volumenausdehnung be...Hallo da draußen, ich h
abe folgendes ...
Osterrätsel der Fran...Hallo, ich hab' mich leide
r mit meinere ...
was ist denn mit dem...Hallo, der Song heißt Cal
istan "...
Strichcode entschlüs...Hallo benni, ich stehe
gerade vor dem...
Lust auf Focus Rätse...Hallo, an alle Spezialist
en dieses Räts...
ErdölServus, Erdöl hat keine
Formel, da es...
Frage an die Student...Hallo, im Prinzip ist das
eine gute Ide...
CO2 chemische Trennu...Hallo ....... CO2 in der
Luft wird begr...
IGBT ansteuerschaltu...Guten Tag, Wer weiss lief
ert eine funk...


Information-Retrieval

Dieser Text beschreibt Information-Retrieval.


Der untere Text beinhaltet die Information-Retrieval Beschreibung. Soweit es sich um ein definierbares Objekt handelt, sollte hier eine Information-Retrieval Definition vorhanden sein. Sollte eine Definition von Information-Retrieval fehlen, kann diese von Ihnen verfaßt werden. Wir sind bestrebt die Beschreibung von Information-Retrieval möglichst ausführlich zu halten.

Jeder Text bei Know-Library, sowie ein Teil davon (Definition, Beschreibung etc.), außer Bücher Beschreibungen kann bearbeitet werden. Falls die Beschreibung auf dieser Seite nicht korrekt ist klicken Sie auf 'Beschreibung editieren' um den Text zu korrigieren bzw. neuen einzufügen. Weitere Informationen und Bücher zum Thema Information-Retrieval Beschreibung , so wie Link zum Forum finden Sie weiter unten. Eine Übersicht der Texte, die das Thema Information-Retrieval beschreiben finden Sie auf der Seite alle Artikel über Information-Retrieval. Fragen zu dem Thema Information-Retrieval können im Forum gestellt werden. Klicken Sie hier um zu dem Forum zu wechseln.

Information-Retrieval Artikel

Information-Retrieval (IR) (Informationswiedergewinnung, gelegentlich Informationsbeschaffung) ist ein Fachgebiet, das sich mit computergestützten inhaltsorientierten Suche beschäftigt. Es ist ein Teilgebiet der Dokumentationswissenschaft .

Wie der Begriff retrieval (deutsch Wiedergewinnung, Auffindung) sagt, sind Informationen in großen Datenbeständen zunächst verloren und müssen wiedergewonnen bzw. wiedergefunden werden. Zwei Konzepte prägen das IR und grenzen es von der Suche in herkömmlichen Datenbanken ab:

  1. Vagheit: Der Benutzer kann sein "diffuses" Informationsbedürfnis nicht präzise und formal (wie z.B. in SQL in relationalen Datenbanken) ausdrücken. Die Anfrage enthält daher vage Bedingungen.
  2. Unsicherheit: Dem System fehlen Kenntnisse über den Inhalt der Dokumente (die Texte, Bilder, Video etc. enthalten können). Dies führt zu fehlerhaften und fehlenden Antworten. Probleme bei Texten bereiten z.B. Homonyme (Worte, die gleich geschrieben werden; z.B. Bank - Geldinstitut, Sitzgelegenheit) und Synonyme (Bank und Geldinstitut).
Information-Retrieval Beschreibung
Information-Retrieval Beschreibung
Schematisches Modell des Information Retrieval

Generell sind am IR zwei (sich unter Umständen überschneidende) Personenkreise involviert (vgl. Abbildung rechts). Der erste Personenkreis sind die Autoren, die Dokumente in einem IR-System zur Verfügung stellen. Dieses kann sowohl aktiv geschehen, indem die Autoren die Dokumente selberins System einstellen, oder auch passiv geschehen, indem das System über Kommunikationsmittel die Dokumente aus anderen verfügbaren Informationssystemen ausliest (wie es z.B. die Internet-Suchmaschinen praktizieren). Dieins System eingestellten Dokumente werden vom IR-System gemäß dem System-internen Modell der Repräsentation von Dokumenten in eine für die Verarbeitung günstige Form (Dokumentenrepräsentation) umgewandelt.

Die zweite Benutzergruppe, die Anwender, haben bestimmte, zu dem Zeitpunkt der Arbeit am IR-System akute Absichte oder Aufgaben, für deren Lösung ihnen Informationen fehlen. Diese Informationsbedarfe beZieligen die Anwender mit Hilfe des Systems zu befriedigen. Dafür müssen sie ihre Informationsbedarfe in einer adäquaten Form als Anfragen formulieren. Die Form, in der die Informationsbedarfe formuliert werden müssen, hängt dabei von dem benutzten Modell der Repräsentation von Dokumenten ab. Wie der Ablauf der Modellierung der Informationsbedarfe als Interaktion mit dem System abläuft (z.B. als einfache Eingabe von Suchbegriffen), wird vom Modell der Interaktion festgelegt. Sind die Anfragen formuliert, dann ist es die Aufgabe des IR-Systems, die Anfragen mit den in dem System eingestellten Dokumenten unter Verwendung der Dokumentenrepräsentationen zu vergleichen und eine Liste der zu den Anfragen passenden Dokumente an die Benutzer zurückzugeben. Der Benutzer steht nun vor der Aufgabe, die gefundenen Dokumente gemäß seiner Aufgabe auf die Lösungsrelevanz hin zu bewerten. Das Resultat ist die Bewertungen zu den Dokumenten. Anschließend haben die Benutzer drei Möglichkeiten: Erstens, sie können (meist ca. in einem engen Rahmen) Modifikationen an den Repräsentationen der Dokumente vornehmen (z.B. indem sie neue Schlüsselwörter für die Indexierung eines Dokuments definieren). Zweitens, die Benutzer verfeinern ihre formulierten Anfragen (zumeist um das Suchergebnis weiter einzuschränken) und drittens, die Benutzer ändern ihre Informationsbedarfe, weil sie nachdem Durchführen der Recherche feststellen, dass sie zur Lösung ihrer Aufgaben weitere, zuvor nicht als relevant eingestufte Informationen benötigen. Der genaue Ablauf der drei Modifikationsformen wird vom Modell der Interaktion bestimmt. Z.B. gibt es Systeme, die den Benutzern bei der Reformulierung der Anfrage unterstützen, indem sie die Anfrage unter Verwendung von, vom Benutzer explizierter (d. h. dem System in irgendeiner Form mitgeteilter) Dokumentenbewertungen, automatisiert reformulieren.

Inhaltsverzeichnis
Buch-Tipp: Geschichte Online Standardhandbuch für Anfänger und Fortgeschrittene Die Autoren haben sich - mit gründlicher Sachkenntnis und intensiven praktischen Erfahrungen in dem Wissenschaftsbereich ausgerüstet - an die Umsetzung des Online-Projekts der Universität Wien in ein Buch gemacht. Die einführenden Kapitel bieten nicht ca. ausführliche Begriffserklärungen sondern...

Formalisierung

Ein Information-Retrieval-System IRS ist eine Spezialisierung eines Informationssystems und kann formal als 7-Tupel beschrieben werden (ohne Berücksichtigung von Relevanz-Feedback):

IRS = (AIR(D), W, Q, AIR(Q), E, ret(.), rank(.)), mit
  1. AIR(D): Dokument-Indexierungsfunktion als Abbildung eines Dokumentes Di auf eine Dokumentrepräsentation xi.
  2. W: Menge aller möglichen Dokumentrepräsentationsmengen.
  3. Q: Menge aller zugelassenen Suchfragen Qj.
  4. AIR(Q): Query-Indexierungsfunktion als Abbildung einer Anfrage Qj auf eine Queryrepräsentation qj.
  5. E: Menge aller möglichen Outputmengen (Potenzmenge der Dokumentmenge) bzw. Outputlisten (beim Ranking).
  6. ret(.): Retrievalfunktion als Abbildung einer indexierten Suchfrage qj auf eine Teilmenge der Dokumentrepräsentationsmenge.
  7. rank(.): Rankingfunktion als Abbildung der ermittelten Dokumentrepräsentationsteilmenge auf eine Liste der Dokumentrepräsentationen.

Methoden des Information-Retrieval werden in Internetsuchmaschinen (z. B. Google), aber auch in Digitalen Bibliotheken (z. B. zur Literatursuche), in Bildsuchmaschinen usw. benutzt. Auch Antwortsysteme oder Spamfilter benutzen IR-Technologien.

Buch-Tipp: Information Retrieval. Informationen suchen und finden Super Grundlagenwerk Für mich stellt dieses Buch das Grundlagenwerk in diesem Bereich dar. Der Autor findet das richtige Maß zwischen theoretischer Fundierung und praktischen Beispielen. Es sind sowohl "klassische" Information-Retrieval-Themen bearbeitet, als auch moderne IR-Themen (Web Information Retrieval). Als Einstiegs- und Nachschlaglektüre...

Modelle zur Repräsentation natürlichsprachlicher Dokumente

Im Bereich "Information Retrieval" sind in den letzten Jahrzehnten verschiedene Modelle entwickelt worden:

  • Probabilistisches Retrieval
    • BIR
    • Uncertain Inference
    • Language Models
Buch-Tipp: Information Retrieval. Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web Kein Buch für Praktiker Im Buch bekommt man einen guten theoretischen Überblick über Suchmodelle und Data-Mining-Verfahren. Das Buch gliedert sich in folgende Teile: klassische IR-Methoden, Wissensgewinnung mit Data-Mining-Methoden, erweiterte Retrieval-Ansätze, IR und das Web. Man sollte gleich sagen, daß das Buch aus einem Vorlesungsskript...

Klassifikation von Modellen zur Repräsentation natürlichsprachlicher Dokumente

Eine zweidimensionale Klassifikation von IR-Modellen zeigt die rechte Abbildung. Folgendes Merkmalen lassen sich bei den verschiedenen Modellen in Abhängigkeit von Ihrer Einordnung in der Matrix beobachten:

Information-Retrieval Beschreibung
Information-Retrieval Beschreibung
Klassifikation von IR-Modellen (Quelle: Dominik Kuropka)
  • Dimension: mathematisches Fundament
    • Mengentheoretische Modelle zeichnen sich dadurch aus, dass sie natürlichsprachliche Dokumente auf Mengen abbilden und die Ähnlichkeitsbestimmung von Dokumenten (in erster Linie) auf die Anwendung von Mengenoperationen zurückführen.
    • Algebraische Modelle stellen Dokumente und Anfragen als Vektoren, Matrizen oder Tupel dar, die zur Berechnung von paarweisen Ähnlichkeiten über eine endliche Anzahl algebraischer Rechenoperationen in ein eindimensionales Ähnlichkeitsmaß überführt werden.
    • Probabilistische Modelle sehen den Prozess der Dokumentensuche bzw. der Bestimmung von Dokumentenähnlichkeiten als ein mehrstufiges Zufallsexperiment an. Zur Abbildung von Dokumentenähnlichkeiten wird daher auf Wahrscheinlichkeiten und probabilistische Theoreme (insbesondere auf den Satz von Bayes) zurückgegriffen.
  • Dimension: Merkmale des Modells
    • Modelle ohne Terminterdependenzen zeichnen sich dadurch aus, dass jeweils zwei verschiedene Terme als vollkommen unterschiedlich und in keinster Weise miteinander verbunden angesehen werden. Dieser Sachverhalt wird in der Literatur häufig auch als Orthogonalität von Termen bzw. als Unabhängigkeit von Termen genannt.
    • Modelle mit immanenten Terminterdependenzen zeichnen sich dadurch aus, dass sie vorhandene Interdependenzen zwischen Termen berücksichtigen und ihnen somit – in dem Unterschied zu den Modellen ohne Terminterdependenzen – nicht die implizite Annahme zu Grunde liegt, dass Terme orthogonal bzw. unabhängig voneinander sind. Die Modelle mit den immanenten Terminterdependenzen grenzen sich von den Modellen mit den transzendenten Terminterdependenzen dadurch ab, dass das Ausmaß einer Interdependenz zwischen zwei Termen aus dem Dokumentenbestand, in einer vom Modell bestimmten Weise, abgeleitet wird – also dem Modell innewohnend (immanent) ist. Die Interdependenz zwischen zwei Termen wird bei dieser Klasse von Modellen direkt oder indirekt aus der Co-Occurrenz der beiden Terme abgeleitet. Unter Co-Occurrenz versteht man dabei das gemeinsame Auftreten zweier Terme in einem Dokument. Dieser Modellklasse liegt somit die Annahme zu Grunde, dass zwei Terme zueinander interdependent sind, wenn sie häufig gemeinsam in Dokumenten vorkommen.
    • Wie bei den Modellen mit immanenten Terminterdependenzen liegt auch den Modellen mit transzendenten Terminterdependenzen keine Annahme über die Orthogonalität oder Unabhängigkeit von Termen zu Grunde. In dem Unterschied zu den Modellen mit immanenten Terminterdependenzen können die Interdependenzen zwischen den Termen bei den Modellen mit transzendenten Terminterdependenzen nicht ausschließlich aus dem Dokumentenbestand und dem Modell abgeleitet werden. Das heißt, dass die den Terminterdependenzen zu Grunde liegende Logik als über das Modell hinausgehend (transzendent) modelliert wird. Das bedeutet, dass in den Modellen mit transzendenten Terminterdependenzen das Vorhandensein von Terminterdependenzen explizit modelliert wird, aber dass die konkrete Ausprägung einer Terminterdependenz zwischen zwei Termen direkt oder indirekt von außerhalb (z. B. von einem Menschen) vorgegeben werden muss.

Information-Retrieval hat Querbezüge zu verschiedenen anderen Gebieten, z. B. Wahrscheinlichkeitstheorie der Computerlinguistik.

Siehe auch: Recall und Precision, Information Extraction, Datenanalyse, Künstliche Intelligenz, Statistik, Data-Mining, Bibliometrie, Informationsmanagement, Wissensmanagement, Web Mining, Text-Mining

Buch-Tipp: Information und Lernen mit Multimedia und Internet Gute Basisliteratur Das Buch gibt einen guten Überblick über das Thema Multimedia. Es werden nicht ca. Grundlagen vermittelt sondern auch die Entwicklung und die Anwendung wie auch die Evaluation näher durchleuchtet. Sehr gut sind auch die Praxisbeispiele. Das Buch fand sogar Einsatz in dem Unterricht an der Universität.

Literatur


Weiteres zu dem Artikel Information-Retrieval

Andere Leser interessierten sich auch für folgende Beschreibungen: Menge, Matrix, Dokumente, Zufallsexperiment, Einordnung, Recall, Interaktion, Datenbanken, Recherche, Teilmenge, Wahrscheinlichkeitstheorie, Bibliotheken, Arbeit, Benutzer, System
Schnellzugrif auf verwandte Texte:
 
NEU! Frage im Forum zum Thema:
 
Wenn die Beschreibung 'Information-Retrieval' Ihrer Meinung nach nicht korrekt ist oder in aktueller Version Fehler enthalten sind oder es fehlt die Information-Retrieval Definition, dann klicken Sie bitte auf "Beschreibung bearbeiten" und schreiben Sie die Eigene Version des Textes. Die Änderungen in der Beschreibung werden sofort aktiv und für alle sichtbar. Ein Administrator wird Ihre Version der Beschreibung und Definition von 'Information-Retrieval' nachher prüfen. Bitte achten Sie auf die Urheberrechte (Copyright). Wir sind für die besseren Beschreibung von 'Information-Retrieval' und 'Information-Retrieval' Definition sehr dankbar.

Alle Tipps zu den Bücher auf dieser Seite wurden automatisch generiert. D.h. die Bücher wurden aus einer Datenbank von dem Computer ausgesucht. Deshalb kann es vorkommen, dass vorgeschlagene Bücher nicht ganz der 'Information-Retrieval' Beschreibung entsprechen.
· Diese Seite wurde bisher 1.076 mal abgerufen.
· Letzte Counteraktualisierung erfolgte am 17.05.2008 um 05:01:19
· Diese Seite wurde zuletzt geändert um 15:34, 25. Sep 2004.
· Letzte Portalaktualisierung erfolgte um 08:00:00 GMT, 25.02.2008
Dieser Artikel basiert auf dem Artikel Information-Retrieval aus der freien Enzyklopädie Wikipedia und steht unter der GNU-Lizenz für freie Inhalte. In der Wikipedia ist eine Autorenauflistung verfügbar.

Von ""

· Diese Seite wurde bisher 1.076 mal abgerufen.
· Letzte Counteraktualisierung erfolgte am 17.05.2008 um 05:01:20
· Diese Seite wurde zuletzt geändert um 15:34, 25. Sep 2004.
· Letzte Portalaktualisierung erfolgte um 08:00:00 GMT, 25.02.2008