semweb – Semantic Web and Expert Systems – Textanalyse & Linked-Data Visualisierung

Textanalyse & Linked-Data Visualisierung

En Fr

Kurzanleitung/Tutorial: [nur in der Desktop-Version] Folgen Sie der Lupe (links neben diesem Text bei maximiertem Browser.)
Vertiefung – auf Englisch: Discovering Entities #3, Demo-Video – auf Englisch: Entity Extraction of free (English) text.

Der folgende Demonstrator analysiert den Text in der Textarea, dann linkt er Substantive mit Entitäten aus dem darunterliegenden logisch verbundenen Datenraum, taggt anschliessend die Substantive und blendet für jeden markierten Substantiven die jeweiligen RDF-Records (Tripletten) ein. Dies ist der erste – und schwierigste – Schritt im ETL-Prozess /etl/. Zudem ermittelt der Demonstrator auf Wunsch im Graph „Korrelationen“ semantische Korrelationen zwischen Begriffspaaren. Der schnelle Prozess wird dank dem Dataset DBPedia2014 und einem der aktuell besten RDF Triplestores – Blazegraph™ – ermöglicht.

Legen Sie los  (Hinweise)

Demo Starten
Kurzanleitung

  1. Wählen Sie eine Textquelle in der englischen Sprache
  2. Kopieren Sie einen Textausschnitt ins Textfeld
  3. Drücken Sie auf der grossen orangenfarbenen Schaltfläche
  4. Begutachten Sie die Ergebnisse
  5. Interagieren Sie mit dem "Korrelationsgraphen"
  6. Navigieren/Interagieren Sie im "Kategorien" Entity-Graphen
  7. Navigieren/Interagieren Sie im "Korrelationen" Entity-Graphen
  8. Nutzen Sie ggf. die vorbereiteten Beispiele
Im Detail

  1. Wenn Sie keinen Englischen Text zur Hand haben, eignet sich zum Testen auch eine englische Nachrichtenquelle am Besten.
  2. Selektieren Sie Textausschnitte (max. 2500 Zeichen) und fügen Sie diese Auschnittte ins (einzige) Textfeld ein.
  3. Drücken Sie die Schaltfläche "Entitäten verbinden" und warten Sie, bis alle Ergebnisse angekommen sind - d.h., bis Sie kein drehendes Rad mehr sehen.
  4. Die RDF-Ergebnisse werden pro Entität in einem eigenen Tab visualisiert. Die Tabs können versteckt werden, falls sie zu viel Raum in Anspruch nehmen. Der Betrachtungswechsel von Entität zu Entität passiert, beim Maus-Streichen über eine Entität (orangen oder fliederfarbenen getaggtes Wort) streichen oder Wenn Sie auf einem Tab (falls sichtbar) klicken. Bitte scrollen Sie die Ergebnisse nach unten um auch Kategorien und Eigenschaften einer jeden Entität einzusehen.
  5. Der Korrelationsgraph zeigt die verbundenen Entitäten ohne die Disambiguationen. Der Button "Korrelationen ermitteln" bewirkt dass Entitäten/Kategorien paarweise analysiert und korreliert werden. Eine Korrelation kann beim Klicken auf einer Kante zwischen zwei Entitäten/Kategorien eingesehen werden. Fügen Sie weitere Kategorien aus der Korrelation dem Graphen hinzu durch Klicken auf die [+]-Schaltfläche. Verändern Sie die Sicht auf dem Graphen durch den Schieberegler oder durch Eingabe eines (Teil-)Namens für eine Entität/Kategorie.
  6. Sie navigieren im "Kategorien" Entity-Graphen in dem Sie auf den dargestellten Konzepten (Kreisen) doppelklicken - diese expandieren. Nach der Expansion eines Konzeptes werden das Konzept zentriert und die neuen Knozepten graphisch entflochten. Der Namen eines expandierten Konzeptes erscheint mit der Anzahl expandierter Kontepte in Klammern. Orangenfarbene Knoten stellen Kategorien, weisse Knoten Entitäten dar. Zoomen Sie im Graphen mit dem Mausrad, wenn die Maus sich über dem Graphen befindet; verschieben Sie die Knoten durch Ziehen eines einzelnen Knotens; verschieben Sie den ganzen Graphen durch Ziehen auf einer weissen Fläche im Graphen. Entitäten können durch Einfachklick in einen neuen Tab dargestellt werden.
  7. Der "Korrelationen" Entity-Graph zeigt den Fokusbegriff in der Mitte mit (hypothetischen) Verbindungen (Korrelationen) mit jeder der verbundenen Entitäten. Alle Knoten sind zunächst in Blau. Untersuchen Sie eine hypothetischen Verbindung zweier Entitäten mit einem Doppelklick auf einer Kante. Das Ergebnis (Gemeinsame und Begriffseigene Kategorien) wird diese Verbindung ersetzen. Navigieren/Interagieren Sie wie im "Kategorien" Graph. Anmerkung: Wenn Sie eine Korrelation zwischen einem Zentralbegriff und einem noch nicht sichtbaren Begriff untersuchen lassen wollen, öffnen Sie den Begriff vorerst mit einem Klick auf dem fehlendem Knoten; dieser Begriff wird den hypothetischen Begriffen automatisch hinzugefügt.
  8. Beispiel von passenden Nachrichtenquellen: astronomy.com/news oder nytimes.com

    Oder versuchen Sie es bitte mit dem folgenden Text:

    A UBC astronomer from San Diego and a Canadian space telescope played pivotal roles in the discovery of a new planet a Super-Earth found orbiting a sun well beyond our solar system. Prof. Jaymie Matthews said researchers first spotted clues to the planet, orbiting a star 180 light years away, in a speck of data produced by NASA's Kepler space telescope. But before they could confirm it, the Kepler satellite had moved on from tracking that part of the sky and could not go back.

    Joseph Mallord William Turner 23 April 1775 19 December 1851 was an English Romantic landscape painter, watercolourist and printmaker, whose style can be said to have laid the foundation for Impressionism. Although Turner was considered a controversial figure in his day, he is now regarded as the artist who elevated landscape painting to an eminence rivalling history painting.

    In 1700 the Spanish line of Habsburgs was extinguished with the death of Charles II. After his death, the War of the Spanish Succession began in 1701 with the occupation of all Spanish possessions by French troops backing the claim of the French Philippe of Anjou to the Spanish throne. In 1706, the French were defeated in Ramillies and Turin and were forced to yield northern Italy to the Austrian Habsburgs. In 1713, the Treaty of Utrecht formally confirmed Austrian sovereignty over most of Spain's Italian possessions including Lombardy and its capital, Milan.