Elsnet
 
   


ELSNET-list archive

Category:   E-Material
Subject:   Multi-Platform WMTrans Lemmatizer released
From:   Sandra Wendland
Email:   sandra.wendland_(on)_canoo.com
Date received:   08 Nov 2002

WMTrans Lemmatizer now available as platform-independent Java implementation Basel, November 1, 2002 - Canoo has released a platform-independent version of its WMTrans Lemmatizer software. In addition to the platform-specific shared libraries available for Linux, Canoo now offers a pure Java implementation of the Lemmatizer, which runs on any platform with Java Runtime Environment (JRE) 1.3 or higher including Windows, Linux, Solaris and others. The WMTrans Lemmatizer analyses any valid German word and returns its base form and category. For example, for the word Häuser, the Lemmatizer retrieves the base form Haus and the corresponding category N. The result of a query is a list of possible base forms followed by the corresponding category. The category can be used as a filter during analysis. Both versions can be easily integrated into customer applications: - The multi-platform Java Lemmatizer runs in any Java Runtime Environment (JRE) 1.3 or higher, providing a Java API. - The Lemmatizer for Linux is delivered as a shared library implementation and includes an API for Java and C++. WMTrans consists of a range of morphology software products to process text input. The smart text processing software is used in retrieval and language processing applications. Typical use cases include word stemming, intelligent search, text indexing, text mining, language learning, hyperlink generation, spell checking, grammar checking, and machine translation. WMTrans is based on the Canoo Morphological Dictionary, containing more than 200'000 entries and generating over 2 million fully categorized word forms, including information on word formation, all types of inflectional irregularities and spelling variants. WMTrans allows developers to integrate functions such as word stemming, spell checking, and paradigm generation into customer applications. Canoo will release a platform-independent version for all of its WMTrans products in the near future. Contact: Elisabeth Maier Canoo Engineering AG Kirschgartenstr. 7 CH-4051 Basel Tel.: +41 61 228 94 44 wmtrans-info_(on)_canoo.com http://www.canoo.com/wmtrans German Translation: WMTrans Lemmatizer jetzt als plattform-unabhängige Java-Implementierung erhältlich Basel, 1. November 2002 - Canoo hat eine plattform-unabhängige Version des WMTrans Lemmatizer veröffentlicht. Zusätzlich zu der bisher verfügbaren plattform-spezifischen Softwarebibliothek für Linux bietet Canoo nun eine reine Java-Implementierung des Lemmatizers, die auf allen Betriebssystemen wie Window, Linux, oder Solaris einsetzbar ist. Die einzige Voraussetzung ist die Installation des Java Runtime Environment (JRE) 1.3 oder höher. WMTrans Lemmatizer analysiert ein beliebiges gültiges Wort und bestimmt die zugrunde liegende Basisform.Für das Wort Häuser, gibt der Lemmatizer als Ergebnis die Grundform Haus und die entsprechende Wortkategorie N zurück.Das Resultat einer Abfrage ist jeweils eine Liste aller möglichen Grundformen und die dazugehörige Kategorie. Die Kategorie kann auch als Filter während der Analyse eingesetzt werden. Beide Softwareversionen können mühelos in Kundenapplikationen eingebunden werden: - Der Java Lemmatizer läuft auf jeder Plattform mit Java Runtime Environment 1.3 oder höher und bietet eine Java API. - Der Lemmatizer für Linux ist als Shared Library implementiert und bietet sowohl eine API für Java wie auch für C++. WMTrans besteht aus einer Reihe von Softwareprodukten für die Verarbeitung morphologischer Information. Diese Produkte werden unter anderem zur intelligenten Verarbeitung von Texteingaben verwendet. Die smarte Textverarbeitungs-Software wird in Such- und Sprachverarbeitungsanwendungen eingesetzt. Typische Anwendungsbeispiele sind Word Stemming, Intelligente Suchmaschinen, Text-Indexierung, Text-Mining, Spracherwerb, Hyperlink-Generation, Rechtschreib- und Grammatiksoftware, und maschinelle Übersetzungsprogramme. WMTrans basiert auf dem Canoo Wörterbuch, das mehr als 200 000 Einträgen enthält und über 2 Millionen klassifizierte Wortformen generiert, einschliesslich Information über Wortbildung, alle Flexionsausnahmen und Rechtschreibvarianten. WMTrans bietet Entwicklern die Möglichkeit, Funktionen wie Stemming, oder Rechtschreibprüfung in Kundenanwendungen einzubinden. Demnächst bietet Canoo eine plattform-unabhängige Version auch für weitere WMTrans Produkte. Kontakt: Elisabeth Maier Canoo Engineering AG Kirschgartenstr. 7 CH-4051 Basel Tel.: +41 61 228 94 44 wmtrans-info_(on)_canoo.com http://www.canoo.com/wmtrans --- Sandra Wendland Canoo Engineering AG Kirschgartenstrasse 7 CH-4051 Basel Tel. +41 61 228 94 66 Fax +41 61 228 94 49 mailto:sandra.wendland_(on)_canoo.com Web: http://www.canoo.com
 

[print/pda] [no frame] [navigation table] [navigation frame]     Page generated 14-02-2008 by Steven Krauwer Disclaimer / Contact ELSNET