Software
Als Hobby-Programmierer bemühe ich mich, für die alltägliche (auch wissenschaftliche) Arbeit kleinere Tools herzustellen. Die Nutzung der nachfolgenden Freeware ist kostenlos; für eine Rückmeldung, Kritik und Anregungen bin ich immer offen und dankbar!
Hinweis: Für den Gebrauch der hier zum Download angebotenen Tools gelten die Bestimmungen der Creative Commons Licence . Ferner übernehme ich keinerlei Haftung für etwaige Folgeschäden; die Nutzung erfolgt auf eigene Gefahr.
Corpustransfer v1.3 alpha
Corpustransfer ist ein kleines, aber wirksames tool, um Korpora automatisch zu lemmatisieren und/oder zu Wortart-taggen. Dabei wird im Hintergrund auf TreeTagger (Helmut Schmid, Stuttgart) zuückgegriffen, dessen Listenergebnisse ausgewertet und nach verschiedenen Filteroptionen wieder zu Volltext-Korpora transformiert. Damit wird es möglich, auch mit Analysetools, die keine Annotationen berücksichtigen, dennoch grammatische Analysen i.w.S. durchzuführen (z.B. Wortartfrequenzen, Konkordanzabfragen zu spezifischen Wortart-Mustern, automatische Herausfilterung von bestimmen Wortarten aus Texten uäm.).
Für die Installation sind TreeTagger (inkl. aller dafür notwendigen Dateien) sowie eine Perl-Installation Voraussetzung.
Screenshots
Download
Die aktuelle Version von Corpustransfer (v1.3) kann hier als ZIP-File und unter den Bedingungen der Creative Commons Licence heruntergeladen werden; Zip einfach in einen Ordner entpacken.
Bugreport
Es wurden bereits von ersten Bugs berichtet, an deren Lösung noch gearbeitet wird. Folgende Bugs sind bekannt und lassen sich teilweise leicht umgehen:
- Description wird nicht angezeigt. (11.02.2010)
>> siehe statt dessen die Dokumentation zu TreeTagger (Helmut Schmid, Stuttgart).
SmulDiCart v1.3 beta
Small multi-purpose pliers of Discours Cartography
SmulDiCart (ver. 1.3, beta) ist ein kleines Tool (Freeware), das die (diskurs)linguistische Arbeit unterstützen soll. Es stellt keine neuen korpuslinguistischen Berechnungsalgorithmen zur Verfügung, sondern verbindet vielmehr synergetisch die Stärken bestehender Freeware aus dem Bereich Korpuslinguistik (TreeTagger, AntConc) und Visualisierungstechniken (GraphViz). SmulDiCart greift dabei auf die Funktionen externer Software zurück und bereitet deren Ergebnisse weiter auf, um so die jeweiligen Funktionsbeschränkungen der einzelnen Tools zweckorientiert zu kompensieren. Im Ergebnis lassen sich - ausgehend von extern generierten Keywordlisten und Kookkurrenzprofilen mittels AntConc - große thematische Korpora nach Wortarten taggen, netzartig miteinander verbinden und als Diskurskarten für die weitere (linguistische) Analyse in Bild und Text exportieren.
Funktionsbereich
- Vereinfachtes Taggen von Texten mit Hilfe von TreeTagger (Stuttgart);
- Vereinfachte Weiterverarbeitung von aus AntConc (Laurence Anthony) exportierten Keyword- und Kookkurrenzpartnerlisten;
- Wortarten-separierte Auswertung, automatisierte Zusammenführung von Keyword- und Kookkurrenzpartnerlisten sowie hierarchische, anpasspare Ausgabe;
- Vereinfachte Visualisierung hierarchisch zusammengefasster Keyword- und Kookkurrenzpartnerlisten mit Hilfe von GraphViz (http://www.graphviz.org) und damit
- Unterstützung bei diskurskartografischen Arbeiten.
Screenshots
Download
- Die aktuelle Version von SmulDiCart kann hier als Setup-File und unter den Bedingungen der Creative Commons Licence heruntergeladen werden; einfache und automatische Installation durch Start der Setup-Datei.
- Ältere Versionen
Textkey v1401
TextKey (2009) ist ein kleines Tool, um die Zusammenstellung individueller Text-Korpora zu
erleichtern. Mit Hilfe von globalen Hotkeys (Vordefinierten Tastenkombinationen) können
markierte Textteile in anderen Programmfenstern (z.B. im Internetexplorer) direkt in TextKey
kopiert und vorgetagt werden. Die Auszeichnung der verschiedenen Textteile erlaubt
anschließend eine automatische Aufnahme in Datenbanken oder sonstige Weiterverarbeitungen.
Funktionsbreich der Registerkarten:
- Textview: Textansicht, in die Textteile automatisch eingefügt werden.
- Delete Tags: Bereits getaggte Textdateien können von ihren Auszeichnungen bereinigt werden.
- TEXTtoXML: Getaggte Textdateien können in XML umgewandelt und damit in Datenbanken importiert werden (Getestet: Access 2007).
- Controls: Voreinstellungen für das automatische Einfügen von Textteilen.
- About: Versionsangaben und Lizenzbestimmungen.
Screenshots
Download
- Die aktuelle Version von Textkey kann hier als ZIP-File und unter den Bedingungen der Creative Commons Licence heruntergeladen werden; einfach entpacken und Textkey starten (keine Installation nötig).
- Ältere Versionen
Vorherige Seite: Fetisch Humboldt
Next page: Hinweise für Studierende







