Textsortenbestimmung glosse Muster

Beispiel 1.6 (code_suffix_pos_tag.py): Abbildung 1.6: Ein Sprachklassifier, dessen Feature-Detektor den Kontext untersucht, in dem ein Wort erscheint, um zu bestimmen, welcher Teil des Sprach-Tags zugewiesen werden soll. Insbesondere wird die Identität des vorherigen Wortes als Feature eingeschlossen. Die Erkennung einer textuellen Entgleisung (RTE) ist die Aufgabe zu bestimmen, ob ein bestimmter Text T einen anderen Text beinhaltet, der als “Hypothese” bezeichnet wird (wie bereits in 5 erörtert). Bisher gab es vier RTE-Herausforderungen, bei denen konkurrierenden Teams gemeinsame Entwicklungs- und Testdaten zur Verfügung gestellt wurden. Hier sind einige Beispiele für Text-/Hypothesenpaare aus dem Challenge 3-Entwicklungsdatensatz. Die Bezeichnung True gibt an, dass die Entgleisung enthält, und False, dass sie nicht hält. Hier wird jedes Lezgian Morpheme mit Bindestrichen abgesetzt und separat beschönigt. Da viele von ihnen im Englischen schwer zu glänzen sind, werden die Wurzeln übersetzt, aber die grammatikalischen Suffixe werden mit grammatischen Abkürzungen aus drei Buchstaben beschönigt. Dieser “Inline”-Stil ermöglicht es, Beispiele in den Textfluss aufzunehmen und die Wortreihenfolge der Zielsprache in einer Reihenfolge zu schreiben, die der Syntax der Zielsprache annähert. (Im Glanz wird mache es aus der entsprechenden Quellreihenfolge neu geordnet, um die deutsche Syntax natürlicher anzunähern.) Dennoch erfordert dieser Ansatz, dass die Leser die Übereinstimmungen zwischen Quell- und Zielformularen “neu ausrichten”.

Die Buchführung ist ein Bereich, der in letzter Zeit ein größeres Interesse an qualitativen Methoden gesehen hat; in der Tat wurde vor kurzem eine Zeitschrift zu diesem Ansatz (Qualitative Research in Accounting & Management) ins Leben gerufen. Ferguson (2007) zufolge kann die Untersuchung des Textes begrenzt werden, wenn es sich nicht mit den Umständen seiner Produktion und Interpretation auseinandersetzt. ” … Die Vorstellungen von Wahl und Effizienz haben eine offensichtliche Anziehungskraft, aber die dargestellte Sprache verschleiert eine viel komplexere Situation, in der Wahlmöglichkeiten und Effizienz durch die Anwendung von Marktprinzipien zu gewährleisten sind, und angesichts dieser Entwicklung ist es keineswegs sicher, dass diese Ziele erreicht werden. Zum Beispiel werden verschiedene Produzenten und Verbraucher in diesem Marktkontext privilegiert, und es ist keineswegs sicher, dass alle eine Wahl haben werden. Wahrscheinlicher ist, dass sich die Wahl auf die wohlhabenderen beschränkt, während effizienz durch das Versäumnis, gleiche Wettbewerbsbedingungen zwischen nicht gewinnbringenden und privaten Anbietern zu schaffen, bewirkt werden kann” (Cheng, 2009; S. 364). Die in diesem Kapitel beschriebenen Klassifizierungstechniken können auf eine Vielzahl von Problemen angewendet werden. Beispielsweise (Agirre & Edmonds, 2007) verwendet Klassifikatoren, um Wort-Sinn-Disambiguation durchzuführen; und (Melamed, 2001) verwendet Klassifikatoren, um parallele Texte zu erstellen.

Share This: